htmldownloader: 根据url将页面上的数据下载下来 html_parser: 根据下载下来的数据,来解析出我们需要的平均薪资,并且排除掉一些常见的培训机构 html_outter: 将最后统计的结果输出成html页面 spider_main: 入口,并负责启动各个页面 流程 spider_main来初始化所有的模块 => 从url_manager中取出一个url => 将url交给h...
elif("万/年" in dic['薪资']): value = dic['薪资'].split('万')[0] value = value.split('-') a = float(value[0]) * 10000/12 b = float(value[1]) * 10000/12 total += (a + b) / 2 elif("元/天" in dic['薪资']): value = dic['薪资'].split('元')[0] a = flo...