接着,右键点击检查进入开发者模式,开始对网页进行分析。 一页有20行数据,放在tbody标签中,只需遍历提取每一个tr标签即可 CSS_SELECTOR路径如下: '#jztable > table > tbody > tr' 1. 紧接着,分析每一条tr标签的数据 提取比较简单, found_list['净值日期'] = item.find('td:nth-child(1)').text() ...
首先要注册一个账号密码,通过账号密码登录,并且滑块验证,自动输入搜索关键词,进行跳转翻页爬取数据,并保存到Excel文件中。 代码运行时,滑块验证经常不通过,被吃掉,但是发现打包成exe运行没有这个问题,100%成功登录。如果大家知道这个问题麻烦请与我分享,谢谢! 废话不多说直接上代码 # coding=utf-8 from selenium imp...