进入http://shili.skycaiji.com/novel/index/show/id/1.html分析出章节网址规则:novel/chapter/show/id/\d+\.html 这时就可以将规则填入“内容页网址获取»结果网址过滤»必须包含”中,保存后再测试: 成功抓取到所有章节链接: 接下来就是抓取章节的标题、正文了,点击上图的分析,即可直接在页面中点击元素获取...
以http://shili.skycaiji.com/info.html为例,基本上所有数据都在该列表中,所以无需进入内容页采集,直接将起始页设置为内容页网址 保存后点击“底部测试按钮»测试分析网页”进入分析界面 列表数据都有一定的格式规律,我们先匹配出每一条数据的包裹层,点击图片元素,然后使用“底部控制台”中的父元素来调出包裹层 ...