1.puppeteer大量使用async/await来实现同步代码,这样方便大家理解,但是爬取速度上有问题,没有发挥javascript异步的优势 2.程序中puppeteer仅仅打开了一个页面来进行爬取,可以预先打开多个页面来进行多页面爬取。 本文将就此两个问题给出具体的优化方案 优化说明 1.优化版的流程中加入了页面缓存,也就是提前使用puppeteer...