爬取携程网(https://hotels.ctrip.com/)酒店的用户评价数据,具体来讲就是要爬取【上海静安香格里拉大酒店】的评价中,出行类型为【家庭亲子】的用户的评价数据。 评价数据包括:昵称,房型,入住日期,评价日期,评分,评价内容。 要求很简单不是嘛,数据量也不是很大(我看了一下,也才 910 条评价,后来爬取完成之后发...
酒店不只爬一家了,要爬就爬取【北京市】的所有【四星级以上】的酒店。 评价数据也不止爬【家庭亲子】类型了,要爬就爬所有的评价数据。 二、分析目标网站 这里我发现新手在这里一般都有一个共有的误区,就是他们觉得爬虫都是 “通用” 的,一个网站的爬虫拿过来,网址改一下,再随便撺吧撺吧就可以爬另一个网站...