读取本地的HTML文件使用parse()方法 from lxml import etree html=etree.parse(r"文件路径") result=etree.tostring(html,pretty_print=True) 3.解析在线请求回来的HTML源码 使用requests获取HTML源码后, html=etree.HTML(res.text) result = etree.tostring(html).decode() #实现对其的解析 再次提醒:使用.xpath(...
print(dynamic) def profile(self, html): selector = etree.HTML(html) name = selector.xpath('//input[@id="user_profile_name"]/@value')[0] email = selector.xpath('//select[@id="user_profile_email"]/option[@value!=""]/text()') print(name, email)在这里,我们仍然使用 XPath 对信息...