htmlfill: 这个库实际上使用了HTMLParser,不过在解析的时候把解析后的结果稍微结构化了一下。 Genshi: 三样都干。 xml.dom.minidom: 对象化的库,可以把html5lib的解析结果作为输入。这个是python内置的库,但是,相信本座,不用它为好。 在实际做的时候,本座重点考察了lxml,因为它是基于c的libxml2库的,想必速度...