首先我们需要引入我们要用的包,这里我们使用了python里面自带的包 urllib.request是python操作url的包,re是python正则表达式的包首先我们写一个获取网页源代码的函数 然后我们就要写一个提取出网页源代码的超链接的函数 接下来我们就可以测试一下了 我们就可以去看看url.txt里面的东西了 我们发现里面有很多不是url,那个...