通过得到的标签提取出SRC,得到图片地址,下载图片。 (3).提取元信息exif 将图片通过相应的库实现exif信息的提取,对exif进行遍历,存储到字典变量中。 其中要判断是否存在exif信息(有些不能提取),是否存在GPSInfo信息(有些压缩时 该信息失去,或本来就没有),若是不符合的,删除该图片。 (4).删除图片 利用os的remove...
专门用来提取pdf里的表格的,支持导出csv.,excel文件 提取出来一个页面如果有两个表格会放到一个list里,每个表格一个元素。一个表格一个dataframe结构的文件,所以需要配合pandas模块使用。 二 练习项目介绍 好久之前写了,一些细节忘记了,不过当时注释的很清楚直接上代码,也是怕哪天电脑突然死机代码没了。。。换个地儿...