getXmpMetadata() 从 PDF 文档根目录中检索 XMP 数据 isEncrypted 显示 PDF 文件是否加密的只读布尔属性 namedDestinations 访问该getNamedDestinations()函数的只读属性 PDF 读取操作: # encoding:utf-8 from PyPDF2 import PdfFileReader, PdfFileWriter readFile = 'C:/Users/Administrator/Desktop/RxJava 完全解析...
PyPDF2 import PdfFileReader, PdfFileWriter readFile = 'C:/Users/Administrator/Desktop/RxJava 完全解析.pdf' # 获取 PdfFileReader 对象 pdfFileReader = PdfFileReader(readFile) # 或者这个方式:pdfFileReader = PdfFileReader(open(readFile, 'rb')) # 获取 PDF 文件的文档信息 documentInfo = pdf...
在https://pypi.org/project/PyPDF2/ 中搜索PyPDF2 1.26.0可以安装包。 2.2 在Linux安装压缩包命令如下: 1 2 3 4 5 cd /data && tar -xvf PyPDF2-1.26.0.tar.gz cd PyPDF2-1.26.0 python setup.py install 2.3 直接安装 1 pip install pypdf2 2.4 PyPDF的官方文档:https://pythonhosted.org/P...
getXmpMetadata() 从 PDF 文档根目录中检索 XMP 数据 isEncrypted 显示 PDF 文件是否加密的只读布尔属性 namedDestinations 访问该getNamedDestinations()函数的只读属性 PDF 读取操作: # encoding:utf-8 from PyPDF2 import PdfFileReader, PdfFileWriter readFile = 'C:/Users/Administrator/Desktop/RxJava 完全解析...
readFile ='C:/Users/Administrator/Desktop/RxJava 完全解析.pdf'# 获取 PdfFileReader 对象 pdfFileReader =PdfFileReader(readFile) # 或者这个方式:pdfFileReader =PdfFileReader(open(readFile,'rb')) # 获取 PDF 文件的文档信息 documentInfo = pdfFileReader.getDocumentInfo()print('documentInfo = %s'% do...
也可以从内存数据打开文档,或创建新的空PDF。您还可以将文档用作上下文管理器。 3. Document的方法和属性 示例: >>> doc.count_page 1 >>> doc.metadata {'format': 'PDF 1.7', 'title': '', 'author': '', 'subject': '', 'keywords': '', ...
pdf网址 #url='http://static.cninfo.com.cn/finalpage/2020-08-28/1208280699.PDF' #pdf_outputfile:存储pdf的位置 #pdf_outputfile='/Users/dirk/metadata.pdf' #xlsx_output_file输出所需表格的文件路径 #xlsx_output_file='/Users/dirk/' #本程序需要确保pdf所需的表格样式在统一索引位置,此处为方便截...
getXmpMetadata() 从PDF文档跟目录中检索XMP(可扩展元数据平台)数据。 返回:XmpInformation 可用于从文档访问XMP元数据的实例 返回类型:XmpInformation或者None如果在文档根目录中未找到元数据。 isEncrypted 只读布尔属性,显示此PDF文件是否已加密。请注意,即使decrypt()调用该方法,此属性(如果为true)仍将保持为true ...
也可以从内存数据打开文档,或创建新的空PDF。您还可以将文档用作上下文管理器。 3. Document的方法和属性 示例: >>> doc.count_page 1 >>> doc.metadata{'format': 'PDF 1.7', 'title': '', 'author': '', 'subject': '', 'keywords': '', ...
|方法/属性|描述 |--- |Document.page_count|页数 (int) |Document.metadata|元数据 (dict) |Document.get_toc|获取目录 (list) |Document.load_page|读取页面 示例: >>> doc.count_page 1 >>> doc.metadata {<!-- -->'format': 'PDF 1.7', 'title': '', 'author'...