path=r'C:\Users\xxx'pdf_reader=PdfFileReader(path+'\INV1.pdf')forpageinrange(pdf_reader.getNumPages()):# 遍历到每一页挨个生成写入器 pdf_writer=PdfFileWriter()pdf_writer.addPage(pdf_reader.getPage(page))# 写入器被添加一页后立即输出产生pdfwithopen(path+'\INV1-{}.pdf'.format(page+1...
watermark = PdfReader("files/mark.pdf") # 待加水印的pdf reader = PdfReader("files/test.pdf") page = reader.pages[0] # watermark.pdf的第一页作为水印 page.merge_page(watermark.pages[0]) writer = PdfWriter() writer.add_page(page) # 保存成新的pdf with open("output.pdf", "wb") as...
with open("test_encrypted.pdf", "wb") as f: writer.write(f) 运行代码后,生成一个新的加密文件,点击查看时,会提示需要输入密码,如下: 文件解密 当我们要查看加密文件的内容时,可以使用这个功能,我们就以上面加密生成的文件为例,对加密文件进行解密,代码如下: from PyPDF2 import PdfReader, PdfWriter # ...
from PyPDF2 import PdfFileReader# # pdf 文档pdf_path = "D:/Data/自动化办公/PDF/Seige_of_Vicksburg_Sample_OCR.pdf"with open(pdf_path,'rb') as f: pdf = PdfFileReader(f) infomation = pdf.getDocumentInfo() number_of_pages = pdf.getNumPages() txt = f'''{pdf_path} in...
使用Python完成简单的PDF文件处理操作,如PDF文件的批量合并、拆分、加密以及添加水印等。 1. 批量合并PDF文件 from pathlib import Path # PdfFileReader用于读取PDF文件,PdfFileMerger用于合并PDF文件 from PyPDF2 import PdfFileReader, PdfFileMerger src_folder = Path('PDF1') # 设置要合并的多个PDF文件所在的文...
path=r'C:\xxx'# 这里填写目标PDF所在的路径 pdf_reader=PdfFileReader(path+r'\test.pdf')pdf_writer=PdfFileWriter()forpageinrange(pdf_reader.getNumPages()):pdf_writer.addPage(pdf_reader.getPage(page))pdf_writer.encrypt('a123')# 设置密码为 a123withopen(path+r'\test.pdf','wb')asout:pdf...
步骤一:从网页上下载PDF文件到本地 首先,我们需要使用Python的requests库来从网页上下载PDF文件到本地。下面是相应的代码: AI检测代码解析 importrequests# 下载PDF文件url=' response=requests.get(url)withopen('example.pdf','wb')asf:f.write(response.content) ...
读取csv、txt其他文本:直接open,read() defread_txt_to_text(file_path): withopen(file_path,'r')asf: text = f.read() returntext read_txt_to_text('xxx.csv') read_txt_to_text('xxx.txt') 读取任何文件格式 support = { 'pdf':'read_pdf_to_text', ...
一、pdf基本操作 fromPyPDF2importPdfFileReader, PdfFileWriterdefextract_information(pdf_path): with open(pdf_path,'rb') as fp: pdf=PdfFileReader(fp) information=pdf.getDocumentInfo()returninformationdefrotate_page(pdf_path): pdf_reader=PdfFileReader(pdf_path)#瞬时间旋转90度page1 =pdf_reader.get...
withopen('rotate_pages.pdf','wb')asfh: pdf_writer.write(fh) if__name__=='__main__': path='新路径.pdf' rotate_pages(path) 上面除了pdfileReader之外,还导入了pdfileWriter,因为我们需要编写一个新的pdf。rotate_pages()获取要修改的PDF的路径。在这个函数...