除了遵循技术上的差异外,在功能上等效于 Page.get_drawings(),但速度更快: 每种路径类型仅包含相关的键,例如:笔画路径没有 "fill" 颜色键。参见方法 Page.get_drawings() 的注释。 坐标以 point_like、rect_like 和quad_like 的元组 形式给出 — 而不是作为 Point、Rect、Quad 对象。 如果性能是一个问题...
Describe the bug PyMuPDF's get_drawings() does not grab the layer information from pages generated using show_pdf_page with an oc arguments. To Reproduce Generate a PDF document containing layers using doc.show_pdf_page(..., oc="blah") f...
import pymupdf doc = pymupdf.open("some.file") page = doc[0] paths = page.get_drawings() # extract existing drawings # this is a list of "paths", which can directly be drawn again using Shape # --- # # define some output page with the same dimensions outpdf = pymupdf.open() ou...
修复#1971:在使用get_drawings()时发生分段错误。 修复#1946:在get_text()文档中,block_no和block_type被错误地交换。 修复#2013:在删除小部件时出现 AttributeError: ‘Widget’ object has no attribute ‘_annot’。 核心代码的其他更改: 修复了各种编译器警告和序列点错误。 增加了对 Memento 构建的支持。
该方法遍历Page.get_drawings()的输出,并结合其path["rect"]与某些容差值接近的路径(在参数中给出)。结果是一个列表,每个都包含类似表格(具有网格线)、饼图、柱状图等的矩形。参数:clip (rect_like)– 只考虑该区域内的路径。默认为整个页面。 drawings (list)– (可选)提供先前生成的Page.get_drawings()的...
get_drawings() for i, p in enumerate(paths): rect = p["rect"] # best check for emptiness already here! text = page.get_textbox(rect) if text: pix = page.get_pixmap(clip=rect) if pymupdf.IRect(pix.irect).is_empty: print(i, "pixmap has empty area - skipping") continue print...
* **Changed** :meth:`Page.get_drawings`, :meth:`Page.get_cdrawings` to return an indicator on the area orientation covered by a rectangle. This implements `#1355 <https://github.com/pymupdf/PyMuPDF/issues/1355>`_. Also, the recognition rate for rectangles and quads has been significantly...
从版本 1.18.11 开始,一些文本和图像提取方法返回图像变换矩阵:Page.get_text()和Page.get_image_bbox()。 变换矩阵包含关于图像如何转换以适应某文档页面上的矩形(其“边界框”=“bbox”)的信息。通过检查页面上图像的 bbox 和此矩阵,可以确定例如图像是否以缩放或旋转的方式显示在页面上。
该方法遍历Page.get_drawings()的输出,并连接那些path["rect"]彼此之间距离小于某个容差值(给定在参数中)的路径。结果是一个矩形列表,每个矩形包裹着诸如带有网格线的表格、饼图、柱状图等东西。 参数: clip (rect_like)– 仅考虑此区域内的路径。默认为整页。 drawings (list)– (可选)提供先前生成的Page....
cluster_drawings(clip=None, drawings=None, x_tolerance=3, y_tolerance=3) 根据它们的几何邻近性对集群矢量图形(同义词为线框图或绘图)进行聚类。该方法遍历Page.get_drawings()的输出,并连接那些 path["rect"] 之间距离小于某些容差值的路径。结果是一系列矩形,每个矩形都包围着像表格(带有网格线)、饼图、...