一个用于数据提取、分析、转换和操作PDF(及其他)文档的高性能Python库。
项目描述
PyMuPDF
PyMuPDF 是一个用于数据提取、分析、转换和操作 PDF(及其他)文档 的高性能 Python 库。
社区
加入我们,在 Discord 上: #pymupdf
安装
PyMuPDF 需要 Python 3.8 或更高版本,使用 pip 进行安装
pip安装PyMuPDF
没有强制性的外部依赖项。但是,一些 可选功能 只有在安装了额外的包后才能使用。
您也可以通过访问 PyMuPDF.io 来尝试不安装。
用法
基本用法如下
import pymupdf # imports the pymupdf library
doc = pymupdf.open("example.pdf") # open a document
for page in doc: # iterate the document pages
text = page.get_text() # get plain text encoded as UTF-8
文档
完整文档可以在 pymupdf.readthedocs.io 上找到。
可选功能
- fontTools 用于创建字体子集。
- pymupdf-fonts 包含一些用于文本输出的优质字体。
- Tesseract-OCR 用于图像和文档页面的光学字符识别。
关于
PyMuPDF 为轻量级的 PDF、XPS 和 eBook 查看器、渲染器和工具包 MuPDF 添加了 Python 绑定和抽象。Both PyMuPDF 和 MuPDF 由 Artifex Software, Inc 维护和开发。
PyMuPDF 最初由 Jorj X. McKie 编写。
许可证和版权
PyMuPDF 可在 开源 AGPL 和商业许可协议下使用。如果您确定无法满足 AGPL 的要求,请联系 Artifex 获取有关商业许可的更多信息。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分布
PyMuPDF-1.24.11.tar.gz (51.2 MB 查看哈希值)
构建分布
PyMuPDF-1.24.11-cp38-abi3-win_amd64.whl (16.0 MB 查看哈希值)
PyMuPDF-1.24.11-cp38-abi3-win32.whl (14.7 MB 查看哈希值)
关闭
PyMuPDF-1.24.11.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6e45e57f14ac902029d4aacf07684958d0e58c769f47d9045b2048d0a3d20155 |
|
MD5 | d53ecd74044fa614805f4af8561af4f0 |
|
BLAKE2b-256 | d4a33edbb6be649e311107b320141cae0353d4cc9c6593eba7691f16c53c9c71 |
关闭
PyMuPDF-1.24.11-cp38-abi3-win_amd64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 745ce77532702d6ddeeecb47306d3669629aa5ff82708318cd652881f493b0ba |
|
MD5 | 69972669eb84f06146e02686ea84a896 |
|
BLAKE2b-256 | f60399895f003d7ff59c83d524aeccecff4e1ee1f39a7724f88acfda4f67b8bc |
关闭
PyMuPDF-1.24.11-cp38-abi3-win32.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6fda6c7ed7e6ad74d9cfac5c3837ef42efd58c506440e2513a0a200bc3c4dbc0 |
|
MD5 | 7350f5dbf39137ebcd3362221d758bdd |
|
BLAKE2b-256 | 286ba0247598f06585d84ae9927d6ed191d89d38686ad6bf0dadc0ed699a77e7 |
关闭
PyMuPDF-1.24.11-cp38-abi3-musllinux_1_2_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9b7ac5b8ec3daec17f2e830962ed091610e576a5e531d2fe28c437fbd69b1969 |
|
MD5 | c65053e855341eb5927b773a1286b393 |
|
BLAKE2b-256 | 6a929ff020892560f80433876ec904c0f2669d1d69403adf412565e54a946615 |
关闭
PyMuPDF-1.24.11-cp38-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 2efb793644df99db0fe2468149048175cf25c5803997828efc9152aca838f5f2 |
|
MD5 | 6bca90bade44d2c5171bba9f07223775 |
|
BLAKE2b-256 | ca21ad66778ad2485f87ef1d5a36f17ec8d4aee8ce247c8e46c673eff776a877 |
关闭
PyMuPDF-1.24.11-cp38-abi3-manylinux2014_aarch64.manylinux_2_17_aarch64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 32fd013e3c844f105c0a6a43ee82acc7cd0c900f6ff14f5eed9492840bbcbdd9 |
|
MD5 | 7b71f4ec21fb50c9464a6d1a3a17ecbc |
|
BLAKE2b-256 | 553d84bd559129d2ff07267baae0bde0c6f4f49232408b547971f7a2e1534cb9 |
关闭
PyMuPDF-1.24.11-cp38-abi3-macosx_11_0_arm64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 20c8eb65b855a33411246d6697a3f3166727fe2d8585753cf0db648730104be6 |
|
MD5 | dfb2d7ba0fb30dc29193ac3418c75612 |
|
BLAKE2b-256 | 16f88396ca7218622cb3600c919b320a24f05b7c14bd81eea03f3f2182844a06 |
关闭
PyMuPDF-1.24.11-cp38-abi3-macosx_10_9_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 24c35ba9e731027ff24566b90d4986e9aac75e1ce47589b25de51e3c687ddb73 |
|
MD5 | 436663b712e83e38635c53fb79fb59ff |
|
BLAKE2b-256 | f575b059d603530d99926de2b6a64314f3534e2149ee5496142de550c66907ac |