跳转到主要内容

一个用于数据提取、分析、转换和操作PDF(及其他)文档的高性能Python库。

项目描述

PyMuPDF

PyMuPDF 是一个用于数据提取、分析、转换和操作 PDF(及其他)文档 的高性能 Python 库。

社区

加入我们,在 Discord 上: #pymupdf

安装

PyMuPDF 需要 Python 3.8 或更高版本,使用 pip 进行安装

pip安装PyMuPDF

没有强制性的外部依赖项。但是,一些 可选功能 只有在安装了额外的包后才能使用。

您也可以通过访问 PyMuPDF.io 来尝试不安装。

用法

基本用法如下

import pymupdf # imports the pymupdf library
doc = pymupdf.open("example.pdf") # open a document
for page in doc: # iterate the document pages
  text = page.get_text() # get plain text encoded as UTF-8

文档

完整文档可以在 pymupdf.readthedocs.io 上找到。

可选功能

关于

PyMuPDF 为轻量级的 PDFXPSeBook 查看器、渲染器和工具包 MuPDF 添加了 Python 绑定和抽象。Both PyMuPDFMuPDFArtifex Software, Inc 维护和开发。

PyMuPDF 最初由 Jorj X. McKie 编写。

许可证和版权

PyMuPDF 可在 开源 AGPL 和商业许可协议下使用。如果您确定无法满足 AGPL 的要求,请联系 Artifex 获取有关商业许可的更多信息。

项目详情


发布历史 发布通知 | RSS 源

下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

PyMuPDF-1.24.11.tar.gz (51.2 MB 查看哈希值)

上传时间

构建分布

PyMuPDF-1.24.11-cp38-abi3-win_amd64.whl (16.0 MB 查看哈希值)

上传时间 CPython 3.8+ Windows x86-64

PyMuPDF-1.24.11-cp38-abi3-win32.whl (14.7 MB 查看哈希值)

上传时间 CPython 3.8+ Windows x86

PyMuPDF-1.24.11-cp38-abi3-musllinux_1_2_x86_64.whl (20.7 MB 查看哈希值)

上传时间 CPython 3.8+ musllinux: musl 1.2+ x86-64

PyMuPDF-1.24.11-cp38-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (19.6 MB 查看哈希值)

上传时间 CPython 3.8+ manylinux: glibc 2.17+ x86-64

PyMuPDF-1.24.11-cp38-abi3-manylinux2014_aarch64.manylinux_2_17_aarch64.whl (19.0 MB 查看哈希值)

上传时间 CPython 3.8+ manylinux: glibc 2.17+ ARM64

PyMuPDF-1.24.11-cp38-abi3-macosx_11_0_arm64.whl (18.2 MB 查看哈希值)

上传时间 CPython 3.8+ macOS 11.0+ ARM64

PyMuPDF-1.24.11-cp38-abi3-macosx_10_9_x86_64.whl (18.9 MB 查看哈希值)

上传时间 CPython 3.8+ macOS 10.9+ x86-64

由以下组织支持