跳转到主要内容

用于操作PDF页码和标签的Python库。

项目描述

pagelabels python库

这是一个基于 pdfrw 的小型库,帮助在Python中操作PDF页标签。它可以解析PDF中的页标签,编辑页标签,并将它们写入PDF。

有关页标签的更多信息,请参阅:https://www.w3.org/TR/WCAG20-TECHS/PDF17.html

PageLabels

继承自列表,表示一个 PageLabelScheme 列表。

PageLabels.from_pdf(pdfrwobj)

静态方法。从PdfReader对象中读取页标签。

.write(pdfrwobj)

将页标签写入PdfReader对象。

PageLabelScheme

继承自命名元组,包含以下字段

  • startpage : 根据此方案开始编号页面的PDF中的索引
  • style : 字符串 arabicroman uppercaseletters uppercaseroman lowercaseletters lowercase 之一
  • prefix : 附加到所有页标签前的字符串
  • firstpagenum : 索引的起始位置

示例

from pdfrw import PdfReader, PdfWriter

from pagelabels import PageLabels, PageLabelScheme

reader = PdfReader("input.pdf")
labels = PageLabels.from_pdf(reader)
newlabel = PageLabelScheme(startpage=3, # the index of the page of the PDF where the labels will start
                           style="roman", # See options in PageLabelScheme.styles()
                           prefix="Appendix ",
                           firstpagenum=1) # number to attribute to the first page of this index
labels.append(newlabel) # Adding our page labels to the existing ones
labels.write(reader)
writer = PdfWriter()
writer.trailer = reader
writer.write("output.pdf")

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

pagelabels-1.2.1.tar.gz (18.4 kB 查看哈希值)

上传时间 源代码

构建分发

pagelabels-1.2.1-py3-none-any.whl (17.6 kB 查看哈希值)

上传时间 Python 3

由以下支持