从mediawiki标记生成pdf文件
项目描述
概述
mwlib.rl提供了一个库,可以从通过mwlib库解析的mediawiki文章中生成pdf文档。
安装
请阅读http://mwlib.readthedocs.org/en/latest/installation.html以获取安装说明。
PDF自定义
通过添加自定义配置文件,可以自定义生成的PDF。该文件需要命名为customconfig.py,并位于您的PYTHONPATH中。基本上,您可以使用自定义配置覆盖pdfstyles.py文件中的任何内容。任何更改都需要谨慎进行,以免破坏东西!请检查pdfstyles.py文件以获取更多信息。
还可以检查customnodetransformer.py文件以获取更多自定义选项。
字体配置
字体配置可以在 fontconfig.py 中更改。为了使默认配置正常工作,需要安装一些字体。如果没有安装这些字体,将使用必要的内置 Adobe 字体。
需要安装以下字体:AR PL UMing HK、Ezra SIL、Nazli、UnBatang、Arundina Serif、Lohit Telugu、Sarai、Lohit Punjabi、Lohit Oriya、AnjaliOldLipi、Kedage、LikhanNormal、Lohit Tamil、Linux Libertine。
这些字体包含在以下 Debian(元)软件包中:ttf-indic-fonts、ttf-unfonts、ttf-farsiweb、ttf-arphic-uming、ttf-sil-ezra、ttf-thai-arundina、linux-libertine。
字体安装完成后,需要在用户主目录下创建一个名为“mwlibfonts”的目录。所有字体都需要链接到相应的目录(见 fontconfig.py)。
联系方式/更多信息
有关更多信息,请访问我们的 trac 实例,网址为 http://code.pediapress.com。也可以在那里找到当前的开发版本。
变更日志
2014-02-11 发布 0.14.5
跳过带有无效透明度信息的图像
来自 http://translatewiki.net 的本地化更新。
在运行测试时使用 Pillow 而不是 PIL
2013-11-11 发布 0.14.4
修复封面页页脚位置问题
修复与 pdfsam 和没有 '.pdf' 扩展名的输出文件一起的目录表渲染错误
如果页面以分页符结束,则引用在该分页符之前
实现显式分页符
来自 http://translatewiki.net 的本地化更新。
使显示维基许可证可配置
仅在需要时生成 html 文档 - 修复没有 docutils 的安装错误
使封面页边距可配置
替换需要 Python 2.7+ 的格式字符串
使用本地时间用于 PDF 时间戳。使文本和时间格式可配置
2013-05-13 发布 0.14.3
要求更新版本的 mwlib、pygments 和 mwlib.ext
不要在 renderArticleTitle 中展开模板
来自 http://translatewiki.net 的本地化更新。
2013-04-23 发布 0.14.2
添加缺少的表格列大小注释
使水平表格对齐可配置
允许使用维基标记中的表格列宽度
允许覆盖字体配置
通过 pdfstyles.pdf/customconfig.py 配置封面图像位置
通过 pdfstyles.pdf/customconfig.py 配置封面图像大小
重新排列配置“部分”
重命名配置参数
来自 http://translatewiki.net 的本地化更新。
修复 cjk 的换行错误。修复:https://bugzilla.wikimedia.org/show_bug.cgi?id=44406
修复错误的 int->hex 颜色转换。修复 https://github.com/pediapress/mwlib/issues/23
修复某些 .po 文件中的格式字符串(bpy、id)
如果可用,使用 pdfsam-console 来连接 PDF 和 ToC - 这将保留书签!更改基于 Maxime Borins 的建议:https://github.com/pediapress/mwlib.rl/pull/6
来自 http://translatewiki.net 的本地化更新。
2012-09-24 发布 0.14.1
本地化更新
2012-07-21 发布 0.14.0
复制 mwlib.l10n.py 以构建没有 mwlib 的 sdist
删除 _Version 类,升级版本到 0.14.0
不要使用 ez_setup,稍微放宽要求
本地化更新
2012-06-14 发布 0.12.12
来自 translatewiki.net 的翻译更新
恢复 0.12.11 中缺少的 .mo 文件
2012-05-08 发布 0.12.11
修复 tox 使用的 pypi 网址
针对导致 PDF 拒绝打印的无协议 URL 的问题的解决方案
来自 translatewiki.net 的翻译更新
使 compile_mesages 在使用 pip -e 时工作
修复零除错误
调整参数
通过考虑大约的表格宽度来改进 rowspan 分割
在 make clean 中更加谨慎
修复:正确跳过多个损坏图像的重复出现
为非 cjk 维基中的 cjk 文本添加假零宽度空格
2011-12-13 发布 0.12.10
允许缩放浮动数学公式
允许浮动较长的数学公式
删除参考后的空格
修正文章 ID:修复在 Adobe Reader 上的打印问题
对于非严格服务器,使用图像黑名单而不是“nofilter”
2011-11-16 发布 0.12.9
添加对从右到左(RTL)的支持
修复复杂文章标题的 fail_safe_rendering(https://bugzilla.wikimedia.org/show_bug.cgi?id=30515)
2011-03-16 发布 0.12.8
修复多个表格标题
在 PDF 书签中使用一级标题
修复:使用正确的页面大小为目录
使章节规则颜色可配置
修复:使用正确的页面模板
修复页面页眉(#704)
缩放超大的数学公式
修复翻译
添加配置选项以抑制表格中的 URL->参考文献部分
处理缩写节点
使数学公式大小限制可配置
2010-10-29 发布 0.12.7
setup.py: 需要 mwlib 0.12.14。
添加本地化以修复 #905
修复 901 / 在 Adobe Reader 中的透明图像错误
从 translatewiki 手动获取 hu 翻译
修复 #903
正确的 fontswitchter 导入
添加 URL 黑名单
2010-10-11 发布 0.12.6
修复图像定位:align=none -> 非内联
更改匈牙利本地化字符串
customflowables: 修复 resizeInlineImage 方法。
来自 translatewiki.net 的本地化更新
修复表格单元格尺寸 (#842)
修复 #850
不继承表格/行/单元格的颜色
添加西班牙语翻译
使图例边框颜色可自定义
修复参考文献处理
修复目录
修复拼写错误
结果为巨大图像的公式将被跳过。避免与旧 LaTeX 安装的冲突
使用内联节点的文本颜色
针对 #844: 不要浮动源代码和预格式化节点。
从 setuptools-0.6c11 切换到 ez_setup.py
针对 #861 的修复
修复表格标题单元格内容现在正确对齐并加粗
缩放源节点
感谢 John West 添加了更多翻译
感谢 John West 添加阿拉伯语翻译
2010-7-16 发布 0.12.5
来自 Translatewiki.net 的本地化更新
使文章标题下的水平线可配置
添加到 README 中的 gettext 要求。感谢 Daniel Weuthen
修复 704
允许自定义列表项符号
添加可翻译的字符串
为章节使用正确的字体
修复表格
添加可翻译字符串“索引”
如果超出页面宽度,则缩小预格式化节点
添加希腊语 l10n 为“附录”,纠正了“跳过的文章!”的本地化
添加更新目标
使用 width=100% 拉伸表格
修复图像对齐
fontconfig 的更新
修复 #809
在 hu 中翻译“内容”
修复翻转的页面页边距。修复自定义页面大小的修复
使用表格单元格的垂直对齐
添加对假连字符的测试
修复假连字符 (#781)
修复措辞
更多 L10N 修复
修复 po 文件的语言 ID
使用文本颜色
修复 colspan 的处理
处理 abbr 标签
针对图库的修复:#270
将测试移动到顶层目录。否则 py.test 1.1 会困惑
改进图像对齐
使用 render_caption 属性。对 getTableSize 的小型重构
忽略 hiero 标签
使用重构后的样式处理
支持列表样式的 html 属性
支持罗马和字母顺序的列表样式
移除 PDF 之间的链接箭头
使与旧 imagemagick 版本兼容。
允许自定义标题页图像
2009-10-20 发布 0.12.4
在标题页页脚中不进行转义
在页脚中不进行转义
在 pdfstyles 中定义 treecleaner 跳过方法,以允许自定义。
通过设置环境变量MATH_RESOLUTION允许更高的数学图像分辨率
本地化许可证标题
修复问题#696
修复问题#699
代码标签现在正确处理为内联元素
修复使用fribidi时的Unicode解码错误
修复pyfribidi的问题
修复gallery perrow属性无效值的问题
嵌套表格中无分页符
确保在空间稀疏的情况下表格前有分页符
使用FreeSerif用于西里尔文和希腊文
修复表格内部分区问题。为中文语言添加cjk处理
从DejaVu切换到FreeFont
修复表格的span检查问题
2009-08-25版本0.12.3发布
重写表格渲染代码
使其与最新的mwlib.ext兼容
2009-08-17版本0.12.1发布
修复
添加目录
改进对CJK语言的支持
修复打印问题
使用格式化类来设置文本样式
添加CustomNodeTransformer
2009-05-06版本0.11.3发布
修复
2009-05-06版本0.11.2发布
修复
2009-05-05版本0.11.1发布
将图像许可证和贡献者部分添加到PDF末尾
修复
2009-04-17版本0.10.2发布
在标题页上显示PDF创建日期
修复
2009-04-09版本0.10.1发布
将贡献者和文章来源移至PDF末尾
对时间轴的基本支持
使用mwlib > 0.10
其他修复
2009-03-05版本0.9.10发布
在文章前插入条件分页符
小修复
2009-03-02版本0.9.9发布
小修复
2009-02-19版本0.9.8发布
对标题和副标题进行xmlescape
2009-02-18版本0.9.7发布
添加翻译
改进样式
2009-02-03版本0.9.4发布
改进画廊的渲染
改进分页符
使用来自mwlib的新图像缩放方法
2009-02-03版本0.9.3发布
为表格单元格使用正确的对齐方式和背景颜色
默认情况下文本对齐现在是两端对齐的
对灰度图像和alpha通道的解决方案(#429)
许可证
版权(c)2007,2008 PediaPress GmbH
保留所有权利。
在满足以下条件的情况下,允许重新分发和使用源代码和二进制形式,无论是否修改:
源代码重新分发必须保留上述版权声明、本条件列表和以下免责声明。
二进制形式的重新分发必须复制上述版权声明、本条件列表和以下免责声明在随重新分发提供的文档和其他材料中。
PediaPress GmbH的名称或其贡献者的名称不得用于宣传或推广从本软件派生的产品,除非事先获得书面许可。
本软件按“原样”提供,版权所有者和贡献者不提供任何明示或暗示的保证,包括但不限于适销性和针对特定目的的适用性保证。在任何情况下,版权所有者或贡献者均不对任何直接、间接、偶然、特殊、示范性或后果性损害(包括但不限于替代商品或服务的采购、使用、数据或利润的损失;或业务中断)承担责任,即使被告知此类损害的可能性,无论损害是由于合同、严格责任还是侵权(包括疏忽或其他)引起的,无论是否由于使用本软件而直接或间接产生。