将文档云的文档查看器集成到plone中。
项目描述
collective.documentviewer 将 DocumentCloud 查看器和 PDF 处理集成到 Plone。
示例
您可以在以下网站看到此插件的功能实施情况
特性
非常好的文档查看器。
OCR。
OCR文本可搜索。
支持许多不同类型的文档。
许多配置选项。
PDF相册视图用于显示PDF组。
支持
除了显示PDF,它还将显示
Word。
Excel。
Powerpoint。
HTML。
RTF。
翻译
此产品已翻译成
德语。
西班牙语。
巴斯克语。
法语。
意大利语。
荷兰语。
简体中文。
您可以为任何缺失的消息或其他新语言做出贡献,加入我们加入 Plone Collective Team,在 Transifex.net 服务的全球 Plone 翻译者社区。
安装
安装要求
GraphicsMagick。
ghostscript(推荐版本 9.0)。
Poppler
tesseract(可选)
qpdf
OpenOffice 或 LibreOffice(可选,用于 doc、excel、ppt 等类型)
md5 或 md5sum 命令行工具。
在 Cent OS/Red hat 上安装
由 Eric Tyrer 贡献了针对 CentOS 的特殊说明。您可以通过 git hub 仓库文件位置 访问它们。
在 Debian 上安装
由 Leonardo J. Caballero G. 贡献了针对 Debian 的特殊说明。您可以通过 git hub 仓库文件位置 访问它们。
问题安装
如果在 Linux/Ubuntu/Debian 机器上遇到如下错误
/var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image_extractor.rb:51:in `exists?': can't convert nil into String (TypeError) from /var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image_extractor.rb:51:in `ensure in convert'
这是因为在 ruby docsplit 库中存在与临时文件夹访问和临时文件删除的问题。只需运行以下命令
sudo chmod 1777 /tmp && sudo chmod 1777 /var/tmp
然后重试您的文档转换
开发
正常流程
git clone git@github.com:collective/collective.documentviewer.git cd collective.documentviewer virtualenv . bin/pip install -r requirements.txt bin/buildout
异步集成
强烈建议安装并配置 collective.celery,与该包一起使用。这样做将异步管理所有 PDF 转换过程,以便用户在保存文件时不会延迟太多。
设置
该产品可以通过控制面板项“文档查看器设置”进行配置。
一些有趣的配置选项
- 存储类型
如果您想通过 Amazon Cloud 提供您的文件,这将允许您将数据存储在可以同步到另一服务器的平面文件中。
- 存储位置
服务器存储文件的地点。
- OCR
使用 tesseract 扫描文档中的文本。这个过程可能会很慢,所以如果你的PDF文件不需要进行OCR处理,你可以禁用它。
- 自动选择布局
对于添加到网站的PDF文件,自动选择文档查看器的显示。
- 自动转换
当PDF文件被添加和修改时,自动转换。
- 自动布局文件类型
应自动转换为文档查看器的类型。
Dexterity支持
如果你想要与自己的Dexterity内容类型一起使用它,你需要编辑 FTI 在 ZMI/portal_types/yourtype 中,如下添加“documentviewer”在可用的视图方法中
<property name="view_methods" purge="False"> <element value="documentviewer"/> </property>
此外,你还需要在模式中设置主字段,例如
<field name="myfile" marshal:primary="true" type="plone.namedfile.field.NamedBlobFile">
文件存储集成
如果你选择使用基本文件存储而不是ZODB blob存储,有一些事情你需要记住。
从翻页器升级
如果你目前安装了翻页器,这个项目将取代它。你的翻页器视图仍然有效,但不会将未来添加到网站的文件转换为翻页器。
要转换现有视图,在每个翻页器启用的文件上,将有一个“文档查看器转换”按钮,你可以点击它手动将翻页器转换为文档查看器。
要转换所有现有视图,请转到ZMI中的 portal_setup,选择 collective.documentviewer,点击以显示旧升级,应该有一个 upgrade-all 步骤来运行。
测试状态
此附加组件使用Travis CI进行测试。当前状态为
贡献
有想法吗?发现了错误?通过 提交一个工单 来告诉我们。
许可
该项目根据GPLv2许可。
变更日志
6.0.3 (2023-05-17)
使用 DOCUMENTVIEWER_QPDF_PARAMETERS 环境变量允许使用qpdf的额外参数 [mpeeters]
6.0.2 (2023-04-27)
转义查询字符串搜索值 [kleier]
6.0.1 (2021-02-03)
改进了卸载。 [pbauer]
6.0.0 (2020-05-12)
添加了Transifex.net服务集成以管理翻译过程。 [macagua]
更新了西班牙语翻译。 [macagua]
更新了i18n支持。 [macagua]
修复了文档的下载链接。 #78 [b4oshany]
替换了 docsplit。而是直接调用各种包。请参阅 pull request #79。 [alphaomega325]
Python 3,Plone 5.2兼容 [vangheem]
5.0.4 (2019-01-09)
使用 plone.api.portal.get 而不是 getToolByName [vangheem]
5.0.3 (2018-12-11)
处理没有安装celery的可能错误 [vangheem]
5.0.2 (2018-12-11)
修复与最新collective.celery版本兼容的问题 [vangheem]
修复了PDF第一页上破坏缩放的问题 [obct537]
添加功能和方法到浏览器视图(convert_all_unconverted),以转换所有尚未转换的文件。 [thet]
如果没有设置全局请求,则不会中断。修复了#71问题 [ale-rt]
修复了冗余条件 [ale-rt]
处理plone.app.contenttypes文件索引。 [thet]
为plone.app.contenttypes添加自定义迁移器,并在迁移到plone.app.contettypes时避免转换。 [thet]
在Nixos下添加对libreoffice的支持,它使用不同的文件夹名作为其转换目录 [pysailor]
5.0.1 (2017-07-16)
修复了PDF第一页上破坏缩放的问题 [obct537]
5.0.0 (2016-09-02)
在拉取OCR文本时记录异常,而不是完全错误。 [vangheem]
5.0.0a1 (2016-08-05)
仅限plone 5/dexterity [vangheem]
4.1.0 (2017-05-15)
持久化转换后的PDF并将其发布为pdf/dump.pdf和@@pdf。 [jaroel]
4.0.14 (2016-08-01)
添加意大利语翻译 [keul]
修复了Chrome上的JavaScript问题:期望的全局变量sidebar不是全局的 [keul]
更好地处理异步过程中的冲突错误 [vangheem]
4.0.13 (2016-07-22)
由于屏幕阅读器无法理解PDF页面的
标签,因此从屏幕阅读器中隐藏文档查看器。 [vangheem]
4.0.12 (2016-07-22)
处理搜索时的错误 [vangheem]
4.0.11 (2016-07-12)
处理内容上找不到blob的错误 [vangheem]
4.0.10 (2016-06-30)
修复发布
4.0.9 (2016-06-30)
处理文件删除以清理文件 [vangheem]
修复无法隐藏侧边栏的问题 [vangheem]
4.0.8 (2016-06-21)
使用复选框进行自动布局 [vangheem]
4.0.7 (2016-06-20)
不转换图像类型 [vangheem]
能够完全隐藏贡献者 [vangheem]
4.0.6 (2016-01-27)
使查看器能够响应 [vangheem]
4.0.5 (2016-01-25)
在设置主图像后重新索引对象,以便可以检索图标 [vangheem]
4.0.4 (2016-01-25)
修复celery会话显示它仍在转换的问题 [vangheem]
4.0.3 (2015-09-30)
修复import namedfile,恢复较旧版本的plone兼容性 [vangheem]
4.0.2 (2015-09-30)
修复对archetypes的支持 [vangheem]
4.0.1 (2015-09-28)
添加主图像支持 [vangheem]
能够使用collective.celery进行任务排队 [vangheem]
修复异步监控注册 [pilz]
4.0.0 (2015-09-09)
修复Plone 5兼容性 [vangheem]
升级jquery.imgareaselect到最新版本 [vangheem]
升级文档查看器到最新版本 [vangheem]
不再支持从wildcard.pdfpal和wc.pageturner升级。使用3.x系列 [vangheem]
3.0.3 (2015-07-29)
在javascript变量文件上设置响应头。防止Chrome上的js错误。 [vangheem]
3.0.2 (2014-05-31)
修复了与collective.geo.*不兼容的问题 [vangheem]
3.0.1 (2014-05-08)
添加德语翻译 [jhb]
3.0a1 (2013-09-03)
添加Dexterity兼容性。要在您的内容类型上启用它,您必须定义一个主字段,并将documentviewer添加到可用视图方法中,请参阅文档。 [vincentfretin]
修复:现在可以修改的用户可以查看信息消息和“注释”/“部分”功能。 [thomasdesvenain]
如果可能,显示贡献者的全名。贡献者和组织在同一个标签内。 [thomasdesvenain]
避免在OCR过程中用(?)替换非ASCII字符,对于非英语语言。 [thomasdesvenain]
修复了非转换内容的纯文本索引。 [thomasdesvenain]
当正在生成文档的新版本时,用户将通过状态消息得到通知。 [thomasdesvenain]
2.2.2b3 (2013-05-31)
国际化修复+法语翻译 [thomasdesvenain]
支持根据可配置的IOCRLanguage适配器将文档语言传递给tesseract/docsplit [ajung]
2.2.2b2 (2013-05-31)
修复了使用blob存储时禁用文本索引的bug [gbastien]
2.2.2b1 (2013-05-31)
仅当支持时使用defaultFactory。对于较旧的zope.schema版本 [vangheem]
2.2.2a1 (2013-05-31)
添加法语翻译 [gbastien]
在全局和本地设置中添加enable_indexation参数。修复了:[gbastien] https://github.com/collective/collective.documentviewer/issues/21
使本地设置与全局设置一致。修复了:[gbastien] https://github.com/collective/collective.documentviewer/issues/22
2.2.1 (2013-03-12)
修复了与最新libreoffice和docsplit一起使用时的bug。修复了:[gbastien] https://github.com/collective/collective.documentviewer/issues/11
显示查看器时不需要在Plone实例上安装docsplit。[vangheem]
2.2 (2013-02-06)
修复查看器的z-index问题。[damilgra]
2.2b2 (2013-01-10)
修复plone 4.3的getSite导入问题。
2.2b1 (2013-01-06)
切换到使用OFS.interfaces.IFolder进行文件夹视图。[vangheem]
在PDF转换过程中,如果可用则显示现有文档。[vangheem]
将转换按钮移至操作栏。[vangheem]
2.2a2 (2012-10-01)
修复另一个子站问题。[vangheem]
2.2a1 (2012-xx-xx)
测试Plone 4.2兼容性。[hvelarde]
与子站一起工作。
2.1b2 (2012-06-22)
更好地处理文件夹的移动。
2.1b1 (2012-06-22)
能够对文件存储的文件路径进行加密。
2.0.4 (2012-06-21)
修复清理文件位置的问题。
修复文件资源可能存在的遍历错误。
2.0.3 (2012-06-13)
在查找现有作业之前检查是否设置了配额。
2.0.2 (2012-06-12)
包含contentmenu zcml依赖项。
升级转换将尝试修复错误转换。
2.0.1 (2012-05-15)
修复分组视图上的分批处理。
2.0.1b1 (2012-05-14)
添加对新格式的支持:Star Office、PS、Photoshop、Visio、Palm。
2.0b1 (2012-05-11)
添加添加注释和部分的能力。
1.5.1 (2012-04-30)
修复文件资源的安全性问题。
1.5.0 (2012-04-29)
无更改。
1.5.0b1 (2012-04-27)
能够将作业移至队列的前端。
使用portal_catalog而不是uid_catalog,以便安全检查应用于资源URL。
1.4.2 (2012-04-24)
无更改,第一个最终版本。
1.4.1b3 (2012-04-23)
在同步数据库之前创建本地目录和索引,以防止冲突错误。
将重定向超时添加到转换信息页面。
1.4.1b2 (2012-04-23)
确保关闭打开的文件描述符。
将“原始文档(PDF)”更改为“原始文档”。
转换后发出事件。
只有当是管理员时才显示队列链接。
即使尚未选择布局,转换按钮也应正常工作。
在输出很大时使用communicate而不是wait与popen,以防止死锁。
1.4.1b1 (2012-04-23)
不要假设在数据转换时使用pdfpal和pageturner。
更好的命令运行器。
更好地跟踪错误,并在转换期间发生问题时在界面中显示它们。
新的文件存储结构,以防止一个目录中文件过多。
1.4b1 (2012-04-21)
修复当选择文本或页面时全屏按钮的问题。
能够自定义批量大小。
1.4a2 (2012-04-20)
确保不要使用包含空格的文件。
1.4a1 (2012-04-20)
能够检测PDF是否已包含文本,并在包含文本时不要进行OCR。
1.3b2 (2012-04-20)
使用jQuery而不是$()。
1.3b1 (2012-04-20)
默认OCR关闭,因为它非常慢。
在查找二进制文件时更好的日志记录。
能够覆盖查看器的宽度。
1.3a3 (2012-04-20)
修复卸载问题。[vangheem]
1.3a2 (2012-04-19)
修复未安装时的异步错误。[vangheem]
1.3a1 (2012-04-19)
确保在同步大型PDF数据库后初始化目录。[vangheem]
更好地与pdfpal和pageturner集成,以便易于从这些产品升级。[vangheem]
1.2a2 (2012-04-19)
修复为异步队列设置自定义配额的问题。[vangheem]
修复分组视图的清除按钮问题。[vangheem]
添加对替代md5sum二进制文件的支持。[vangheem]
1.2a1 (2012-04-19)
修复全屏页面问题。[vangheem]
更好地与配额设置进行异步集成。[vangheem]
查看转换的异步队列。[vangheem]
在门户目录中索引OCR数据。[vangheem]
具有搜索功能的更好的PDF分组视图。[vangheem]
更好地处理大文件。[vangheem]
通过将文件的哈希存储并检查来检查文件是否已被转换。[vangheem]
能够删除文档查看器转换任务 [vangheem]
添加清理已删除 Plone 文件对象的文件存储文件的功能。[vangheem]
1.1a1 (2012-04-18)
添加 PDF 文件夹相册视图 [vangheem]
修复异步集成问题 [vangheem]
1.0a2 (2012-04-17)
添加控制面板图标 [vangheem]
修复卸载程序 [vangheem]
更改图像类型不会导致现有图像失败。[vangheem]
1.0a1 (2012-04-17)
首次发布
项目详情
下载文件
下载适合您平台的应用程序。如果您不确定该选择哪个,请了解更多关于 安装包 的信息。
源代码发行版
构建分发包
collective.documentviewer-6.0.3.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1b29a085cb01b3cae3df53342fc2a2a5fb16730d014f52bde07a94c5943eb7d2 |
|
MD5 | 6d4a927be4a11ade7073d5f683b7163c |
|
BLAKE2b-256 | 3f9f344f1bb922cc9b93cf3d37856763306d62361c5d575a7719eee26f69823b |
collective.documentviewer-6.0.3-py2.py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 5ef186c0b9d4d060fbf7d6aee45ce199439ddce50794f939a0cba3689f38f7f7 |
|
MD5 | 571bc6bbccccac84539ea33620d90d66 |
|
BLAKE2b-256 | 54e950deecd48a96e24f69195f550d8932d12f25037c4b27b663546264679e63 |