跳转到主要内容

将文档云的文档查看器集成到plone中。

项目描述

collective.documentviewerDocumentCloud 查看器和 PDF 处理集成到 Plone

示例

您可以在以下网站看到此插件的功能实施情况

特性

  • 非常好的文档查看器。

  • OCR。

  • OCR文本可搜索。

  • 支持许多不同类型的文档。

  • collective.celery 集成。

  • 许多配置选项。

  • PDF相册视图用于显示PDF组。

支持

除了显示PDF,它还将显示

  • Word。

  • Excel。

  • Powerpoint。

  • HTML。

  • RTF。

翻译

此产品已翻译成

  • 德语。

  • 西班牙语。

  • 巴斯克语。

  • 法语。

  • 意大利语。

  • 荷兰语。

  • 简体中文。

您可以为任何缺失的消息或其他新语言做出贡献,加入我们加入 Plone Collective Team,在 Transifex.net 服务的全球 Plone 翻译者社区。

安装

安装要求

  • GraphicsMagick。

  • ghostscript(推荐版本 9.0)。

  • Poppler

  • tesseract(可选)

  • qpdf

  • OpenOffice 或 LibreOffice(可选,用于 doc、excel、ppt 等类型)

  • md5 或 md5sum 命令行工具。

在 Cent OS/Red hat 上安装

由 Eric Tyrer 贡献了针对 CentOS 的特殊说明。您可以通过 git hub 仓库文件位置 访问它们。

在 Debian 上安装

由 Leonardo J. Caballero G. 贡献了针对 Debian 的特殊说明。您可以通过 git hub 仓库文件位置 访问它们。

问题安装

如果在 Linux/Ubuntu/Debian 机器上遇到如下错误

/var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image_extractor.rb:51:in `exists?': can't convert nil into String (TypeError)
from /var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image_extractor.rb:51:in `ensure in convert'

这是因为在 ruby docsplit 库中存在与临时文件夹访问和临时文件删除的问题。只需运行以下命令

sudo chmod 1777 /tmp && sudo chmod 1777 /var/tmp

然后重试您的文档转换

开发

正常流程

git clone git@github.com:collective/collective.documentviewer.git

cd collective.documentviewer

virtualenv .

bin/pip install -r requirements.txt

bin/buildout

异步集成

强烈建议安装并配置 collective.celery,与该包一起使用。这样做将异步管理所有 PDF 转换过程,以便用户在保存文件时不会延迟太多。

设置

该产品可以通过控制面板项“文档查看器设置”进行配置。

一些有趣的配置选项

存储类型

如果您想通过 Amazon Cloud 提供您的文件,这将允许您将数据存储在可以同步到另一服务器的平面文件中。

存储位置

服务器存储文件的地点。

OCR

使用 tesseract 扫描文档中的文本。这个过程可能会很慢,所以如果你的PDF文件不需要进行OCR处理,你可以禁用它。

自动选择布局

对于添加到网站的PDF文件,自动选择文档查看器的显示。

自动转换

当PDF文件被添加和修改时,自动转换。

自动布局文件类型

应自动转换为文档查看器的类型。

Dexterity支持

如果你想要与自己的Dexterity内容类型一起使用它,你需要编辑 FTIZMI/portal_types/yourtype 中,如下添加“documentviewer”在可用的视图方法中

<property name="view_methods" purge="False">
  <element value="documentviewer"/>
</property>

此外,你还需要在模式中设置主字段,例如

<field name="myfile" marshal:primary="true"
       type="plone.namedfile.field.NamedBlobFile">

文件存储集成

如果你选择使用基本文件存储而不是ZODB blob存储,有一些事情你需要记住。

  1. 使用 Nginx 来服务文件系统文件。这可能需要你在Plone服务器上安装一个本地的Nginx来专门为文件存储提供服务。尽管如此,你可以在文件存储的使用上发挥创意。

  2. 由于在Plone的删除操作中,可能会被中断,并且在操作系统系统中不能在事务中删除文件,因此永远不会删除文件。然而,你可以将一个操作放入 cron 任务中来清理你的文件存储目录。只需调用url http://zeoinstace/plone/@@dvcleanup-filestorage

从翻页器升级

如果你目前安装了翻页器,这个项目将取代它。你的翻页器视图仍然有效,但不会将未来添加到网站的文件转换为翻页器。

要转换现有视图,在每个翻页器启用的文件上,将有一个“文档查看器转换”按钮,你可以点击它手动将翻页器转换为文档查看器。

要转换所有现有视图,请转到ZMI中的 portal_setup,选择 collective.documentviewer,点击以显示旧升级,应该有一个 upgrade-all 步骤来运行。

测试状态

此附加组件使用Travis CI进行测试。当前状态为

Travis CI badge PyPI badge

贡献

有想法吗?发现了错误?通过 提交一个工单 来告诉我们。

作者

此产品是由Wildcard Corp.团队开发的。

Produced by wildcardcorp.com

许可

该项目根据GPLv2许可。

变更日志

6.0.3 (2023-05-17)

  • 使用 DOCUMENTVIEWER_QPDF_PARAMETERS 环境变量允许使用qpdf的额外参数 [mpeeters]

6.0.2 (2023-04-27)

  • 转义查询字符串搜索值 [kleier]

6.0.1 (2021-02-03)

  • 改进了卸载。 [pbauer]

6.0.0 (2020-05-12)

  • 添加了Transifex.net服务集成以管理翻译过程。 [macagua]

  • 更新了西班牙语翻译。 [macagua]

  • 更新了i18n支持。 [macagua]

  • 修复了文档的下载链接。 #78 [b4oshany]

  • 替换了 docsplit。而是直接调用各种包。请参阅 pull request #79。 [alphaomega325]

  • Python 3,Plone 5.2兼容 [vangheem]

5.0.4 (2019-01-09)

  • 使用 plone.api.portal.get 而不是 getToolByName [vangheem]

5.0.3 (2018-12-11)

  • 处理没有安装celery的可能错误 [vangheem]

5.0.2 (2018-12-11)

  • 修复与最新collective.celery版本兼容的问题 [vangheem]

  • 修复了PDF第一页上破坏缩放的问题 [obct537]

  • 添加功能和方法到浏览器视图(convert_all_unconverted),以转换所有尚未转换的文件。 [thet]

  • 如果没有设置全局请求,则不会中断。修复了#71问题 [ale-rt]

  • 修复了冗余条件 [ale-rt]

  • 处理plone.app.contenttypes文件索引。 [thet]

  • 为plone.app.contenttypes添加自定义迁移器,并在迁移到plone.app.contettypes时避免转换。 [thet]

  • 在Nixos下添加对libreoffice的支持,它使用不同的文件夹名作为其转换目录 [pysailor]

5.0.1 (2017-07-16)

  • 修复了PDF第一页上破坏缩放的问题 [obct537]

5.0.0 (2016-09-02)

  • 在拉取OCR文本时记录异常,而不是完全错误。 [vangheem]

5.0.0a1 (2016-08-05)

  • 仅限plone 5/dexterity [vangheem]

4.1.0 (2017-05-15)

  • 持久化转换后的PDF并将其发布为pdf/dump.pdf和@@pdf。 [jaroel]

4.0.14 (2016-08-01)

  • 添加意大利语翻译 [keul]

  • 修复了Chrome上的JavaScript问题:期望的全局变量sidebar不是全局的 [keul]

  • 更好地处理异步过程中的冲突错误 [vangheem]

4.0.13 (2016-07-22)

  • 由于屏幕阅读器无法理解PDF页面的标签,因此从屏幕阅读器中隐藏文档查看器。 [vangheem]

4.0.12 (2016-07-22)

  • 处理搜索时的错误 [vangheem]

4.0.11 (2016-07-12)

  • 处理内容上找不到blob的错误 [vangheem]

4.0.10 (2016-06-30)

  • 修复发布

4.0.9 (2016-06-30)

  • 处理文件删除以清理文件 [vangheem]

  • 修复无法隐藏侧边栏的问题 [vangheem]

4.0.8 (2016-06-21)

  • 使用复选框进行自动布局 [vangheem]

4.0.7 (2016-06-20)

  • 不转换图像类型 [vangheem]

  • 能够完全隐藏贡献者 [vangheem]

4.0.6 (2016-01-27)

  • 使查看器能够响应 [vangheem]

4.0.5 (2016-01-25)

  • 在设置主图像后重新索引对象,以便可以检索图标 [vangheem]

4.0.4 (2016-01-25)

  • 修复celery会话显示它仍在转换的问题 [vangheem]

4.0.3 (2015-09-30)

  • 修复import namedfile,恢复较旧版本的plone兼容性 [vangheem]

4.0.2 (2015-09-30)

  • 修复对archetypes的支持 [vangheem]

4.0.1 (2015-09-28)

  • 添加主图像支持 [vangheem]

  • 能够使用collective.celery进行任务排队 [vangheem]

  • 修复异步监控注册 [pilz]

4.0.0 (2015-09-09)

  • 修复Plone 5兼容性 [vangheem]

  • 升级jquery.imgareaselect到最新版本 [vangheem]

  • 升级文档查看器到最新版本 [vangheem]

  • 不再支持从wildcard.pdfpal和wc.pageturner升级。使用3.x系列 [vangheem]

3.0.3 (2015-07-29)

  • 在javascript变量文件上设置响应头。防止Chrome上的js错误。 [vangheem]

3.0.2 (2014-05-31)

  • 修复了与collective.geo.*不兼容的问题 [vangheem]

3.0.1 (2014-05-08)

  • 添加德语翻译 [jhb]

3.0a1 (2013-09-03)

  • 添加Dexterity兼容性。要在您的内容类型上启用它,您必须定义一个主字段,并将documentviewer添加到可用视图方法中,请参阅文档。 [vincentfretin]

  • 修复:现在可以修改的用户可以查看信息消息和“注释”/“部分”功能。 [thomasdesvenain]

  • 如果可能,显示贡献者的全名。贡献者和组织在同一个标签内。 [thomasdesvenain]

  • 避免在OCR过程中用(?)替换非ASCII字符,对于非英语语言。 [thomasdesvenain]

  • 修复了非转换内容的纯文本索引。 [thomasdesvenain]

  • 当正在生成文档的新版本时,用户将通过状态消息得到通知。 [thomasdesvenain]

2.2.2b3 (2013-05-31)

  • 国际化修复+法语翻译 [thomasdesvenain]

  • 支持根据可配置的IOCRLanguage适配器将文档语言传递给tesseract/docsplit [ajung]

2.2.2b2 (2013-05-31)

  • 修复了使用blob存储时禁用文本索引的bug [gbastien]

2.2.2b1 (2013-05-31)

  • 仅当支持时使用defaultFactory。对于较旧的zope.schema版本 [vangheem]

2.2.2a1 (2013-05-31)

2.2.1 (2013-03-12)

2.2 (2013-02-06)

  • 修复查看器的z-index问题。[damilgra]

2.2b2 (2013-01-10)

  • 修复plone 4.3的getSite导入问题。

2.2b1 (2013-01-06)

  • 切换到使用OFS.interfaces.IFolder进行文件夹视图。[vangheem]

  • 在PDF转换过程中,如果可用则显示现有文档。[vangheem]

  • 将转换按钮移至操作栏。[vangheem]

2.2a2 (2012-10-01)

  • 修复另一个子站问题。[vangheem]

2.2a1 (2012-xx-xx)

  • 测试Plone 4.2兼容性。[hvelarde]

  • 与子站一起工作。

2.1b2 (2012-06-22)

  • 更好地处理文件夹的移动。

2.1b1 (2012-06-22)

  • 能够对文件存储的文件路径进行加密。

2.0.4 (2012-06-21)

  • 修复清理文件位置的问题。

  • 修复文件资源可能存在的遍历错误。

2.0.3 (2012-06-13)

  • 在查找现有作业之前检查是否设置了配额。

2.0.2 (2012-06-12)

  • 包含contentmenu zcml依赖项。

  • 升级转换将尝试修复错误转换。

2.0.1 (2012-05-15)

  • 修复分组视图上的分批处理。

2.0.1b1 (2012-05-14)

  • 添加对新格式的支持:Star Office、PS、Photoshop、Visio、Palm。

2.0b1 (2012-05-11)

  • 添加添加注释和部分的能力。

1.5.1 (2012-04-30)

  • 修复文件资源的安全性问题。

1.5.0 (2012-04-29)

  • 无更改。

1.5.0b1 (2012-04-27)

  • 能够将作业移至队列的前端。

  • 使用portal_catalog而不是uid_catalog,以便安全检查应用于资源URL。

1.4.2 (2012-04-24)

  • 无更改,第一个最终版本。

1.4.1b3 (2012-04-23)

  • 在同步数据库之前创建本地目录和索引,以防止冲突错误。

  • 将重定向超时添加到转换信息页面。

1.4.1b2 (2012-04-23)

  • 确保关闭打开的文件描述符。

  • 将“原始文档(PDF)”更改为“原始文档”。

  • 转换后发出事件。

  • 只有当是管理员时才显示队列链接。

  • 即使尚未选择布局,转换按钮也应正常工作。

  • 在输出很大时使用communicate而不是wait与popen,以防止死锁。

1.4.1b1 (2012-04-23)

  • 不要假设在数据转换时使用pdfpal和pageturner。

  • 更好的命令运行器。

  • 更好地跟踪错误,并在转换期间发生问题时在界面中显示它们。

  • 新的文件存储结构,以防止一个目录中文件过多。

1.4b1 (2012-04-21)

  • 修复当选择文本或页面时全屏按钮的问题。

  • 能够自定义批量大小。

1.4a2 (2012-04-20)

  • 确保不要使用包含空格的文件。

1.4a1 (2012-04-20)

  • 能够检测PDF是否已包含文本,并在包含文本时不要进行OCR。

1.3b2 (2012-04-20)

  • 使用jQuery而不是$()。

1.3b1 (2012-04-20)

  • 默认OCR关闭,因为它非常慢。

  • 在查找二进制文件时更好的日志记录。

  • 能够覆盖查看器的宽度。

1.3a3 (2012-04-20)

  • 修复卸载问题。[vangheem]

1.3a2 (2012-04-19)

  • 修复未安装时的异步错误。[vangheem]

1.3a1 (2012-04-19)

  • 确保在同步大型PDF数据库后初始化目录。[vangheem]

  • 更好地与pdfpal和pageturner集成,以便易于从这些产品升级。[vangheem]

1.2a2 (2012-04-19)

  • 修复为异步队列设置自定义配额的问题。[vangheem]

  • 修复分组视图的清除按钮问题。[vangheem]

  • 添加对替代md5sum二进制文件的支持。[vangheem]

1.2a1 (2012-04-19)

  • 修复全屏页面问题。[vangheem]

  • 更好地与配额设置进行异步集成。[vangheem]

  • 查看转换的异步队列。[vangheem]

  • 在门户目录中索引OCR数据。[vangheem]

  • 具有搜索功能的更好的PDF分组视图。[vangheem]

  • 更好地处理大文件。[vangheem]

  • 通过将文件的哈希存储并检查来检查文件是否已被转换。[vangheem]

  • 能够删除文档查看器转换任务 [vangheem]

  • 添加清理已删除 Plone 文件对象的文件存储文件的功能。[vangheem]

1.1a1 (2012-04-18)

  • 添加 PDF 文件夹相册视图 [vangheem]

  • 修复异步集成问题 [vangheem]

1.0a2 (2012-04-17)

  • 添加控制面板图标 [vangheem]

  • 修复卸载程序 [vangheem]

  • 更改图像类型不会导致现有图像失败。[vangheem]

1.0a1 (2012-04-17)

  • 首次发布

项目详情


发布历史 发布通知 | RSS 源

下载文件

下载适合您平台的应用程序。如果您不确定该选择哪个,请了解更多关于 安装包 的信息。

源代码发行版

collective.documentviewer-6.0.3.tar.gz (476.3 kB 查看哈希值)

上传时间 源码

构建分发包

collective.documentviewer-6.0.3-py2.py3-none-any.whl (470.3 kB 查看哈希值)

上传时间 Python 2 Python 3

支持