跳转到主要内容

在上传的文件上运行字符识别

项目描述

License: AGPL-3

文档OCR

此模块是为了使上传的文档(例如扫描件)可以通过运行OCR进行搜索而编写的。

它支持所有Pillow支持的图像格式,以及PDF。

安装

要安装此模块,您需要

  1. 安装tesseract以及您的文档使用的语言

  2. 如果您想支持PDF的OCR,请安装imagemagick

  3. 安装模块本身

在Debian或Ubuntu系统上,您通常运行

$ sudo apt-get install tesseract-ocr imagemagick

配置

要配置此模块,请转到

  1. 设置/技术/参数/系统参数并检查名为document_ocr.*的参数

使用

默认情况下,字符识别是由夜间cronjob异步完成的。这是因为识别过程需要一段时间,您不希望用户等待索引完成。cronjob的运行间隔可以在“计划任务”菜单下根据您的需要调整,在“设置”下。如果您想强制立即进行OCR,请将配置参数document_ocr.synchronous设置为True。

Try me on Runbot

错误追踪器

错误在GitHub问题上追踪。如果在那里遇到麻烦,请检查您的错误是否已报告。如果您是第一个发现的人,请帮助我们通过提供详细且受欢迎的反馈来解决问题。

致谢

实际工作

图片

  • Odoo社区协会:图标

贡献者

请不要直接联系贡献者以寻求关于此插件的问题或问题的帮助,而是使用社区邮件列表相应的专业邮件列表寻求帮助,以及上方链接的错误跟踪器来报告技术问题。

维护者

Odoo Community Association

此模块由OCA维护。

OCA,或Odoo社区协会,是一个非营利组织,其使命是支持Odoo功能的协作开发并推广其广泛使用。

要为此模块做出贡献,请访问https://odoo-community.org

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

此版本没有可用的源分发文件。请参阅生成分发存档的教程。

构建分发

odoo8_addon_document_ocr-8.0.1.0.0-py2-none-any.whl (21.5 kB 查看哈希)

上传时间 Python 2

支持者: