在上传的文件上运行字符识别
项目描述
文档OCR
此模块是为了使上传的文档(例如扫描件)可以通过运行OCR进行搜索而编写的。
它支持所有Pillow支持的图像格式,以及PDF。
安装
要安装此模块,您需要
安装tesseract以及您的文档使用的语言
如果您想支持PDF的OCR,请安装imagemagick
安装模块本身
在Debian或Ubuntu系统上,您通常运行
$ sudo apt-get install tesseract-ocr imagemagick
配置
要配置此模块,请转到
设置/技术/参数/系统参数并检查名为document_ocr.*的参数
使用
默认情况下,字符识别是由夜间cronjob异步完成的。这是因为识别过程需要一段时间,您不希望用户等待索引完成。cronjob的运行间隔可以在“计划任务”菜单下根据您的需要调整,在“设置”下。如果您想强制立即进行OCR,请将配置参数document_ocr.synchronous设置为True。
错误追踪器
错误在GitHub问题上追踪。如果在那里遇到麻烦,请检查您的错误是否已报告。如果您是第一个发现的人,请帮助我们通过提供详细且受欢迎的反馈来解决问题。
致谢
实际工作
图片
Odoo社区协会:图标。
贡献者
Holger Brunn <hbrunn@therp.nl>
请不要直接联系贡献者以寻求关于此插件的问题或问题的帮助,而是使用社区邮件列表或相应的专业邮件列表寻求帮助,以及上方链接的错误跟踪器来报告技术问题。
维护者
此模块由OCA维护。
OCA,或Odoo社区协会,是一个非营利组织,其使命是支持Odoo功能的协作开发并推广其广泛使用。
要为此模块做出贡献,请访问https://odoo-community.org。
项目详情
关闭
odoo8_addon_document_ocr-8.0.1.0.0-py2-none-any.whl的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7c03df8e1e9c5f9a1e63289ae2434e892eeb887319ba7ef2ba6f13206f5172b3 |
|
MD5 | a36705e8746dc31762708d9bcf97800a |
|
BLAKE2b-256 | ab2bf6ecce603c8d9d0774e737c9db43e567e28c4128bf18f1bec88294890d58 |