支持所有语言的OCR/HTR引擎
项目描述
描述
kraken是一个针对历史和非拉丁脚本材料的即用型OCR系统。
kraken的主要功能包括
安装
kraken仅在Linux或Mac OS X上运行。不支持Windows。
可以从PyPi安装最新稳定版本
$ pip install kraken
或通过conda
$ conda install -c conda-forge -c mittagessen kraken
如果您想直接支持PDF和多图像TIFF/JPEG2000,则必须安装PyPi的pdf附加包。
$ pip install kraken[pdf]
或者使用pip手动安装pyvips。
$ pip install pyvips
还提供了Conda环境文件,以便无缝安装主分支。
$ git clone https://github.com/mittagessen/kraken.git $ cd kraken $ conda env create -f environment.yml
或者
$ git clone https://github.com/mittagessen/kraken.git $ cd kraken $ conda env create -f environment_cuda.yml
使用适当的硬件进行CUDA加速。
最后,您需要找到一个模型来执行实际的字符识别。要下载默认的打印法文文本模型并将其放置在当前用户的kraken目录中
$ kraken get 10.5281/zenodo.10592716
可以通过运行以下命令检索中央仓库中可用的libre模型列表
$ kraken list
快速入门
使用默认参数在图像上识别文本,包括二值化和页面分割的先决步骤
$ kraken -i image.tif image.txt binarize segment ocr
使用nlbin算法将单个图像进行二值化
$ kraken -i image.tif bw.png binarize
使用新的基线分割器对图像(二值化或未二值化)进行分割
$ kraken -i image.tif lines.json segment -bl
使用默认模型对图像进行分割和OCR
$ kraken -i image.tif image.txt segment -bl ocr -m catmus-print-fondue-large.mlmodel
所有子命令和选项都有文档说明。使用帮助选项获取更多信息。
文档
请参阅文档。
资助
kraken在École Pratique des Hautes Études,Université PSL开发。
该项目部分资助来自欧洲联盟的Horizon 2020研究和创新框架计划下的RESILIENCE项目。
这项工作得到了国家研究署根据“未来投资计划”提供的援助,参考编号ANR-21-ESRE-0005(Biblissima+)。
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源码分发
kraken-5.2.9.tar.gz (12.8 MB 查看哈希值)
构建分发
kraken-5.2.9-py3-none-any.whl (5.0 MB 查看哈希值)
关闭
kraken-5.2.9.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 0d132267bc168bebc27b961da7c917a8584363d497eb7a63fa2bcbd51f9edcae |
|
MD5 | fb69fe09725f92b9eb90bf05afe45cb6 |
|
BLAKE2b-256 | 7e55ba9522dbeff0239955c9549ecac756bc034f891f3be5084390371d725443 |
关闭
kraken-5.2.9-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3f1d7c801e7a7c985e9fe1bff5abd4b621769e2cd70668909255af856c0f86d0 |
|
MD5 | 75e8d0acaff71c5d27fa29fbd3e1a7dc |
|
BLAKE2b-256 | d0c5640a6af5332c65aebbef7e72f410b9eca281d7e925d2cc93d2ae86651d66 |