kraken · PyPI · Python 包索引

支持所有语言的OCR/HTR引擎

这些详情尚未由PyPI验证

项目链接

主页

项目描述

描述

https://github.com/mittagessen/kraken/actions/workflows/test.yml/badge.svg

kraken是一个针对历史和非拉丁脚本材料的即用型OCR系统。

kraken的主要功能包括

完全可训练的布局分析、阅读顺序和字符识别

支持从右到左、双向文本和从上到下脚本

支持输出ALTO、PageXML、abbyyXML和hOCR

单词边界框和字符裁剪

支持多脚本识别

模型文件公共存储库

可变识别网络架构

安装

kraken仅在Linux或Mac OS X上运行。不支持Windows。

可以从PyPi安装最新稳定版本

$ pip install kraken

或通过conda

$ conda install -c conda-forge -c mittagessen kraken

如果您想直接支持PDF和多图像TIFF/JPEG2000，则必须安装PyPi的pdf附加包。

$ pip install kraken[pdf]

或者使用pip手动安装pyvips。

$ pip install pyvips

还提供了Conda环境文件，以便无缝安装主分支。

$ git clone https://github.com/mittagessen/kraken.git
$ cd kraken
$ conda env create -f environment.yml

或者

$ git clone https://github.com/mittagessen/kraken.git
$ cd kraken
$ conda env create -f environment_cuda.yml

使用适当的硬件进行CUDA加速。

最后，您需要找到一个模型来执行实际的字符识别。要下载默认的打印法文文本模型并将其放置在当前用户的kraken目录中

$ kraken get 10.5281/zenodo.10592716

可以通过运行以下命令检索中央仓库中可用的libre模型列表

$ kraken list

快速入门

使用默认参数在图像上识别文本，包括二值化和页面分割的先决步骤

$ kraken -i image.tif image.txt binarize segment ocr

使用nlbin算法将单个图像进行二值化

$ kraken -i image.tif bw.png binarize

使用新的基线分割器对图像（二值化或未二值化）进行分割

$ kraken -i image.tif lines.json segment -bl

使用默认模型对图像进行分割和OCR

$ kraken -i image.tif image.txt segment -bl ocr -m catmus-print-fondue-large.mlmodel

所有子命令和选项都有文档说明。使用帮助选项获取更多信息。

文档

请参阅文档。

资助

kraken在École Pratique des Hautes Études，Université PSL开发。

该项目部分资助来自欧洲联盟的Horizon 2020研究和创新框架计划下的RESILIENCE项目。

Received funding from the Programme d’investissements d’Avenir

这项工作得到了国家研究署根据“未来投资计划”提供的援助，参考编号ANR-21-ESRE-0005（Biblissima+）。

项目详情

这些详情尚未由PyPI验证

项目链接

主页

发布历史发布通知 | RSS源

本版本

5.2.9

2024年8月27日

5.2.8

2024年7月24日

5.2.7

2024年7月8日

5.2.6

2024年7月3日

5.2.5

2024年5月23日

5.2.4

2024年5月9日

5.2.3

2024年5月5日

5.2.2

2024年4月30日

5.2.1

2024年4月22日

5.2.0

2024年4月20日

5.0.0 已撤回

2024年3月28日

撤回此版本的的原因

多边形化损坏

4.3.13

2023年7月19日

4.3.12

2023年5月12日

4.3.11

2023年4月21日

4.3.10

2023年4月17日

4.3.9

2023年3月20日

4.3.7

2023年3月6日

4.3.6

2023年2月23日

4.3.5

2023年2月21日

4.3.4

2023年2月20日

4.3.3

2023年2月14日

4.3.2

2023年2月14日

4.3.1

2023年2月14日

4.3.0

2023年2月13日

4.2.0

2022年8月29日

4.1.2

2022年4月12日

4.1.1

2022年4月11日

4.1.0

2022年4月5日

4.0.0

2022年2月22日

3.0.13

2022年4月12日

3.0.9

2022年2月22日

3.0.8

2022年2月3日

3.0.7

2022年1月24日

3.0.6

2021年11月7日

3.0.4

2021年7月28日

3.0.2

2021年6月28日

3.0.1

2021年6月25日

3.0.0.0b25 预发布

2021年5月26日

3.0.0.0b24 预发布

2021年4月22日

3.0.0.0b23 预发布

2021年3月18日

3.0.0.0b22 预发布

2021年2月22日

3.0.0.0b21 预发布

2021年2月17日

3.0.0.0b20 预发布

2021年2月11日

3.0.0.0b20.dev7 预发布

2021年2月3日

3.0.0.0b19 预发布

2021年1月7日

2.0.8

2019年11月25日

2.0.5

2019年5月14日

2.0.4

2019年5月14日

2.0.3

2019年5月14日

2.0.2

2019年5月14日

2.0.1

2019年2月25日

2.0.0

2019年2月25日

1.0.1

2018年12月11日

1.0.0

2018年12月10日

0.9.16 已撤销

2018年4月20日

0.9.15 已撤销

2018年4月18日

0.9.14 已撤销

2018年4月18日

0.9.13 已撤销

2018年4月17日

0.9.12 已撤销

2018年4月17日

0.9.11 已撤销

2018年4月17日

0.9.10 已撤销

2018年3月2日

0.9.9 已撤销

2018年3月2日

0.9.8 已撤销

2018年1月8日

0.9.7 已撤销

2017年11月1日

0.9.6 已撤销

2017年10月31日

撤回此版本的的原因

与现代安装工具冲突

0.9.4 已撤销

2017年7月19日

0.9.3 已撤销

2017年7月18日

0.9.2 已撤销

2017年5月15日

0.9.0 已撤销

2016年11月3日

0.7.6 已撤销

2016年1月18日

0.7.5 已撤销

2015年12月14日

0.7.4 已撤销

2015年11月25日

0.7.3 已撤销

2015年11月3日

0.7.2 已撤销

2015年10月18日

0.7.1 已撤销

2015年9月22日

0.7.0 已撤销

2015年9月17日

0.6.3 已撤销

2015年9月14日

0.6.2 已撤销

2015年9月12日

0.6.2.dev1 预发布已撤销

2015年9月12日

0.5.0 已撤销

2015年9月7日

0.4.7 已撤销

2015年8月26日

0.4.6 已撤销

2015年8月13日

0.4.5 已撤销

2015年7月16日

0.4.5.dev1 预发布已撤销

2015年8月13日

0.4.4 已撤销

2015年6月16日

0.4.3 已撤销

2015年6月14日

0.4.2 已撤销

2015年5月30日

0.4.1 已撤销

2015年5月26日

0.3.4 已撤销

2015年5月23日

0.3.3 已撤销

2015年5月22日

0.3.1.post11 已撤销

2015年5月22日

0.3.1.post10 已撤销

2015年5月22日

0.3.1 已撤销

2015年4月23日

0.2.5 已撤销

2015年4月16日

0.2.4 已撤销

2015年4月16日

0.2.3 已撤销

2015年4月16日

0.2.2 已撤销

2015年4月5日

0.1.0 已撤销

2015年3月30日

撤回此版本的的原因

与现代安装工具冲突

0.1-dev 预发布已撤销

2013年12月16日

下载文件

下载适用于您的平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源码分发

kraken-5.2.9.tar.gz (12.8 MB 查看哈希值)

上传时间 2024年8月27日 源码

构建分发

kraken-5.2.9-py3-none-any.whl (5.0 MB 查看哈希值)

上传时间 2024年8月27日 Python 3

kraken-5.2.9.tar.gz 的哈希值

kraken-5.2.9.tar.gz 的哈希值
算法	哈希摘要
SHA256	`0d132267bc168bebc27b961da7c917a8584363d497eb7a63fa2bcbd51f9edcae`
MD5	`fb69fe09725f92b9eb90bf05afe45cb6`
BLAKE2b-256	`7e55ba9522dbeff0239955c9549ecac756bc034f891f3be5084390371d725443`

kraken-5.2.9-py3-none-any.whl 的哈希值

kraken-5.2.9-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`3f1d7c801e7a7c985e9fe1bff5abd4b621769e2cd70668909255af856c0f86d0`
MD5	`75e8d0acaff71c5d27fa29fbd3e1a7dc`
BLAKE2b-256	`d0c5640a6af5332c65aebbef7e72f410b9eca281d7e925d2cc93d2ae86651d66`

kraken 5.2.9

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

描述

安装

快速入门

文档

资助

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史发布通知 | RSS源

下载文件

源码分发

构建分发

kraken 5.2.9

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

描述

安装

快速入门

文档

相关软件

资助

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史 发布通知 | RSS源

下载文件

源码分发

构建分发

发布历史发布通知 | RSS源