CJK(中文、日文、韩文)语言数据库。
项目描述
cihai ·

Python库,用于处理CJK(中文、日文、韩文)数据。
本项目正在积极开发中。关注我们的进展,并请定期查看更新!
快速入门
API / 库(此存储库)
$ pip install --user cihai
from cihai.core import Cihai
c = Cihai()
if not c.unihan.is_bootstrapped: # download and install Unihan to db
c.unihan.bootstrap()
query = c.unihan.lookup_char('好')
glyph = query.first()
print("lookup for 好: %s" % glyph.kDefinition)
# lookup for 好: good, excellent, fine; well
query = c.unihan.reverse_char('good')
print('matches for "good": %s ' % ', '.join([glph.char for glph in query]))
# matches for "good": 㑘, 㑤, 㓛, 㘬, 㙉, 㚃, 㚒, 㚥, 㛦, 㜴, 㜺, 㝖, 㤛, 㦝, ...
CLI(cihai-cli)
$ pip install --user cihai-cli
字符查找
$ cihai info 好
char: 好
kCantonese: hou2 hou3
kDefinition: good, excellent, fine; well
kHangul: 호
kJapaneseOn: KOU
kKorean: HO
kMandarin: hǎo
kTang: "*xɑ̀u *xɑ̌u"
kTotalStrokes: "6"
kVietnamese: háo
ucn: U+597D
反向查找
$ cihai reverse library
char: 圕
kCangjie: WLGA
kCantonese: syu1
kCihaiT: '308.302'
kDefinition: library
kMandarin: tú
kTotalStrokes: '13'
ucn: U+5715
--------
UNIHAN数据
cihai使用的所有数据集都有独立的工具来导出数据。无需库。
- unihan-etl - UNIHAN数据导出为csv、yaml和json。
开发中
$ git clone https://github.com/cihai/cihai.git`
$ cd cihai/
设置您的开发环境并了解如何贡献。我们跨越所有cihai项目使用相同的约定/工具:pytest
、sphinx
、mypy
、ruff
、tmuxp
以及文件监视器助手(例如entr(1)
)。
Python版本
- 0.19.0:最后一个Python 3.7版本
快速链接
- 快速入门
- 数据集:当前和未来数据集的完整列表
- Python API
- 路线图
- Python支持:>= 3.8, pypy
- 来源:https://github.com/cihai/cihai
- 文档:https://cihai.git-pull.com
- 变更日志:https://cihai.git-pull.com/history.html
- API:https://cihai.git-pull.com/api.html
- 问题:https://github.com/cihai/cihai/issues
- 测试覆盖率:https://codecov.io/gh/cihai/cihai
- pypi:https://pypi.python.org/pypi/cihai
- OpenHub:https://www.openhub.net/p/cihai
- 许可:MIT
项目详情
下载文件
下载您平台对应的文件。如果您不确定选择哪个,请了解更多关于 安装包的信息。
源代码分发
cihai-0.33.0.tar.gz (57.1 kB 查看哈希值)
构建分发
cihai-0.33.0-py3-none-any.whl (25.2 kB 查看哈希值)
关闭
cihai-0.33.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 454a20636005ae6050af9d27b444189e25919c33c1a784d1c95b9364dcd09646 |
|
MD5 | bcaaaaf5b06acf137f0830d97151584b |
|
BLAKE2b-256 | 986812cf82243f72028e3343e7c0dbe252aea2e5cb54f88d16fc587b8f789533 |
关闭
cihai-0.33.0-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4db5a8aa94aec0acd1a53f2e44eb5fd550c17a71d01d1382a8d40196684d29c3 |
|
MD5 | c938aaff0b8ea8aca7a8f162220c2537 |
|
BLAKE2b-256 | 780e60c88d6ed9fe0809ad98ae01e54f436a7b885ad4b974f4079d798380b398 |