中提供了中文文本处理中使用的常量。
项目描述
中是一个Python库,提供了中文文本处理中常用的常量。
GitHub: https://github.com/tsroten/zhon
免费软件: MIT 许可证
关于
中的常量可以用于中文文本处理,例如
在字符串中查找CJK字符
>>> re.findall('[{}]'.format(zhon.hanzi.characters), 'I broke a plate: 我打破了一个盘子.') ['我', '打', '破', '了', '一', '个', '盘', '子']
验证拼音音节、词语或句子
>>> re.findall(zhon.pinyin.syllable, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuàn', 'zi', 'lǐ', 'tíng', 'zhe', 'yí', 'liàng', 'chē'] >>> re.findall(zhon.pinyin.word, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuànzi', 'lǐ', 'tíngzhe', 'yí', 'liàng', 'chē'] >>> re.findall(zhon.pinyin.sentence, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuànzi lǐ tíngzhe yí liàng chē.']
特性
Zhon 包含以下常用常量
CJK 字符和部首
中文标点符号
中文句子正则表达式模式
拼音元音、辅音、小写、大写和标点
拼音音节、词语和句子正则表达式模式
注音字符和符号
注音音节正则表达式模式
CC-CEDICT 字符
入门
贡献 文档、代码或反馈
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源分布
zhon-2.0.2.tar.gz (84.5 kB 查看哈希值)
构建分布
zhon-2.0.2-py3-none-any.whl (84.0 kB 查看哈希值)
关闭
zhon-2.0.2.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c834df6b1b182f7e973e796ded80ed1f61f271fd25f6b0dc0c44f7c4ea467184 |
|
MD5 | 676494d53806a747173643e87837b126 |
|
BLAKE2b-256 | cfda1ff0761d6c0d2fca7f19e65d19e960354dfe6cbc1664041e3c3e711d757a |
关闭
zhon-2.0.2-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e868e8308766e04866eacf37e8cf054a089d4b07cac62179b03f90a80757afe6 |
|
MD5 | 1abb6819c657b0d3b0250fedb1624c48 |
|
BLAKE2b-256 | cfe1fedce8230b9f4b07d34f2a25ea5f08071712ea512f959d831f32d257aee9 |