跳转到主要内容

中提供了中文文本处理中使用的常量。

项目描述

https://badge.fury.io/py/zhon.svg https://github.com/tsroten/zhon/actions/workflows/ci.yml/badge.svg

中是一个Python库,提供了中文文本处理中常用的常量。

关于

中的常量可以用于中文文本处理,例如

  • 在字符串中查找CJK字符

    >>> re.findall('[{}]'.format(zhon.hanzi.characters), 'I broke a plate: 我打破了一个盘子.')
    ['我', '打', '破', '了', '一', '个', '盘', '子']
  • 验证拼音音节、词语或句子

    >>> re.findall(zhon.pinyin.syllable, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I)
    ['Yuàn', 'zi', 'lǐ', 'tíng', 'zhe', 'yí', 'liàng', 'chē']
    
    >>> re.findall(zhon.pinyin.word, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I)
    ['Yuànzi', 'lǐ', 'tíngzhe', 'yí', 'liàng', 'chē']
    
    >>> re.findall(zhon.pinyin.sentence, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I)
    ['Yuànzi lǐ tíngzhe yí liàng chē.']

特性

Zhon 包含以下常用常量

  • CJK 字符和部首

  • 中文标点符号

  • 中文句子正则表达式模式

  • 拼音元音、辅音、小写、大写和标点

  • 拼音音节、词语和句子正则表达式模式

  • 注音字符和符号

  • 注音音节正则表达式模式

  • CC-CEDICT 字符

入门

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源分布

zhon-2.0.2.tar.gz (84.5 kB 查看哈希值)

上传

构建分布

zhon-2.0.2-py3-none-any.whl (84.0 kB 查看哈希值)

上传 Python 3

由以下机构支持