汉字标识符 · PyPI · Python 包索引

Python模块，用于识别文本中的简体或繁体中文。

这些详情尚未由PyPI 验证

项目链接

项目描述

https://badge.fury.io/py/hanzidentifier.svg

https://github.com/tsroten/hanzidentifier/actions/workflows/ci.yml/badge.svg

汉字标识符是一个简单的Python模块，用于识别字符串中的简体或繁体字符。

GitHub: https://github.com/tsroten/hanzidentifier
免费软件：MIT许可证

关于

易于使用的辅助函数，用于识别字符串

>>> import hanzidentifier
>>> hanzidentifier.has_chinese('Hello my name is John.')
False
>>> hanzidentifier.is_simplified('John说：你好！')
True
>>> hanzidentifier.is_traditional('John說：你好！')
True
>>> hanzidentifier.has_chinese('Country in Simplified: 国家. Country in Traditional: 國家.')
True

这里是没有辅助函数的

>>> hanzidentifier.identify('Hello my name is Thomas.') is hanzidentifier.UNKNOWN
True
>>> hanzidentifier.identify('Thomas 说：你好！') is hanzidentifier.SIMPLIFIED
True
>>> hanzidentifier.identify('Thomas 說：你好！') is hanzidentifier.TRADITIONAL
True
>>> hanzidentifier.identify('你好！') is hanzidentifier.BOTH
True
>>> hanzidentifier.identify('Country in Simplified: 国家. Country in Traditional: 國家.' ) is hanzidentifier.MIXED
True

hanzidentifier.identify 有五种可能的返回值

hanzidentifier.UNKNOWN：字符串中没有识别出的汉字。
hanzidentifier.BOTH：字符串与简体和繁体字符系统兼容。
hanzidentifier.TRADITIONAL：字符串由繁体字符组成。
hanzidentifier.SIMPLIFIED：字符串由简体字符组成。
hanzidentifier.MIXED：字符串由仅作为繁体字符识别的字符组成，也包含仅作为简体字符识别的字符。

在确定字符串身份时，未在CC-CEDICT中找到的字符将被忽略。Hanzi Identifier使用由Zhon提供的CC-CEDICT数据来识别汉字。

由于繁体和简体中文字符集重叠，包含简体字的字符串可能会根据字符是否也是繁体字而标识为hanzidentifier.SIMPLIFIED或hanzidentifier.BOTH。

入门指南

安装Hanzi Identifier: $ pip install hanzidentifier
通过GitHub Issues报告错误和提问
贡献功能或错误修复

项目详情

这些详情尚未由PyPI 验证

项目链接

发布历史发布通知 | RSS源

本版本

1.2.0

2023年6月30日

1.1.0

2022年10月16日

1.0.2

2015年8月6日

1.0.1

2014年4月14日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分发

hanzidentifier-1.2.0.tar.gz (3.9 kB 查看散列)

上传时间 2023年6月30日 源

构建分发

hanzidentifier-1.2.0-py3-none-any.whl (4.8 kB 查看散列)

上传时间 2023年6月30日 Python 3

散列 for hanzidentifier-1.2.0.tar.gz

散列 for hanzidentifier-1.2.0.tar.gz
算法	散列摘要
SHA256	`8e4198ae87c1da80d77cde46d7e90cb50d1a7561ee8b33e725058a2b0d70e83d`
MD5	`fc0c73e34e87d5f8b8e2630b7ad471a7`
BLAKE2b-256	`b1c61f42864ea272c5497ba78858f6b4082cca37cf4f59b60effdc60273e2c1f`

散列 for hanzidentifier-1.2.0-py3-none-any.whl

散列 for hanzidentifier-1.2.0-py3-none-any.whl
算法	散列摘要
SHA256	`022cbb3aa01ff87b41caa7dbb6e917463a09f399d6d2b9d5499f34d6f6cc1218`
MD5	`ba1d1ef8d3ae0b4e9650de5c19da2dee`
BLAKE2b-256	`c67c1884b2e27fb81fbe429c390e5bde41ea3742c2ce0875fbf0be766d7586a0`

汉字标识符 1.2.0

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

关于

入门指南

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源分发

构建分发

汉字标识符 1.2.0

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

关于

入门指南

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源分发

构建分发

发布历史发布通知 | RSS源