跳转到主要内容

预生成的Unicode代码点集合

项目描述

Build Status codecov.io PyPI version

uniset

预生成的Unicode代码点集合

uniset 是一个包含 frozenset 的Unicode代码点(字符)的模块。

API

分类

该模块包括所有Unicode类别和子类别,除了主要类别 "C"(其他)及其子类别 "Co"(私有用途)和 "Cn"(未分配)。

示例

import uniset

# The letter "A" is in category "L" (letters)
assert "A" in uniset.L
# The letter "A" is also in category "Lu" (uppercase letters)
assert "A" in uniset.Lu

空白字符

uniset.WHITESPACE 包含所有Unicode空白字符。 uniset.WHITESPACE 是ASCII空白字符和Unicode类别 "Zs" 的并集。

import uniset

assert " " in uniset.WHITESPACE

标点符号

uniset.PUNCTUATION 包含所有Unicode标点符号。 uniset.PUNCTUATION 是ASCII标点符号和Unicode类别 "P" 的并集。

import uniset

assert "." in uniset.PUNCTUATION

替代方案

unicategories 也提供了对Unicode类别的访问。其实现基于 "范围组" 和迭代器,应该比 uniset 的包含检查更快且更节省内存。

如果您需要 frozenset API(并集、交集等),或者需要Unicode类别之外的集合(空白字符、标点符号),请使用 uniset。否则 unicategories 是更好的选择。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

uniset-0.1.0.tar.gz (324.1 kB 查看哈希值)

上传时间

构建分布

uniset-0.1.0-py3-none-any.whl (316.5 kB 查看哈希值)

上传时间 Python 3

支持者

AWSAWS 云计算和安全赞助商 DatadogDatadog 监控 FastlyFastly CDN GoogleGoogle 下载分析 MicrosoftMicrosoft PSF赞助商 PingdomPingdom 监控 SentrySentry 错误日志 StatusPageStatusPage 状态页面