预生成的Unicode代码点集合
项目描述
uniset
预生成的Unicode代码点集合
uniset
是一个包含 frozenset
的Unicode代码点(字符)的模块。
API
分类
该模块包括所有Unicode类别和子类别,除了主要类别 "C"(其他)及其子类别 "Co"(私有用途)和 "Cn"(未分配)。
示例
import uniset
# The letter "A" is in category "L" (letters)
assert "A" in uniset.L
# The letter "A" is also in category "Lu" (uppercase letters)
assert "A" in uniset.Lu
空白字符
uniset.WHITESPACE
包含所有Unicode空白字符。 uniset.WHITESPACE
是ASCII空白字符和Unicode类别 "Zs" 的并集。
import uniset
assert " " in uniset.WHITESPACE
标点符号
uniset.PUNCTUATION
包含所有Unicode标点符号。 uniset.PUNCTUATION
是ASCII标点符号和Unicode类别 "P" 的并集。
import uniset
assert "." in uniset.PUNCTUATION
替代方案
unicategories
也提供了对Unicode类别的访问。其实现基于 "范围组" 和迭代器,应该比 uniset
的包含检查更快且更节省内存。
如果您需要 frozenset
API(并集、交集等),或者需要Unicode类别之外的集合(空白字符、标点符号),请使用 uniset
。否则 unicategories
是更好的选择。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源分布
uniset-0.1.0.tar.gz (324.1 kB 查看哈希值)
构建分布
uniset-0.1.0-py3-none-any.whl (316.5 kB 查看哈希值)
关闭
uniset-0.1.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f352178efdd55061daadbaa0a9492162c0bb67cc31cee73ddb6623df9fe17926 |
|
MD5 | 3f9964d582cd63db12e71c83c2e88be5 |
|
BLAKE2b-256 | 3698eb04a7d9fca54f1bd426798a5f541a23ff9e2defd0e8f87dc1976260a83a |
关闭
uniset-0.1.0-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | fa767bfe9f3ea94d0387586bdcb46d313e431ce0d97bb4b31222a663dc60e216 |
|
MD5 | 6da93c4346b67722039ee76928af21e1 |
|
BLAKE2b-256 | 281ce8792ec67f120a98cf73edfaffa4f849dc5ed45beea1db90126813c44d90 |