预生成的Unicode代码点集合
项目描述
uniset
预生成的Unicode代码点集合
uniset 是一个包含 frozenset 的Unicode代码点(字符)的模块。
API
分类
该模块包括所有Unicode类别和子类别,除了主要类别 "C"(其他)及其子类别 "Co"(私有用途)和 "Cn"(未分配)。
示例
import uniset
# The letter "A" is in category "L" (letters)
assert "A" in uniset.L
# The letter "A" is also in category "Lu" (uppercase letters)
assert "A" in uniset.Lu
空白字符
uniset.WHITESPACE 包含所有Unicode空白字符。 uniset.WHITESPACE 是ASCII空白字符和Unicode类别 "Zs" 的并集。
import uniset
assert " " in uniset.WHITESPACE
标点符号
uniset.PUNCTUATION 包含所有Unicode标点符号。 uniset.PUNCTUATION 是ASCII标点符号和Unicode类别 "P" 的并集。
import uniset
assert "." in uniset.PUNCTUATION
替代方案
unicategories 也提供了对Unicode类别的访问。其实现基于 "范围组" 和迭代器,应该比 uniset 的包含检查更快且更节省内存。
如果您需要 frozenset API(并集、交集等),或者需要Unicode类别之外的集合(空白字符、标点符号),请使用 uniset。否则 unicategories 是更好的选择。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源分布
uniset-0.1.0.tar.gz (324.1 kB 查看哈希值)
构建分布
uniset-0.1.0-py3-none-any.whl (316.5 kB 查看哈希值)
关闭
uniset-0.1.0.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | f352178efdd55061daadbaa0a9492162c0bb67cc31cee73ddb6623df9fe17926 |
|
| MD5 | 3f9964d582cd63db12e71c83c2e88be5 |
|
| BLAKE2b-256 | 3698eb04a7d9fca54f1bd426798a5f541a23ff9e2defd0e8f87dc1976260a83a |
关闭
uniset-0.1.0-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | fa767bfe9f3ea94d0387586bdcb46d313e431ce0d97bb4b31222a663dc60e216 |
|
| MD5 | 6da93c4346b67722039ee76928af21e1 |
|
| BLAKE2b-256 | 281ce8792ec67f120a98cf73edfaffa4f849dc5ed45beea1db90126813c44d90 |