文本分析工具包KyTea绑定
项目描述
KyTea的Python包装器
Mykytea-python是一个KyTea的Python包装器模块,KyTea是一个通用的文本分析工具包。KyTea由KyTea开发团队开发。
有关KyTea的详细信息,请参阅http://www.phontron.com/kytea
安装依赖项
在构建之前,您需要安装KyTea。
要安装Mykytea-python,请运行
pip install kytea
要构建Mykytea-python,请运行(如果您不想使用pip
)
make
如果您要安装,请运行
sudo make install
如果您在构建时失败,请尝试安装SWIG并运行
swig -c++ -python -I/usr/local/include mykytea.i
或者,如果您在Max OS X上仍然失败,请使用一些变量运行
$ ARCHFLAGS="-arch x86_64" CC=gcc CXX=g++ make
如果您使用clang编译了kytea,则需要ARCHFLAGS。
或者,您可以使用brew安装kytea。
brew install kytea
KYTEA_DIR=$(brew --prefix) make all
如何使用它?
以下是如何使用Mykytea-python的示例代码。
import Mykytea
def showTags(t):
for word in t:
out = word.surface + "\t"
for t1 in word.tag:
for t2 in t1:
for t3 in t2:
out = out + "/" + str(t3)
out += "\t"
out += "\t"
print(out)
def list_tags(t):
def convert(t2):
return (t2[0], type(t2[1]))
return [(word.surface, [[convert(t2) for t2 in t1] for t1 in word.tag]) for word in t]
# Pass arguments for KyTea as the following:
opt = "-model /usr/local/share/kytea/model.bin"
mk = Mykytea.Mykytea(opt)
s = "今日はいい天気です。"
# Fetch segmented words
for word in mk.getWS(s):
print(word)
# Show analysis results
print(mk.getTagsToString(s))
# Fetch first best tag
t = mk.getTags(s)
showTags(t)
# Show all tags
tt = mk.getAllTags(s)
showTags(tt)
许可证
MIT许可证
项目详情
下载文件
下载适合您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。
源代码发行版
kytea-0.1.9.tar.gz (73.8 kB 查看散列值)
构建发行版
kytea-0.1.9-cp312-cp312-win_amd64.whl (319.0 kB 查看散列值)
kytea-0.1.9-cp311-cp311-win_amd64.whl (318.4 kB 查看散列值)
kytea-0.1.9-cp310-cp310-win_amd64.whl (318.4 kB 查看散列值)
kytea-0.1.9-cp39-cp39-win_amd64.whl (318.4 kB 查看哈希值)
kytea-0.1.9-cp39-cp39-macosx_11_0_arm64.whl (718.8 kB 查看哈希值)
kytea-0.1.9-cp38-cp38-win_amd64.whl (318.4 kB 查看哈希值)
关闭
kytea-0.1.9.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 5fa4adcbfef89d2001209eb8bdda9da2e97fa41932371fa959b1df5a51cdeffb |
|
MD5 | 6600184b62c34182a8005c74e1f63cc4 |
|
BLAKE2b-256 | bd923a987ebc15180fdc8f69bf774ea9007e8f063949b229a432524e5aeed019 |
关闭
kytea-0.1.9-cp312-cp312-win_amd64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | d70f0842e18fb4843d8fed4ac205b8ab0a68fe2e956022e793f052c0de71da88 |
|
MD5 | cab693c3326786d3a7e2b61556896e77 |
|
BLAKE2b-256 | 3a25f8d1f0d4b82f5b84ce30d9ff94c37f9f19c4d0508661d178c4d8571ea447 |
关闭
kytea-0.1.9-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 74306286b07a8edbf2dd241b432c5ccd5dd3b53d8bf3562e4c79f78cb1d65451 |
|
MD5 | eed00d29dec296bf76c80926681a8691 |
|
BLAKE2b-256 | 033a7a5dca364fd7e0e5988b4264b1708292050ed7c0916336032f306d2928e7 |
关闭
kytea-0.1.9-cp312-cp312-macosx_11_0_arm64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 014cf34abac9e770a15fbd920f85bd15c32c63c1f2f0a40b76cfe8657ed55f39 |
|
MD5 | 92b80fab74044a56f8da138c9a9b1f62 |
|
BLAKE2b-256 | ffb93aebf98bf0e59fe5a154e4562563be613f9ac776ca241c01e3622afe6eeb |
关闭
kytea-0.1.9-cp312-cp312-macosx_10_9_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 378ed3d7d3e2f0d2f5e77ae78d443dec46f56bf593ac27ff3265f130a380fdd7 |
|
MD5 | 29f0f54985d36a848d57bedb4c9bb0f9 |
|
BLAKE2b-256 | 0e13af5cf0578ba422d245fae1837d858d80d216a05bcf2373c75a764f95b374 |
关闭
kytea-0.1.9-cp311-cp311-win_amd64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 23d4689686e7aaca0bd22ebb19b7fc446c78b57ee6e3d0d63dd7c6c8f67f42ba |
|
MD5 | 643647751b0da16d03141e5193dca562 |
|
BLAKE2b-256 | fc2c87027a748f59a182bf79a04a4aa59d1500e99c9f9a2c76bfb3abcebf1a91 |
关闭
kytea-0.1.9-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | db8cb83ef686a1a0eee449181b89ef4ed135e83570f8e29b5a1b42d712a74f6a |
|
MD5 | a1361f8de863313dba24c65ea9d297d0 |
|
BLAKE2b-256 | ec98744859e55f69255259eb7875d5262942030697688844743c06a08f458cd5 |
关闭
kytea-0.1.9-cp311-cp311-macosx_11_0_arm64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 49eda67543990e32b9122e32c5ea81cc21236ae4282b4c5da9993468f6f88341 |
|
MD5 | cbe66f02283f6cd04ed6e42ba3fff1e8 |
|
BLAKE2b-256 | eac35b70cd3b742ac2e8aefd17746d967e58a512cc091fc888196f242c2d8b01 |
关闭
kytea-0.1.9-cp311-cp311-macosx_10_9_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | fa207edd3902ce28256cfbbd91ede2ae710190c785dd8ccd2a6884f5b59b123b |
|
MD5 | 6b32ca2239dcfd679836afffb9da6859 |
|
BLAKE2b-256 | 232d764b507bef505aebb9ea00a3c79a10cee1b6e633e227b01816d7394318a6 |
关闭
kytea-0.1.9-cp310-cp310-win_amd64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 64d4f3043ec234a779d07c177e3a6b836129cc9251eababa3e320e657f01c472 |
|
MD5 | 5f58995ba29a97ea3311d144b7da12d5 |
|
BLAKE2b-256 | 4efb3bcbf7f2c197e7bba828a680c8846bd4f350933f9d3922ec983a836b7c89 |
关闭
kytea-0.1.9-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6becfbdd939cf500c7322540e3eb7c219a5a1400b9326cdfd2d1c2fc54b2425c |
|
MD5 | f2fbfbd0d27e79876548540079be4a4d |
|
BLAKE2b-256 | 82db9ddf6be5e616c6c34a0d24cdbdec719a6c8129f71141f32dc935636e3e54 |
关闭
kytea-0.1.9-cp310-cp310-macosx_11_0_arm64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 8ab77065bbb75e8eece79c4cc342dcf1364ea493540e46fd89c0e8123b9ea559 |
|
MD5 | 82dd8457d955af344650effb466f9211 |
|
BLAKE2b-256 | 36161a299f969d3e85ea1c0bd96f5c47f798184dfb95a42711780e71fe5b72c9 |
关闭
kytea-0.1.9-cp310-cp310-macosx_10_9_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 122e0665aad9f064c12df0da1f7d7be15f700d97c32be9fd7916d7bbcf454ec0 |
|
MD5 | 5d76b2f7c84ad2124c1d31d786018884 |
|
BLAKE2b-256 | 316b64118f7eefa1d94ba7599d7521e7a2a05856b5857b36a6f978c9ec9f9222 |
关闭
kytea-0.1.9-cp39-cp39-win_amd64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 991f934a917e64673822cc35a43e3175626cc37e1bf3a3668691dceb1808557d |
|
MD5 | 95b8f7b1479f40e407101a97d19990aa |
|
BLAKE2b-256 | 564befcc276897347c7b1ca408a4a5f7cc1e575e82f3373ad818148e15d9bf45 |
关闭
哈希值 用于 kytea-0.1.9-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 342b7a1fc24f3b5ecbfe1d5fa7b77936dabd15ddf2ff806f88ecd2de379c8be4 |
|
MD5 | dd0609a0e337b9849d8ef9dbb1ad2ee8 |
|
BLAKE2b-256 | 95caf3687403db9d44acfc46ba968518d73570cb7d7215e09d5b2f4501d8cf44 |
关闭
哈希值 用于 kytea-0.1.9-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b399c866302e5fd117db7526bd1da2f29cf1fc7cc6808a07c8b10b349fc6a878 |
|
MD5 | c358dc5df1e5bccd489f0bf1fab44da7 |
|
BLAKE2b-256 | 551af5f345ae607085b9d71d017c37bbb21455952ba1fce8e50ec1355464873b |