跳转到主要内容

文本分析工具包KyTea绑定

项目描述

KyTea的Python包装器

Patreon

Mykytea-python是一个KyTea的Python包装器模块,KyTea是一个通用的文本分析工具包。KyTea由KyTea开发团队开发。

有关KyTea的详细信息,请参阅http://www.phontron.com/kytea

安装依赖项

在构建之前,您需要安装KyTea。

要安装Mykytea-python,请运行

pip install kytea

要构建Mykytea-python,请运行(如果您不想使用pip

make

如果您要安装,请运行

sudo make install

如果您在构建时失败,请尝试安装SWIG并运行

swig -c++ -python -I/usr/local/include mykytea.i

或者,如果您在Max OS X上仍然失败,请使用一些变量运行

$ ARCHFLAGS="-arch x86_64" CC=gcc CXX=g++ make

如果您使用clang编译了kytea,则需要ARCHFLAGS。

或者,您可以使用brew安装kytea。

brew install kytea
KYTEA_DIR=$(brew --prefix) make all

如何使用它?

以下是如何使用Mykytea-python的示例代码。

import Mykytea

def showTags(t):
    for word in t:
        out = word.surface + "\t"
        for t1 in word.tag:
            for t2 in t1:
                for t3 in t2:
                    out = out + "/" + str(t3)
                out += "\t"
            out += "\t"
        print(out)

def list_tags(t):
    def convert(t2):
        return (t2[0], type(t2[1]))
    return [(word.surface, [[convert(t2) for t2 in t1] for t1 in word.tag]) for word in t]

# Pass arguments for KyTea as the following:
opt = "-model /usr/local/share/kytea/model.bin"
mk = Mykytea.Mykytea(opt)

s = "今日はいい天気です。"

# Fetch segmented words
for word in mk.getWS(s):
    print(word)

# Show analysis results
print(mk.getTagsToString(s))

# Fetch first best tag
t = mk.getTags(s)
showTags(t)

# Show all tags
tt = mk.getAllTags(s)
showTags(tt)

许可证

MIT许可证

项目详情


下载文件

下载适合您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息

源代码发行版

kytea-0.1.9.tar.gz (73.8 kB 查看散列值)

上传时间 源代码

构建发行版

kytea-0.1.9-cp312-cp312-win_amd64.whl (319.0 kB 查看散列值)

上传时间 CPython 3.12 Windows x86-64

kytea-0.1.9-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (5.6 MB 查看散列值)

上传时间 CPython 3.12 manylinux: glibc 2.17+ x86-64

kytea-0.1.9-cp312-cp312-macosx_11_0_arm64.whl (719.6 kB 查看散列值)

上传时间 CPython 3.12 macOS 11.0+ ARM64

kytea-0.1.9-cp312-cp312-macosx_10_9_x86_64.whl (735.9 kB 查看散列值)

上传时间 CPython 3.12 macOS 10.9+ x86-64

kytea-0.1.9-cp311-cp311-win_amd64.whl (318.4 kB 查看散列值)

上传时间 CPython 3.11 Windows x86-64

kytea-0.1.9-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (5.6 MB 查看散列值)

上传时间 CPython 3.11 manylinux: glibc 2.17+ x86-64

kytea-0.1.9-cp311-cp311-macosx_11_0_arm64.whl (718.8 kB 查看散列值)

上传时间 CPython 3.11 macOS 11.0+ ARM64

kytea-0.1.9-cp311-cp311-macosx_10_9_x86_64.whl (734.6 kB 查看散列值)

上传时间 CPython 3.11 macOS 10.9+ x86-64

kytea-0.1.9-cp310-cp310-win_amd64.whl (318.4 kB 查看散列值)

上传于 CPython 3.10 Windows x86-64

kytea-0.1.9-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (5.6 MB 查看哈希值)

上传于 CPython 3.10 manylinux: glibc 2.17+ x86-64

kytea-0.1.9-cp310-cp310-macosx_11_0_arm64.whl (718.9 kB 查看哈希值)

上传于 CPython 3.10 macOS 11.0+ ARM64

kytea-0.1.9-cp310-cp310-macosx_10_9_x86_64.whl (734.6 kB 查看哈希值)

上传于 CPython 3.10 macOS 10.9+ x86-64

kytea-0.1.9-cp39-cp39-win_amd64.whl (318.4 kB 查看哈希值)

上传于 CPython 3.9 Windows x86-64

kytea-0.1.9-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (5.6 MB 查看哈希值)

上传于 CPython 3.9 manylinux: glibc 2.17+ x86-64

kytea-0.1.9-cp39-cp39-macosx_11_0_arm64.whl (718.8 kB 查看哈希值)

上传于 CPython 3.9 macOS 11.0+ ARM64

kytea-0.1.9-cp39-cp39-macosx_10_9_x86_64.whl (734.6 kB 查看哈希值)

上传于 CPython 3.9 macOS 10.9+ x86-64

kytea-0.1.9-cp38-cp38-win_amd64.whl (318.4 kB 查看哈希值)

上传于 CPython 3.8 Windows x86-64

kytea-0.1.9-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (5.6 MB 查看哈希值)

上传于 CPython 3.8 manylinux: glibc 2.17+ x86-64

kytea-0.1.9-cp38-cp38-macosx_10_9_x86_64.whl (735.0 kB 查看哈希值)

上传于 CPython 3.8 macOS 10.9+ x86-64

由以下支持