跳转到主要内容

Python包装库,用于韩文MeCab-ko形态分析器

项目描述

这是一个Python包装库,用于韩文MeCab-ko形态分析器。它与Python 3.6及更高版本兼容。

对于MeCab-ko,有几个python绑定或包装库的实现,但它们通常维护得不好。
我创建了这个库,站在巨人的肩膀上(像MeCab、mecab-ko和mecab-python3这样的良好维护的开源项目),尽可能地进行最小修改。
最初我将其命名为mecab-ko-python3,因为开发中引用的包名是mecab-python3
这可能显得有些傲慢,但为了减少PyPI中的混淆,将名称更改为'mecab-ko'。
(存储库的名称为'pymecab-ko',以区分原始的mecab-ko

注意:如果使用MacOS Big Sur,由于pip问题,您需要将pip升级到版本20.3或更高版本才能使用wheel。

无需用英语书写issue。

请注意,Windows wheel需要Microsoft Visual C++ Redistributable,因此请确保安装。

基本用法

>>> import mecab_ko as MeCab
>>> tagger = MeCab.Tagger("-Owakati")
>>> tagger.parse("아버지가방에들어가신다").split()
['아버지', '가', '방', '에', '들어가', '신다']

>>> tagger = MeCab.Tagger()
>>> print(tagger.parse("아버지가방에들어가신다"))
아버지  NNG,*,F,아버지,*,*,*,*
      JKS,*,F,,*,*,*,*
      NNG,*,T,,*,*,*,*
      JKB,*,F,,*,*,*,*
들어가  VV,*,F,들어가,*,*,*,*
신다    EP+EC,*,F,신다,Inflect,EP,EC,/EP/*+ㄴ다/EC/*
EOS

pymecab-ko的API紧密遵循MeCab本身的API,即使这使其不太符合“Pythonic”。有关更多信息,请参阅官方MeCab文档

安装

适用于MacOS X、Linux和Windows(64位)的二进制wheel默认安装,当您使用pip时。

pip install mecab-ko

这些轮子包含MeCab-ko库的副本和字典。MeCab-ko有一个独特的字典。mecab-ko-dic在安装pymacab-ko时会自动安装。

使用pip从源码构建

pip install --no-binary :all: mecab-ko

字典

为了使用MeCab-ko,您必须安装一个字典。MeCab-ko提供了2个字典。
以下这些包含了一些便于使用的修改的软件包是推荐的

常见问题

当您尝试运行MeCab时,如果遇到RuntimeError错误,以下是一些需要检查的事项

Windows redistributable

您必须安装此内容才能在Windows上使用此软件包。

指定mecabrc

如果您遇到此错误

error message: [ifs] no such file or directory: /usr/local/etc/mecabrc

您需要指定一个mecabrc文件。指定一个空文件也行,只需它存在即可。您可以使用-r指定mecabrc。这在Debian或Ubuntu上可能是必要的,因为在这些系统中mecabrc位于/etc/mecabrc

您可以这样指定一个空的mecabrc

tagger = MeCab.Tagger('-r/dev/null -d/home/hoge/mydic')

使用不支持的输出模式如-Ochasen

Chasen输出不是MeCab的内置功能,您必须在您的dicrcmecabrc中指定它。值得注意的是,mecab-ko-dic不包含Chasen输出格式。请参阅MeCab文档

替代方案

许可

与MeCab和mebac-python3一样,pymecab-ko是由Taku Kudo taku@chasen.org和日本电信电话公司版权免费软件,并按照3-clause BSD许可证(见文件BSD)分发。或者,它可以按照GNU通用公共许可证,版本2(见文件GPL)或GNU较小通用公共许可证,版本2.1(见文件LGPL)的条款重新分发。

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装软件包的信息。

源分发

mecab-ko-1.0.1.tar.gz (75.9 kB 查看哈希值)

上传时间

构建分发

mecab_ko-1.0.1-cp311-cp311-win_amd64.whl (500.5 kB 查看哈希值)

上传于 CPython 3.11 Windows x86-64

mecab_ko-1.0.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (590.4 kB 查看哈希值)

上传于 CPython 3.11 manylinux: glibc 2.17+ x86-64

mecab_ko-1.0.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (568.8 kB 查看哈希值)

上传于 CPython 3.11 manylinux: glibc 2.17+ ARM64

mecab_ko-1.0.1-cp311-cp311-macosx_10_9_universal2.whl (315.7 kB 查看哈希值)

上传于 CPython 3.11 macOS 10.9+ universal2 (ARM64, x86-64)

mecab_ko-1.0.1-cp310-cp310-win_amd64.whl (500.5 kB 查看哈希值)

上传于 CPython 3.10 Windows x86-64

mecab_ko-1.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (583.2 kB 查看哈希值)

上传于 CPython 3.10 manylinux: glibc 2.17+ x86-64

mecab_ko-1.0.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (561.5 kB 查看哈希值)

上传于 CPython 3.10 manylinux: glibc 2.17+ ARM64

mecab_ko-1.0.1-cp310-cp310-macosx_11_0_x86_64.whl (275.6 kB 查看哈希值)

上传于 CPython 3.10 macOS 11.0+ x86-64

mecab_ko-1.0.1-cp39-cp39-win_amd64.whl (500.5 kB 查看哈希值)

上传于 CPython 3.9 Windows x86-64

mecab_ko-1.0.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (583.1 kB 查看哈希值)

上传于 CPython 3.9 manylinux: glibc 2.17+ x86-64

mecab_ko-1.0.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (561.2 kB 查看哈希值)

上传时间: CPython 3.9 manylinux: glibc 2.17+ ARM64

mecab_ko-1.0.1-cp39-cp39-macosx_11_0_x86_64.whl (275.6 kB 查看哈希值)

上传时间: CPython 3.9 macOS 11.0+ x86-64

mecab_ko-1.0.1-cp38-cp38-win_amd64.whl (500.7 kB 查看哈希值)

上传时间: CPython 3.8 Windows x86-64

mecab_ko-1.0.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (579.4 kB 查看哈希值)

上传时间: CPython 3.8 manylinux: glibc 2.17+ x86-64

mecab_ko-1.0.1-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (556.3 kB 查看哈希值)

上传时间: CPython 3.8 manylinux: glibc 2.17+ ARM64

mecab_ko-1.0.1-cp38-cp38-macosx_10_15_x86_64.whl (275.7 kB 查看哈希值)

上传时间: CPython 3.8 macOS 10.15+ x86-64

mecab_ko-1.0.1-cp37-cp37m-win_amd64.whl (500.6 kB 查看哈希值)

上传时间: CPython 3.7m Windows x86-64

mecab_ko-1.0.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (576.7 kB 查看哈希值)

上传时间: CPython 3.7m manylinux: glibc 2.17+ x86-64

mecab_ko-1.0.1-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (553.1 kB 查看哈希值)

上传时间: CPython 3.7m manylinux: glibc 2.17+ ARM64

mecab_ko-1.0.1-cp37-cp37m-macosx_10_15_x86_64.whl (275.5 kB 查看哈希值)

上传时间: CPython 3.7m macOS 10.15+ x86-64

mecab_ko-1.0.1-cp36-cp36m-win_amd64.whl (510.7 kB 查看哈希值)

上传于 CPython 3.6m Windows x86-64

mecab_ko-1.0.1-cp36-cp36m-macosx_10_14_x86_64.whl (275.3 kB 查看哈希值)

上传于 CPython 3.6m macOS 10.14+ x86-64

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面