Python包装库,用于韩文MeCab-ko形态分析器
项目描述
这是一个Python包装库,用于韩文MeCab-ko形态分析器。它与Python 3.6及更高版本兼容。
对于MeCab-ko,有几个python绑定或包装库的实现,但它们通常维护得不好。
我创建了这个库,站在巨人的肩膀上(像MeCab、mecab-ko和mecab-python3这样的良好维护的开源项目),尽可能地进行最小修改。
最初我将其命名为mecab-ko-python3
,因为开发中引用的包名是mecab-python3,
这可能显得有些傲慢,但为了减少PyPI中的混淆,将名称更改为'mecab-ko'。
(存储库的名称为'pymecab-ko',以区分原始的mecab-ko)
注意:如果使用MacOS Big Sur,由于pip问题,您需要将pip升级到版本20.3或更高版本才能使用wheel。
无需用英语书写issue。
请注意,Windows wheel需要Microsoft Visual C++ Redistributable,因此请确保安装。
基本用法
>>> import mecab_ko as MeCab
>>> tagger = MeCab.Tagger("-Owakati")
>>> tagger.parse("아버지가방에들어가신다").split()
['아버지', '가', '방', '에', '들어가', '신다']
>>> tagger = MeCab.Tagger()
>>> print(tagger.parse("아버지가방에들어가신다"))
아버지 NNG,*,F,아버지,*,*,*,*
가 JKS,*,F,가,*,*,*,*
방 NNG,*,T,방,*,*,*,*
에 JKB,*,F,에,*,*,*,*
들어가 VV,*,F,들어가,*,*,*,*
신다 EP+EC,*,F,신다,Inflect,EP,EC,시/EP/*+ㄴ다/EC/*
EOS
pymecab-ko
的API紧密遵循MeCab本身的API,即使这使其不太符合“Pythonic”。有关更多信息,请参阅官方MeCab文档。
安装
适用于MacOS X、Linux和Windows(64位)的二进制wheel默认安装,当您使用pip
时。
pip install mecab-ko
这些轮子包含MeCab-ko库的副本和字典。MeCab-ko有一个独特的字典。mecab-ko-dic
在安装pymacab-ko时会自动安装。
使用pip从源码构建
pip install --no-binary :all: mecab-ko
字典
为了使用MeCab-ko,您必须安装一个字典。MeCab-ko提供了2个字典。
以下这些包含了一些便于使用的修改的软件包是推荐的
- mecab-ko-dic:基于ipadic-py的预构建mecab-ko-dic 2.1.1-20180720。它将和pymecab-ko一起安装。
- openkorpos-dic:使用OpenKorPOS(Sejong语料库的免费和开源替代品)训练的字典
常见问题
当您尝试运行MeCab时,如果遇到RuntimeError
错误,以下是一些需要检查的事项
Windows redistributable
您必须安装此内容才能在Windows上使用此软件包。
指定mecabrc
如果您遇到此错误
error message: [ifs] no such file or directory: /usr/local/etc/mecabrc
您需要指定一个mecabrc
文件。指定一个空文件也行,只需它存在即可。您可以使用-r
指定mecabrc
。这在Debian或Ubuntu上可能是必要的,因为在这些系统中mecabrc
位于/etc/mecabrc
。
您可以这样指定一个空的mecabrc
tagger = MeCab.Tagger('-r/dev/null -d/home/hoge/mydic')
使用不支持的输出模式如-Ochasen
Chasen输出不是MeCab的内置功能,您必须在您的dicrc
或mecabrc
中指定它。值得注意的是,mecab-ko-dic不包含Chasen输出格式。请参阅MeCab文档。
替代方案
- python-mecab-ko是MeCab-ko的Python绑定
- mecab-python-msvc是适用于mebac-ko-msvc的mebac-python
- KoNLPy是一个包含MeCab包装器的韩语NLP库
许可
与MeCab和mebac-python3一样,pymecab-ko
是由Taku Kudo taku@chasen.org和日本电信电话公司版权免费软件,并按照3-clause BSD许可证(见文件BSD
)分发。或者,它可以按照GNU通用公共许可证,版本2(见文件GPL
)或GNU较小通用公共许可证,版本2.1(见文件LGPL
)的条款重新分发。
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装软件包的信息。
源分发
构建分发
meiac_ko-1.0.1.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 39363e184bb76806a9781b25a233846e4ba7e877cba0f3b4aa2f15a6057564e5 |
|
MD5 | ef783fe7202d7937ebffbe8a39443f19 |
|
BLAKE2b-256 | fe824eabdb6e2c1ee181679506deb3293e510df57e9cd68ab3e50c26446d7594 |
meiac_ko-1.0.1-cp311-cp311-win_amd64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 016ffa232cd40c82bebeeaaae74050f7901f586e52b44c056ca2928168022f04 |
|
MD5 | 2a556a4f390e6fcbbc3669e140068a1f |
|
BLAKE2b-256 | 16f0f580e3ebf94b98c0f5cd42a9eada0760e59f6382677b125f8b021e58fc9d |
meiac_ko-1.0.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4cdcf1568f29814d1c68af7f38f9d6bb566ea65497136ec0e207eb063d46cc67 |
|
MD5 | b5469512b71b5fba580872b71bb4643f |
|
BLAKE2b-256 | 830abf50834de0ee589f7ec7c47980ff7dfa296eb516f812d5ab2ef4cf78e021 |
meiac_ko-1.0.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 07fb4b1a95135f2d12156719af712f98405976862f5b98c164a368f512b395dc |
|
MD5 | 0bae21699f884a852884318f055fe462 |
|
BLAKE2b-256 | 9d57354dc8589763302212b4b3500522c592de998229b5a961aa457d0a465eeb |
meiac_ko-1.0.1-cp311-cp311-macosx_10_9_universal2.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c345ecf7005bc7bbd1f57cc17cb7a047e3d1e59269625d4c6fc60120000233da |
|
MD5 | 4a8c170356dec0081db1eaaf53b0c55a |
|
BLAKE2b-256 | 18c62551530685a1afbd4be7848ca0830c5f0f0846f69b9cd7101ccdf424bffa |
meiac_ko-1.0.1-cp310-cp310-win_amd64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | ab92f6a4601d76500d3aff34bfd19f181dcab493ae481eaca42265e9aa5b74ad |
|
MD5 | 2cc92ebe3b27353fcb5cb430d62d99a2 |
|
BLAKE2b-256 | 446c1ca8cd727ee07ac1e8cd0dff49fa879730c333e576e6b41f65f551d20a5d |
meiac_ko-1.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 16a762171d41afa0d937fad13428b07d8d6f677ea52c185d0a73f02e6dba5988 |
|
MD5 | a6aa27441782a3d03c7652135cd98e76 |
|
BLAKE2b-256 | 93a481f845502f5e1b57aa3ad3affa7d99d85e1ad6501a6610f6072ea4a37566 |
meiac_ko-1.0.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 91e037e2be3b4d61496d0546f68fa7eef745bc7ca645c41d0a4c0bb88d6ac836 |
|
MD5 | e42cc03ad36c2dc5ee63edc3fb986c19 |
|
BLAKE2b-256 | 013c8157a7881190260d2d58ffaa0e3c0b36348679377001ff50be3806296f49 |
meiac_ko-1.0.1-cp310-cp310-macosx_11_0_x86_64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 453aa072bb42e982391fa8c7b07d262346d09aa3552dc2d1c50986cdd341a12a |
|
MD5 | f1e9ebfabd7a74860747895869830f99 |
|
BLAKE2b-256 | 4bba599a9815a161ae66bea29ee058cabbf2b1ce32e2828f9c84fd0acbcc073a |
meiac_ko-1.0.1-cp39-cp39-win_amd64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e19367e157c9cd912cbf9bbbb93fddb07f38a636d1c1364eda878ebe7f52d94d |
|
MD5 | e8bbaabb055ef0edb57666d43fffbf40 |
|
BLAKE2b-256 | c63af7965ed0d3848d6292f0c3ecf0d05138fdcd3e71b283cafd1989cea8f793 |
哈希值 用于 mecab_ko-1.0.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | bbc6f0fa30dcfded65e65c6295a6cbd1a6a7f2ba33f710ac3e4921361c3623f7 |
|
MD5 | 912b3878b98e6f6f4d4e210889fbf436 |
|
BLAKE2b-256 | b041c23d56282c7b57abef12d7760158a867a93663a2fbd7ca69cda208210498 |
哈希值 用于 mecab_ko-1.0.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4d0675359d82a26e381441376a1400e87144f1ca1180046df91a48261077e248 |
|
MD5 | 8da4cae41c7d1581aaf86caba1edeeae |
|
BLAKE2b-256 | 67ea290760aa4f65a0f3d09a07b4624813e348415a2da8f8a64b4742bc650219 |
哈希值 用于 mecab_ko-1.0.1-cp39-cp39-macosx_11_0_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | ec5029cafeaf684c8d16a37038eadc1fdbfa8daf96c49583801ec7b9859ed27d |
|
MD5 | c3854f33c53185aaa5912a64faf870ae |
|
BLAKE2b-256 | 9097d317aa5d4a0e923c3d7d5b6869e9853c3103ed6a2ceb8e3163c9da7b2701 |
哈希值 用于 mecab_ko-1.0.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a6c55cf3079e0578aec0e29a72aa1d21125a119dbf7cd57059b01b2523fe26cf |
|
MD5 | 7bca04798d4e8002ab48ab7745510c5c |
|
BLAKE2b-256 | 8e529fc11aca449360ebbe747b89e44725a65a5755b20c33dd1e251865ab42c7 |
哈希值 用于 mecab_ko-1.0.1-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | eb10a7e1da1e66a16798d3d96d7c4b52c1290e57c8d38922b0f6f72ddc3915bc |
|
MD5 | 4e3bd6315ef7ea3d29023ea92e824020 |
|
BLAKE2b-256 | b627ca1de908b5ed46b13a4349a6675d274aadb83ca57005fd8fbbdc19cdbb53 |
哈希值 用于 mecab_ko-1.0.1-cp38-cp38-macosx_10_15_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1f4172ed0cee3615ef6f93312e344e39e4424622191253bc9483b7cc7dff98e9 |
|
MD5 | e8987b7310182ce9295aa3a439d6f036 |
|
BLAKE2b-256 | 19c7e0f0c8ebb6d593d8cd5800e82be1986024581bf1d0d6ce0b91cb79c99295 |
哈希值 用于 mecab_ko-1.0.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b380495c4f43306b9f6fa8e030d2d86286ce75c364c84393e7d5043f7093a5b2 |
|
MD5 | accfd4a341b63be94ceed00dade90dbc |
|
BLAKE2b-256 | d954a56f3e32789b4dd56ba2055cf78f4f7d19e5657a3c691bd789f18c73d36d |
哈希值 用于 mecab_ko-1.0.1-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | ee71ad251c57526af54cf005b2803e1df3e0ffe8b350464d8f75f936e2470087 |
|
MD5 | 5b8cb8cc37072d485bd59221e8e19561 |
|
BLAKE2b-256 | 39970dc413ed4ae546784cd649d002f8356602dfcde74c2357bbee22a74c3b80 |
哈希值 用于 mecab_ko-1.0.1-cp37-cp37m-macosx_10_15_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | dd19106d5f9ea1b5ee847ed56d0bddd261685e10b15db852848bfd233c9ae579 |
|
MD5 | 69a2fa2ecd3e991a6a86fa319575c3f5 |
|
BLAKE2b-256 | 098e186b080a6f0e2bda63be129aba83f6e96ff7cdb97aead38f9a716a388d5f |
哈希值 用于 mecab_ko-1.0.1-cp36-cp36m-macosx_10_14_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | cdc9d64e92bfb415f8c1e695a6dd1287b4c4a9e8a455b0d15dadffd33ce7d115 |
|
MD5 | 087ca3b2d7c90995d74fc6d194cb3724 |
|
BLAKE2b-256 | a18d6e0a70d721a329d7924df118fdb6c6b35665d00a81794267ee2d2480fdd1 |