MREP: 词素正则表达式打印器
项目描述
MREP是一个词素序列的正则表达式匹配器。您可以找到与给定模式匹配的词素子序列,例如名词序列。
需求
Python >=2.7
mecab-python ( https://github.com/SamuraiT/mecab-python3 )
安装
$ pip install mrep
如果您没有MeCab的字典,请安装unidic-lite。
$ pip install unidic-lite
如果您想从其源安装,请使用setup.py。
$ python setup.py install
用法
usage: mrep [-h] [-o] [--color {never,auto,always}] [-n] [--mecab-arg MECAB_ARG] PATTERN [FILE [FILE ...]]
- 位置参数
- PATTERN:
模式
- FILE:
数据文件
- 可选参数
- -h, --help
显示此帮助信息并退出
- -o, --only-matching
仅打印匹配项
- --color COLOR
颜色模式。选择“从不”,“自动”和“始终”。(默认:自动)
- -n, --line-number
显示行号
- --mecab-arg MECAB_ARG
传递给MeCab的参数(例如:“-r /path/to/resource/file”)
模式
- .
匹配所有词素
- <surface=XXX>
匹配表面为XXX的词素
- <pos=XXX>
匹配POS为XXX的词素
- <feature=XXX>
匹配特征为XXX的词素
- <feature=~XXX>
匹配与正则表达式模式XXX匹配的特征
- X*
匹配模式X的重复
- X|Y
匹配X或Y
- (X)
匹配X
示例
- <pos=名詞>
匹配名词
- <pos=名詞>*
匹配名词的重复
- <pos=名詞>*<pos=助詞>
匹配名词和助词的重复
- (<pos=名詞>|<pos=動詞>)*
匹配名词或动词的重复
许可证
本程序遵循MIT许可证分发。
版权
(c) 2014, Yuya Unno。
项目详情
关闭
mrep-0.2.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 18afbfe2e9ca11c0b80f5e0a55e346187c3f9ca9d5250f3ec0d114a39e09a6d8 |
|
MD5 | 2a538ec62344609c36d6bbe22f1a3993 |
|
BLAKE2b-256 | e37792f96f89e0aa6eae318b32bf85ce327e23ef1e095c49541853d7c6d7fd5b |