Loomchild segmenter的Python封装
项目描述
loomchild-segment
用于与Java句子分割器接口的Python模块 Loomchild。此包旨在用于 Bifixer 和/或 Bitextor
构建和使用此包的系统依赖项是 Maven
和 Java
。
安装
此包可以从pypi使用 pip
安装。
pip install loomchild-segment
用法
将文本分割成句子
from loomchild.segmenter import LoomchildSegmenter
segmenter = LoomchildSegmenter(lang)
# segmenting a single line:
segments = segmenter.get_segmentation(input_line)
print("\n".join(segments))
# segmenting a document (i.e. multiple line breaks in the input)
segments = segmenter.get_document_segmentation(input_text)
print("\n".join(segments))
提供了一个命令行工具来处理base64编码的文档。
cat b64encoded_input | py-segment -l $LANG > b64encoded_output
项目详情
关闭
loomchild-segment-2.0.4.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1072e46d5b67213a0ba7b7dc34696314d519a8cca324351339bb8932f326ac5a |
|
MD5 | bd9d19440032aa54b009af15334c23ab |
|
BLAKE2b-256 | 2d37678ae76034b5e6ecbb0e4ba3c05529efe1f87430f6a71383654105a04b24 |
关闭
loomchild_segment-2.0.4.2-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e8fd559325cf829592a92c96b331adef51d209a1a7101688ab3edecb88557bb6 |
|
MD5 | 48ecc92f4a1b3036e5551795d31de160 |
|
BLAKE2b-256 | c083708a3616bfe5b1d70c89a1768f5f9e98fd942a91881289804b27cddd69a4 |