跳转到主要内容

Loomchild segmenter的Python封装

项目描述

loomchild-segment

用于与Java句子分割器接口的Python模块 Loomchild。此包旨在用于 Bifixer 和/或 Bitextor

构建和使用此包的系统依赖项是 MavenJava

安装

此包可以从pypi使用 pip 安装。

pip install loomchild-segment

用法

将文本分割成句子

from loomchild.segmenter import LoomchildSegmenter

segmenter = LoomchildSegmenter(lang)
# segmenting a single line:
segments = segmenter.get_segmentation(input_line)
print("\n".join(segments))

# segmenting a document (i.e. multiple line breaks in the input)
segments = segmenter.get_document_segmentation(input_text)
print("\n".join(segments))

提供了一个命令行工具来处理base64编码的文档。

cat b64encoded_input | py-segment -l $LANG > b64encoded_output

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

loomchild-segment-2.0.4.2.tar.gz (2.4 MB 查看哈希值)

上传时间

构建分布

loomchild_segment-2.0.4.2-py3-none-any.whl (2.4 MB 查看哈希值)

上传时间 Python 3

支持者: