Python的常见自然语言处理任务
项目描述
Semantic是一个Python库,可以从文本中提取语义信息,包括日期、数字、数学方程式和单位转换。
对于这四种语义类型中的每一种,semantic都提供了一个服务模块。典型用法通常如下所示
#!/usr/bin/env python from semantic.dates import DateService service = DateService() date = service.extractDate("On March 3 at 12:15pm...") ...
完整文档可以在此处找到,而源代码本身也可以在GitHub上找到。
安装
安装semantic很简单
$ pip install semantic
特性
semantic包含四个主要模块,每个模块对应一个不同的语义提取器。
日期 (date.py)
适用范围
从文本片段中提取相对日期(例如,“一周后”)和绝对日期(例如,“2013年12月11日”)。
将日期对象转换为人类可读的表述。
数字 (number.py)
适用范围
从文本片段中提取数字(整数或浮点数)。
将数字转换为人类可读的字符串。
示例用法
#!/usr/bin/env python from semantic.numbers import NumberService service = NumberService() print service.parse("Two hundred and six") # 206 print service.parse("Five point one five") # 5.15 print service.parse("Eleven and two thirds") # 11.666666666666666 print service.parseMagnitude("7e-05") # "seven to the negative five"
数学 (solver.py)
用于执行以文字表达的数学运算。
示例用法
#!/usr/bin/env python from semantic.solver import MathService service = MathService() print service.parseEquation("Log one hundred and ten") # 4.70048
单位 (units.py)
用于在以文字表示的单位之间进行转换。
示例用法
#!/usr/bin/env python from semantic.solver import ConversionService service = ConversionService() print service.convert("Seven and a half kilograms to pounds") # (16.534, 'lbs') print service.convert("Seven and a half pounds per square foot to kilograms per meter squared") # (36.618, 'kg/m**2')
测试
测试套件(test.py)包含四个模块的大量示例和用例。
要求
日期、数字和数学模块可以独立运行(即,无需任何依赖项),而单位模块需要quantities和Numpy。
许可
MIT © Charles Marsh
项目详情
关闭
semantic-1.0.3.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | bbc47dad03dddb1ba5895612fdfa1e43cfb3c497534976cebacd4f3684b505b4 |
|
MD5 | 78a150190e3e7d0f6f357b4c828e5f0d |
|
BLAKE2b-256 | 0e0c3673f66b77b06aedb3df7ff1166cf34e0e7fceed86a343b3e75283e2b687 |