跳转到主要内容

识别俄语文本中的日期和时间。

项目描述

此模块包含一个基本类和简化其使用的函数,用于从俄语文本中提取日期和时间。

安装

sudo pip3 install rutimeparser

使用

以下示例以2017年4月2日为例。

提取日期和时间

>>> from rutimeparser import parse
>>> parse('завтра')
datetime.date(2017, 4, 3)
>>> parse('завтра утром')
datetime.datetime(2017, 4, 3, 9, 0)
>>> parse('Напомни мне завтра утром составить список дел.')
datetime.datetime(2017, 4, 3, 9, 0)

提取与日期和时间无关的文本

>>> from rutimeparser import get_clear_text, get_last_clear_text
>>> get_clear_text('Напомни мне завтра утром составить список дел.')
'напомни мне составить список дел'
>>> get_last_clear_text('Напомни мне завтра утром составить список дел.')
'составить список дел'

隐含情况

  • 早上 - 在09:00

  • 下午 - 在15:00

  • 晚上 - 在21:00

  • 夜里 - 在03:00

  • 下周 - 下周一。

  • 下周 - 正好7天。

  • 下周早上 - 7天早上。

  • 下个月 - 下个月的第一天。

更多示例在tests.py

API参考

rutimeparser.parse的参数

  • words (str, list, tuple) – 文本字符串或单词列表。此参数是可选的,因为可以直接传递给parse方法。

  • tz (str) – 时区名称。如果没有指定,则返回原时区。

  • now (datetime.datetime) – 从哪个时间点开始计算当前时间

  • allowed_results (list, tuple) – parse方法可能返回的对象列表。可能的值 – datetime.datetime, datetime.date, datetime.time, None。

  • default_time (datetime.time) – 默认时间。仅在从文本中只能获取日期但需要返回datetime时使用。默认为09:00。

  • default_datetime (datetime.datetime) – 默认日期和时间。当在文本中找不到适合 allowed_results 的值时,由 parse 方法返回。默认等于参数 now 的值。

待办事项

  • 切换到 pymorphy

  • 添加对AM/PM的支持(例如,“下午两点”)

项目详情


下载文件

下载适用于您平台的应用程序。如果您不确定选择哪一个,请了解有关 安装包 的更多信息。

源分发

rutimeparser-1.1.1.tar.gz (13.9 kB 查看哈希值)

上传时间

构建分发

rutimeparser-1.1.1-py3-none-any.whl (16.1 kB 查看哈希值)

上传时间 Python 3

支持者:

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面