跳转到主要内容

古诺尔斯词典 Zoega

项目描述

PyPI Build Status

古诺尔斯词典 Zoega

Zoëga's A Concise Dictionary of Old Icelandic 解析器

使用 reader.py 模块,您可以

  • 在一个给定的阈值以下搜索一个单词的编辑距离,
  • 提取词典条目中的词性标注,
  • 搜索精确条目和近似条目。

然而,POS标签提取器效率不高。需要处理更多特殊情况。

待办事项列表

  • 在词典中查找一个单词
  • 搜索与查询词最多给定编辑距离的词典中的所有单词
  • 对于一个给定的词典条目,给出所有它的屈折形式(部分完成),
  • 处理更多词典条目,
  • 处理所有条目,以便我们几乎可以得到所有古诺尔斯单词,
  • 对于每个形式,我们可以将词元与一个提议的POS标签相关联。

数据处理

数据来自https://github.com/GreekFellows/lesser-dannatthttp://norroen.info/dct/zoega,由Tim Ermolaev提供。然后启动utils.first_step()。修改文件以确保XML语法一致性,最后启动utils.second_step()

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

zoegas-1.3.1.tar.gz (3.8 MB 查看哈希值)

上传时间 源代码

构建分发

zoegas-1.3.1-py3-none-any.whl (3.8 MB 查看哈希值)

上传时间 Python 3

由以下支持