跳转到主要内容

Invenio模块,用于与Grobid API交互以提取元数据。

项目描述

https://img.shields.io/travis/inspirehep/invenio-grobid.svg https://img.shields.io/coveralls/inspirehep/invenio-grobid.svg https://img.shields.io/github/tag/inspirehep/invenio-grobid.svg https://img.shields.io/pypi/dm/invenio-grobid.svg https://img.shields.io/github/license/inspirehep/invenio-grobid.svg

Invenio模块,用于从PDF提取元数据并与Grobid API交互。

这是一个实验性的开发者预览版。

特性

此模块提供一个界面,用于将PDF上传到Grobid实例,并允许将提取的元数据提交到可配置的回调。

注意:此软件包假设您已设置本地Grobid REST服务。有关更多信息,请参阅官方Grobid文档。

安装

pip install invenio-grobid

请注意,您还需要一个正在运行的Grobid REST服务

配置

invenio_grobid 软件包添加到您的 overlay/config.py 中的 Invenio PACKAGES 配置中,以便由 Invenio 应用程序加载器获取。

使用 GROBID_HOST 配置您的 Grobid REST 服务的URL。

inveniomanage config set GROBID_HOST 'http://localhost:8080'

如果您想更改提取后的标准上传处理程序,请更新 GROBID_RESULT_HANDLER

inveniomanage config set GROBID_RESULT_HANDLER 'my_overlay.grobid:upload_handler'

使用

上传界面默认位于 /grobid 端点下。例如, http://localhost:4000/grobid

  • 选择一个PDF以从中提取元数据,然后点击 上传

  • 稍等片刻,元数据将显示出来。

  • 点击提交按钮,将元数据推送到您的GROBID_RESULT_HANDLER

特别感谢Joseph Boyd (@jcboyd) 和Gilles Louppe (@glouppe) 对Grobid的支持。

祝您编程愉快,感谢您使用Invenio Grobid。

变更

版本0.1.0(发布日期2015-10-09)

  • 首次公开发布。

项目详情


下载文件

下载适合您平台的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。

源分发

invenio-grobid-0.2.0.tar.gz (239.2 kB 查看哈希值)

上传时间:

支持者