Invenio模块,用于与Grobid API交互以提取元数据。
项目描述
Invenio模块,用于从PDF提取元数据并与Grobid API交互。
免费软件:GPLv2许可证
这是一个实验性的开发者预览版。
特性
此模块提供一个界面,用于将PDF上传到Grobid实例,并允许将提取的元数据提交到可配置的回调。
注意:此软件包假设您已设置本地Grobid REST服务。有关更多信息,请参阅官方Grobid文档。
安装
pip install invenio-grobid
请注意,您还需要一个正在运行的Grobid REST服务。
配置
将 invenio_grobid 软件包添加到您的 overlay/config.py 中的 Invenio PACKAGES 配置中,以便由 Invenio 应用程序加载器获取。
使用 GROBID_HOST 配置您的 Grobid REST 服务的URL。
inveniomanage config set GROBID_HOST 'http://localhost:8080'
如果您想更改提取后的标准上传处理程序,请更新 GROBID_RESULT_HANDLER。
inveniomanage config set GROBID_RESULT_HANDLER 'my_overlay.grobid:upload_handler'
使用
上传界面默认位于 /grobid 端点下。例如, http://localhost:4000/grobid
选择一个PDF以从中提取元数据,然后点击 上传。
稍等片刻,元数据将显示出来。
点击提交按钮,将元数据推送到您的GROBID_RESULT_HANDLER
特别感谢Joseph Boyd (@jcboyd) 和Gilles Louppe (@glouppe) 对Grobid的支持。
祝您编程愉快,感谢您使用Invenio Grobid。
INSPIRE开发团队
变更
版本0.1.0(发布日期2015-10-09)
首次公开发布。
项目详情
关闭
invenio-grobid-0.2.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a09043471739abb6af1eb1568ecc5c4318b16689f0159c5bc50bd73c0e98297e |
|
MD5 | da82cd01616b21f34d79f54d270735b4 |
|
BLAKE2b-256 | 7ac16fd6cb7be68ee3e60128de437f6f67d3565c3d97a21bfbf158bf9031730e |