用于提取学术交流中使用的引用的小型库。
项目描述
关于
一个小型库,用于提取学术交流中使用的引用。
安装
$ pip install refextract
用法
从出版物引用中获取结构化信息
>>> from refextract import extract_journal_reference
>>> reference = extract_journal_reference('J.Phys.,A39,13445')
>>> print(reference)
{
'extra_ibids': [],
'is_ibid': False,
'misc_txt': u'',
'page': u'13445',
'title': u'J. Phys.',
'type': 'JOURNAL',
'volume': u'A39',
'year': '',
}
从PDF中提取引用
>>> from refextract import extract_references_from_file
>>> references = extract_references_from_file('1503.07589.pdf')
>>> print(references[0])
{
'author': [u'F. Englert and R. Brout'],
'doi': [u'doi:10.1103/PhysRevLett.13.321'],
'journal_page': [u'321'],
'journal_reference': [u'Phys. Rev. Lett. 13 (1964) 321'],
'journal_title': [u'Phys. Rev. Lett.'],
'journal_volume': [u'13'],
'journal_year': [u'1964'],
'linemarker': [u'1'],
'raw_ref': [u'[1] F. Englert and R. Brout, \u201cBroken symmetry and the mass of gauge vector mesons\u201d, Phys. Rev. Lett. 13 (1964) 321, doi:10.1103/PhysRevLett.13.321.'],
'texkey': [u'Englert:1964et'],
'year': [u'1964'],
}
直接从URL提取
>>> from refextract import extract_references_from_url
>>> references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf')
>>> print(references[0])
{
'author': [u'F. Englert and R. Brout'],
'doi': [u'doi:10.1103/PhysRevLett.13.321'],
'journal_page': [u'321'],
'journal_reference': [u'Phys. Rev. Lett. 13 (1964) 321'],
'journal_title': [u'Phys. Rev. Lett.'],
'journal_volume': [u'13'],
'journal_year': [u'1964'],
'linemarker': [u'1'],
'raw_ref': [u'[1] F. Englert and R. Brout, \u201cBroken symmetry and the mass of gauge vector mesons\u201d, Phys. Rev. Lett. 13 (1964) 321, doi:10.1103/PhysRevLett.13.321.'],
'texkey': [u'Englert:1964et'],
'year': [u'1964'],
}
注意
refextract 依赖于 pdftotext。
致谢
refextract 基于以下人员的代码和想法,他们为Invenio中的 docextract 模块做出了贡献
Alessio Deiana
Federico Poli
Gerrit Rindermann
Graham R. Armstrong
Grzegorz Szpura
Jan Aage Lavik
Javier Martin Montull
Micha Moskovic
Samuele Kaplun
Thorsten Schwander
Tibor Simko
许可证
GPLv2
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码发行版
refextract-1.1.4.tar.gz (7.4 MB 查看哈希值)
构建发行版
refextract-1.1.4-py3-none-any.whl (358.5 kB 查看哈希值)
关闭
refextract-1.1.4.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b04b2223c8b80bec4d130e1f95eef5102c8483914f30c35372c19dbcef43480c |
|
MD5 | eecd3b11e523d21c324f768a753b6fcc |
|
BLAKE2b-256 | be0617c356c1ef06931acf24f007610c611fe1be641e005bfa875c7ca83e4da5 |
关闭
refextract-1.1.4-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f8d0dc69289230eec861a40b5956f88ec1661294e1d0f419730429cef40a0f14 |
|
MD5 | 821110fcbf86ab50c316795d4ce7ef1f |
|
BLAKE2b-256 | 930219bcd2a69920618b0bed2241da0fe0da13c86fe3db661c3dbf06eb87236f |