跳转到主要内容

PubMed nbib引用格式解析器

项目描述

nbib

PubMed及其他NCBI工具导出的nbib引用格式解析器。

关于

nbib对它解析的数据及其结构有明确的意见,旨在支持最常见的用例。与其他生成“扁平”数据(即字符串键值对)的解析器不同,nbib

  • 尽可能将字符串解析为其正确的数据类型
  • 在适当的情况下创建分层和列表对象

安装

PyPi安装最新生产版本

pip install nbib

要安装最新开发版本

pip install git+https://github.com/holub008/nbib.git

使用

示例

import nbib
refs = nbib.read("""PMID- 1337\nTI  - `nbib` Rocks!\n\n""")

通用

nbib提供

  • 解析nbib文件(read_file())和字符串(read())的功能
  • 保证输出格式在主要版本中将保持向后兼容性
    • 在主要版本中,属性的类型永远不会改变
    • 在主要版本中,属性永远不会更改名称
    • 可以在次要版本中添加新属性
  • 保证输出引用的顺序与输入顺序匹配。此外,这适用于所有列表属性(例如作者)

nbib不提供

  • 允许用户自定义解析方法
    • nbib认为执行“显然”的解析可以覆盖99%的用例,因此不要将这项工作推给客户端
  • 与格式不正确的文件友好地交互 - 对于意外输入会积极抛出异常
    • 由于PubMed实际上是这些文件的唯一生产者,因此风险最小
    • 请报告遇到的任何问题!
  • 具有出色的运行时性能
    • 截至编写时,一个包含829K行(PubMed最大导出大小)的10,000个引用文件在标准笔记本电脑上耗时9.2秒。相比之下,生成扁平字符串数据的ris解析包rispy,对于10K个引用(670K行)耗时2.2秒。
    • 如果您的用例需要更快的性能,请提交问题!

开发

问题和拉取请求总是受欢迎。

测试

设置项目

pipenv install --dev

运行测试

pipenv run python -m pytest

项目详情


下载文件

下载您平台对应的文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。

源代码发行版

nbib-0.3.2.tar.gz (9.6 kB 查看哈希值)

上传时间 源代码

构建发行版

nbib-0.3.2-py3-none-any.whl (9.8 kB 查看哈希值)

上传时间 Python 3