PubMed nbib引用格式解析器
项目描述
nbib
PubMed及其他NCBI工具导出的nbib引用格式解析器。
关于
nbib
对它解析的数据及其结构有明确的意见,旨在支持最常见的用例。与其他生成“扁平”数据(即字符串键值对)的解析器不同,nbib
- 尽可能将字符串解析为其正确的数据类型
- 在适当的情况下创建分层和列表对象
安装
从PyPi安装最新生产版本
pip install nbib
要安装最新开发版本
pip install git+https://github.com/holub008/nbib.git
使用
示例
import nbib
refs = nbib.read("""PMID- 1337\nTI - `nbib` Rocks!\n\n""")
通用
nbib
提供
- 解析nbib文件(
read_file()
)和字符串(read()
)的功能 - 保证输出格式在主要版本中将保持向后兼容性
- 在主要版本中,属性的类型永远不会改变
- 在主要版本中,属性永远不会更改名称
- 可以在次要版本中添加新属性
- 保证输出引用的顺序与输入顺序匹配。此外,这适用于所有列表属性(例如作者)
nbib
不提供
- 允许用户自定义解析方法
nbib
认为执行“显然”的解析可以覆盖99%的用例,因此不要将这项工作推给客户端
- 与格式不正确的文件友好地交互 - 对于意外输入会积极抛出异常
- 由于PubMed实际上是这些文件的唯一生产者,因此风险最小
- 请报告遇到的任何问题!
- 具有出色的运行时性能
- 截至编写时,一个包含829K行(PubMed最大导出大小)的10,000个引用文件在标准笔记本电脑上耗时9.2秒。相比之下,生成扁平字符串数据的ris解析包
rispy
,对于10K个引用(670K行)耗时2.2秒。 - 如果您的用例需要更快的性能,请提交问题!
- 截至编写时,一个包含829K行(PubMed最大导出大小)的10,000个引用文件在标准笔记本电脑上耗时9.2秒。相比之下,生成扁平字符串数据的ris解析包
开发
问题和拉取请求总是受欢迎。
测试
设置项目
pipenv install --dev
运行测试
pipenv run python -m pytest
项目详情
下载文件
下载您平台对应的文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。
源代码发行版
nbib-0.3.2.tar.gz (9.6 kB 查看哈希值)
构建发行版
nbib-0.3.2-py3-none-any.whl (9.8 kB 查看哈希值)
关闭
nbib-0.3.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 343c27b79088f2cde7f0ee6605653a2e432dec6d30cf8c6e82dc2e4525087982 |
|
MD5 | b98d1a0f457d4aa322534e15e7b98d14 |
|
BLAKE2b-256 | f0c3a3bfe572d7133836571010ed17c32b8fa0eee9939d52d6485132b7d2a4b8 |
关闭
nbib-0.3.2-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | ee40530186de406d7b8d880d1740d15284026c0b885f161665c7e7f6772cd5ae |
|
MD5 | 0c4b699b742da25d7454ffecec55d541 |
|
BLAKE2b-256 | bad7788c12c066373216dec5728ff81f8939fe5fc85aa84f1f4c61722e338a41 |