跳转到主要内容

未提供项目描述

项目描述

bio:让生物信息学再次变得有趣

bio - 命令行实用工具,使生物信息学探索更加愉快。

bio 是一个生物信息学玩具,用于玩耍。

就像相互匹配的乐高积木一样,bio旨在为您提供自然搭配的命令,让您可以用简短、明确和简单的命令表达意图。这是一个探索阶段的项目,我们欢迎对它应如何成长提出意见和建议。

此软件做什么?

如果您曾经做过生物信息学,您知道即使是看似简单的工作也需要多个步骤、神秘的咒语和各种其他准备工作,这些都会减慢进度。

即使是定义良好、看似简单的任务也可能需要大量复杂的步骤。bio包旨在解决这个问题。

使用示例

# Fetch genbank data
bio fetch NC_045512 MN996532 > genomes.gb

# Convert the first then bases of the genomes to FASTA.
bio fasta genomes.gb --end 10

# Align the coding sequences for the S protein
bio fasta genomes.gb --gene S --protein | bio align | head

# Print the GFF record that corresponds to the coding sequence for gene S
bio gff genomes.gb --gene S 

# Show the descendants of taxid 117565
bio taxon 117565 | head

# Show the lineage of a taxonomic rank.
bio taxon 117565 --lineage | head

# Get metadata on a viral sample
bio meta 11138 -H | head

# Define a sequence ontology terms
bio define exon

# Define a gene ontology terms
bio define food vacuole

文档

详细文档维护在

快速安装

bio适用于Linux和Mac计算机,在Windows上使用Linux子系统时也适用。

通常,所有基于Python的命令行实用工具都应该通过pipx安装,以避免与其他Python包冲突

pipx install bio 

或者,如果您也可以使用pip来安装

pip install bio 

有关更多详细信息,请参阅文档

bio是流式导向的

bio支持流式导向编程,其中一项任务的输出可以链入下一项。以下面的示例为例,但现在从包含仅访问号的文件acc.txt开始

NC_045512
MN996532

我们可以运行bio生成形成S蛋白的S核苷酸变异的VCF文件,如下所示

cat acc.txt | bio fetch | bio fasta --gene S | bio align --vcf | head

打印

##fileformat=VCFv4.2
##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
##FILTER=<ID=PASS,Description="All filters passed">
##INFO=<ID=TYPE,Number=1,Type=String,Description="Type of the variant">
##contig=<ID=YP_009724390.1,length=3822,assembly=YP_009724390.1>
#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  QHR63300.2
YP_009724390.1  33      33C/T   C       T       .       PASS    TYPE=SNP        GT      1
YP_009724390.1  54      54T/A   T       A       .       PASS    TYPE=SNP        GT      1
YP_009724390.1  60      60C/T   C       T       .       PASS    TYPE=SNP        GT      1
YP_009724390.1  69      69A/G   A       G       .       PASS    TYPE=SNP        GT      1

为谁设计bio

该软件旨在教授生物信息学,是《生物星手册》教科书的配套软件。目标受众包括

  • 学习生物信息学的学生。
  • 需要平台来展示生物信息学概念的生物信息学教育者。
  • 与大量类似基因组(细菌/病毒株)工作的科学家。
  • 需要详细调查和理解基因组区域科学家。

推动 bio 的思想和动机是在教育使用手册的学生群体中发展起来的。 bio 是对如何简化生物信息学,尤其是数据表示和访问的一种有见解的看法。

开发

我们使用 hatch 构建系统来管理软件

https://github.com/pypa/hatch

您可以使用 hatchpip 以可编辑模式安装软件

pip install --editable .

测试

bio 可以进行自我测试,要运行所有测试,请执行

bio test

测试是从模拟实际使用场景的shell脚本自动构建的。

生成文档

要生成文档,您需要 bookdown

conda install r-bookdown r-servr

要在浏览器中运行文档

make 

然后访问 http://localhost:8000

项目详情


下载文件

下载您平台上的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

bio-1.7.1.tar.gz (241.4 kB 查看散列)

上传时间 源代码

构建分发

bio-1.7.1-py3-none-any.whl (281.0 kB 查看散列)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面