跳转到主要内容

将基因和基因组映射到全球微生物基因目录(GMGC)

项目描述

GMGC-mapper

Install with conda PyPI version gmgc_mapper_test Number of downloads License: MIT

用于查询全球微生物基因目录(GMGC)的命令行工具。

安装

GMGC-mapper在Python 3.6-3.8上运行,并需要prodigal(基因组模式所需的)可用。

conda安装

安装GMGC-mapper最简单的方法是通过bioconda,这将确保自动安装所有依赖项(包括prodigal

conda install -c bioconda gmgc-mapper

pip安装

或者,GMGC-mapper可以从PyPI获取,因此可以通过pip进行安装

pip install GMGC-mapper

请注意,这不会安装prodigal(这是基于基因组的流程所必需的)。

从源代码安装

最后,如果您是从Github获取的最新版本,可以使用标准的

python setup.py install

示例

  1. 输入是基因组序列。
gmgc-mapper -i input.fasta -o output
  1. 输入是DNA/蛋白质基因序列
gmgc-mapper --nt-genes genes.fna --aa-genes genes.faa -o output

核苷酸输入是可选的(但在可用时应使用,以便可以细化命中质量)

gmgc-mapper --aa-genes genes.faa -o output

如果您的输入是宏基因组,您可以使用NGLess进行组装和基因预测。有关更多信息,请阅读文档

输出

输出文件夹将包含

  1. 基因预测输出(prodigal)。
  2. 完整数据表,列出每个基因在GMGC中的所有命中。
  3. 完整表,列出结果中找到的所有基因组Bin(MAGs)。
  4. 可读性总结。

有关更多信息,请阅读文档。输出描述也以方便起见写入输出文件夹。

参数

  • -i/--input:输入基因组文件路径(.fasta/.gz/.bz2)。

  • -o/--output:输出目录(如果不存在,则创建)。

  • --nt-genes:输入DNA基因文件路径(.fasta/.gz/.bz2)。

  • --aa-genes:输入蛋白质基因文件路径(.fasta/.gz/.bz2)。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

GMGC-mapper-0.2.0.tar.gz (13.7 kB 查看哈希值)

上传时间 源代码

支持者