将基因和基因组映射到全球微生物基因目录(GMGC)
项目描述
GMGC-mapper
用于查询全球微生物基因目录(GMGC)的命令行工具。
安装
GMGC-mapper在Python 3.6-3.8上运行,并需要prodigal
(基因组模式所需的)可用。
conda安装
安装GMGC-mapper最简单的方法是通过bioconda,这将确保自动安装所有依赖项(包括prodigal
)
conda install -c bioconda gmgc-mapper
pip安装
或者,GMGC-mapper
可以从PyPI获取,因此可以通过pip进行安装
pip install GMGC-mapper
请注意,这不会安装prodigal
(这是基于基因组的流程所必需的)。
从源代码安装
最后,如果您是从Github获取的最新版本,可以使用标准的
python setup.py install
示例
- 输入是基因组序列。
gmgc-mapper -i input.fasta -o output
- 输入是DNA/蛋白质基因序列
gmgc-mapper --nt-genes genes.fna --aa-genes genes.faa -o output
核苷酸输入是可选的(但在可用时应使用,以便可以细化命中质量)
gmgc-mapper --aa-genes genes.faa -o output
如果您的输入是宏基因组,您可以使用NGLess进行组装和基因预测。有关更多信息,请阅读文档。
输出
输出文件夹将包含
- 基因预测输出(prodigal)。
- 完整数据表,列出每个基因在GMGC中的所有命中。
- 完整表,列出结果中找到的所有基因组Bin(MAGs)。
- 可读性总结。
有关更多信息,请阅读文档。输出描述也以方便起见写入输出文件夹。
参数
-
-i/--input
:输入基因组文件路径(.fasta/.gz/.bz2)。 -
-o/--output
:输出目录(如果不存在,则创建)。 -
--nt-genes
:输入DNA基因文件路径(.fasta/.gz/.bz2)。 -
--aa-genes
:输入蛋白质基因文件路径(.fasta/.gz/.bz2)。
项目详情
关闭
GMGC-mapper-0.2.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 49977835cd3af85c3ed45ba4fd2c173ad94249a9e90c56599cc342c95a001da6 |
|
MD5 | 4dfcfc030c286b6a896beb802843f528 |
|
BLAKE2b-256 | 27b94f686f1e3f43b0432d4fd63c888833e776fd828e8f602bfecb2265b331a2 |