跳转到主要内容

MACREL

项目描述

Macrel: (Meta)genomic AMP分类和检索

用于从(元)基因组中挖掘抗菌肽(AMPs)的管道。

Build Status Documentation Status License: MIT

Install with Bioconda Install with Bioconda

如果您在出版物中使用此软件,请引用

Santos-Júnior CD, Pan S, Zhao X, Coelho LP. 2020. Macrel: antimicrobial peptide screening in genomes and metagenomes. PeerJ 8:e10555. DOI: 10.7717/peerj.10555

在线运行Macrel: https://big-data-biology.org/software/macrel

许可

MIT.

Macrel整体遵循 MIT 许可。

安装

推荐安装方法是通过 bioconda

conda create --name env_macrel -c bioconda macrel
conda activate env_macrel
macrel -h

或者,只需

conda install -c bioconda macrel

从源安装,请阅读文档

示例

Macrel使用 子命令界面。您可以通过指定要使用的管道组件来运行 macrel COMMAND ...

要运行这些示例,首先从 github 下载示例序列,或者通过运行

macrel get-examples

Macrel生成的输出主文件包含一个表,其中包含6列:序列访问代码、肽序列、根据组成和结构对肽进行分类、与AMP预测相关的概率、溶血活性预测以及与溶血活性预测相关的概率。表中输出的所有肽都被认为是AMPs(p > 0.5),尽管预测为AMPs且概率接近1的肽更有可能是活性肽。

要在肽上运行Macrel,请使用 peptides 子命令

macrel peptides \
    --fasta example_seqs/expep.faa.gz \
    --output out_peptides

在这种情况下,我们使用 example_seqs/expep.faa.gz 作为输入序列。这应该是一个氨基酸FASTA文件。输出将被写入名为 out_peptides 的文件夹中,Macrel 将使用4个线程。使用此模式输出的示例可以在 test/peptides/expected.prediction 找到。

要在contigs上运行Macrel,请使用 contigs 子命令

macrel contigs \
    --fasta example_seqs/excontigs.fna.gz \
    --output out_contigs

在此示例中,我们使用示例文件 excontigs.fna.gz,这是一个包含核苷酸序列的FASTA文件,输出写入 out_contigs。使用此模式输出的示例可以在 test/contigs/expected.prediction 找到。除预测表外,此模式还生成两个包含contigs中一般基因预测信息的文件以及一个包含预测和过滤的小基因(≤100个氨基酸)的fasta文件。

要在paired-end reads上运行Macrel,请使用 reads 子命令

macrel reads \
    -1 example_seqs/R1.fq.gz \
    -2 example_seqs/R2.fq.gz \
    --output out_metag \
    --outtag example_metag

配对端读取以配对文件形式给出(在此,example_seqs/R1.fq.gzexample_seqs/R2.fq.gz)。如果您只有单端读取,可以省略 -2 参数。使用此模式输出的示例可以在 test/reads/expected.predictiontest/reads/expected.smorfs.faa 找到。除预测表外,此模式还生成一个contigs fasta文件以及两个包含一般基因预测坐标的文件和一个包含预测和过滤的小基因(≤100个氨基酸)的fasta文件。

要运行Macrel以获取丰度轮廓,您只需要短读序列文件和一个包含肽序列的参考。

macrel abundance \
    -1 example_seqs/R1.fq.gz \
    --fasta example_seqs/ref.faa.gz \
    --output out_abundance \
    --outtag example_abundance

此模式返回一个包含两个列的丰度表,第一列包含AMPs的名称,第二列包含使用给定参考映射回每个肽的读取数量。使用示例文件的此输出示例可以在 test/abundances/expected.abundance.txt 找到。

AMPSphere查询

Macrel还支持查询 AMPSphere数据库(在 Santos-Júnior et al., 2024 中描述)。要这样做,请使用 query-ampsphere 子命令

macrel query-ampsphere \
    --fasta example_seqs/pep8.faa \
    --output out_ampsphere

请注意,默认情况下,此命令需要互联网访问,因为它使用AMPSphere API。或者,您可以使用 --local 标志下载数据库副本并在本地运行查询。这只需要第一次连接到网络。

macrel query-ampsphere \
    --local \
    --fasta example_seqs/pep8.faa \
    --output out_ampsphere

默认情况下,它执行精确匹配,但您也可以使用MMSeqs2通过使用 --query-mode=mmseqs 执行近似匹配(对于HMMER,使用 --query-mode=hmm)。

社区

Macrel正在积极维护,以修复我们从用户那里得到的所有问题,并吸收他们的建议(请参阅 我们对高质量软件的承诺)。

关于macrel的通用问题,我们建议您使用 AMPSphere Google Group(邮件列表)

可以通过 Github issues 报告技术问题。

项目详情


下载文件

下载您平台上的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分发

macrel-1.5.0.tar.gz (4.7 MB 查看哈希

上传时间

构建分发

macrel-1.5.0-py3-none-any.whl (4.7 MB 查看哈希值)

上传时间 Python 3