跳转到主要内容

使用Python进行祖先序列重建

项目描述

PyASR

Python中的祖先序列重建

PyASR提供了一种现代Python接口,用于PAML ("通过最大似然进行系统发育分析")--专门用于重建祖先蛋白/DNA序列。

注意: PyASR目前仅支持蛋白重建。这是一个正在进行中的工作。

基本用法

import phylopandas as pd
import dendropy as d
import pyasr

# Use phylopandas to read a set of ancestor.s
df_seqs = pd.read_fasta('test.fasta')

# Use dendropy to read in tree.
tree = d.Tree.get(path='tree.newick', schema='newick')

# Reconstruct nodes in tree.
tree, df_seqs, df_anc = pyasr.reconstruct(df_seqs, tree, working_dir='test', alpha=1.235)

# Write out ancestor dataframe to a CSV file.
df_anc.to_csv('ancestors.csv')

我们可以使用ToyTree库在JupyterLab中将祖先与树并排可视化。

安装

此软件包发布在PyPi上。您可以使用pip进行安装

pip install pyasr

获取开发版本

git clone
cd
pip install -e .

依赖项

实际的重建计算使用PAML完成。这需要安装PAML并将codeml/baseml可执行文件导出到您的$PATH环境变量中。有关安装PAML的说明可以在PAML网站上找到。

PyASR正常运行所需的以下Python依赖项。

  • Pandas
  • Biopython
  • PhyloPandas
  • DendroPy

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

pyasr-0.6.1.tar.gz (31.8 kB 查看哈希值)

上传于 源码

构建版本

pyasr-0.6.1-py2.py3-none-any.whl (35.6 kB 查看哈希)

上传于 Python 2 Python 3

由以下支持