跳转到主要内容

Pandas for phylogenetics

项目描述

Gitter chat Documentation Status Build Status Binder

将Pandas DataFrame 带到系统发育学。

PhyloPandas提供了一个类似于Pandas的接口,用于将序列和系统发育树数据读入pandas DataFrame。这使得使用熟悉的Python/Pandas函数轻松操作系统发育数据成为可能。最后,让人类也能轻松进行系统发育学!

它是如何工作的?

不要担心,我们没有重新发明轮子。 PhyloPandas只是在DataFrame(非常适合人类可访问的数据存储)的基础上,构建了一个接口,它建立在Biopython(非常适合解析/写入序列数据)和DendroPy(非常适合读取树数据)之上。

PhyloPandas做两件事

  1. 它提供了新的read函数,可以直接将序列/树数据读入DataFrame。
  2. 它将一个新的phylo 访问器附加到Pandas DataFrame上。此访问器提供了写入序列/树数据的方法(由Biopython和dendropy提供支持)。

基本用法

序列数据

读取序列文件。

import phylopandas as ph

df1 = ph.read_fasta('sequences.fasta')
df2 = ph.read_phylip('sequences.phy')

写入各种序列文件格式。

df1.phylo.to_clustal('sequences.clustal')

在不同格式之间进行转换。

# Read a format.
df = ph.read_fasta('sequences.fasta')

# Write to a different format.
df.phylo.to_phylip('sequences.phy')

树数据

读取newick树数据

df = ph.read_newick('tree.newick')

可视化系统发育数据(由phylovega提供支持)。

df.phylo.display(
    height=500,
)

贡献

如果您对这个项目有想法,请在项目的Gitter聊天中分享。

为PhyloPandas创建新的读写函数和方法很简单。如果您想添加一个格式,请提交PR!还有许多其他格式,我还没有时间添加,所以请不要害怕添加它们!提前感谢您!

测试

PhyloPandas包含一个小型的pytest测试套件。从基础目录运行这些测试。

$ cd phylopandas
$ pytest

安装

从PyPI安装

pip install phylopandas

从源代码安装

git clone https://github.com/Zsailer/phylopandas
cd phylopandas
pip install -e .

依赖项

  • BioPython:用于管理和操作生物数据的库。
  • DendroPy:用于系统发育脚本、模拟、数据处理和操作的库。
  • Pandas:Python的灵活且功能强大的数据分析/操作库。
  • pandas_flavor:使用pandas的新注册API(具有向后兼容性)使用新的访问器来调味pandas对象。

项目详情


下载文件

下载适合您平台文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码发行版

phylopandas-0.8.0.tar.gz (14.1 kB 查看散列值)

上传时间: 源代码

构建发行版

phylopandas-0.8.0-py2.py3-none-any.whl (24.5 kB 查看散列值)

上传时间: Python 2 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面