Pandas for phylogenetics
项目描述
将Pandas DataFrame
带到系统发育学。
PhyloPandas提供了一个类似于Pandas的接口,用于将序列和系统发育树数据读入pandas DataFrame。这使得使用熟悉的Python/Pandas函数轻松操作系统发育数据成为可能。最后,让人类也能轻松进行系统发育学!
它是如何工作的?
不要担心,我们没有重新发明轮子。 PhyloPandas只是在DataFrame(非常适合人类可访问的数据存储)的基础上,构建了一个接口,它建立在Biopython(非常适合解析/写入序列数据)和DendroPy(非常适合读取树数据)之上。
PhyloPandas做两件事
- 它提供了新的
read
函数,可以直接将序列/树数据读入DataFrame。 - 它将一个新的
phylo
访问器附加到Pandas DataFrame上。此访问器提供了写入序列/树数据的方法(由Biopython和dendropy提供支持)。
基本用法
序列数据
读取序列文件。
import phylopandas as ph
df1 = ph.read_fasta('sequences.fasta')
df2 = ph.read_phylip('sequences.phy')
写入各种序列文件格式。
df1.phylo.to_clustal('sequences.clustal')
在不同格式之间进行转换。
# Read a format.
df = ph.read_fasta('sequences.fasta')
# Write to a different format.
df.phylo.to_phylip('sequences.phy')
树数据
读取newick树数据
df = ph.read_newick('tree.newick')
可视化系统发育数据(由phylovega提供支持)。
df.phylo.display(
height=500,
)
贡献
如果您对这个项目有想法,请在项目的Gitter聊天中分享。
为PhyloPandas创建新的读写函数和方法很简单。如果您想添加一个格式,请提交PR!还有许多其他格式,我还没有时间添加,所以请不要害怕添加它们!提前感谢您!
测试
PhyloPandas包含一个小型的pytest测试套件。从基础目录运行这些测试。
$ cd phylopandas
$ pytest
安装
从PyPI安装
pip install phylopandas
从源代码安装
git clone https://github.com/Zsailer/phylopandas
cd phylopandas
pip install -e .
依赖项
- BioPython:用于管理和操作生物数据的库。
- DendroPy:用于系统发育脚本、模拟、数据处理和操作的库。
- Pandas:Python的灵活且功能强大的数据分析/操作库。
- pandas_flavor:使用pandas的新注册API(具有向后兼容性)使用新的访问器来调味pandas对象。
项目详情
下载文件
下载适合您平台文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源代码发行版
phylopandas-0.8.0.tar.gz (14.1 kB 查看散列值)
构建发行版
phylopandas-0.8.0-py2.py3-none-any.whl (24.5 kB 查看散列值)
关闭
phylopandas-0.8.0.tar.gz的散列值
算法 | 散列摘要 | |
---|---|---|
SHA256 | 1efc4b81ce745794490f6f6144114f1dc8102764303c58935017119cdcaaa7d2 |
|
MD5 | 04ec1c1d106fe515e88329af6ddbe44d |
|
BLAKE2b-256 | 4ad83eecd18d4b995b6bd9d8488c34731f3654093b08158a8555df7098df6494 |
关闭
phylopandas-0.8.0-py2.py3-none-any.whl的散列值
算法 | 散列摘要 | |
---|---|---|
SHA256 | 9f517270296731934ab9285067735401b531571b19103904a63ea5e3cae29200 |
|
MD5 | 90b1cc8e3750e88f8bd0928c8eab5d2c |
|
BLAKE2b-256 | b50a3341f46b96425a0e5e7b64e8052b9785bbfdfbeac84426b13ccc2712a5a8 |