abifpy是一个用于读取ABI Sanger测序跟踪文件的模块。
项目描述
abifpy是一个Python模块,可以从中提取Applied Biosystem,Inc.格式(ABI)文件中的序列和各种其他数据。该模块与python3兼容,并根据Applied Biosystems发布官方规范编写。
该模块的修改版本已合并到Biopython项目中,从版本1.58开始可用。如果您已经安装了Biopython版本>=1.58,则不需要使用abifpy。尽管如此,出于个人原因,我仍然保留该模块作为独立版本 :)
abifpy提供以下项目
- 类 Trace(in_file)
表示跟踪文件 in_file 的类。
跟踪对象属性和方法
- seq
存储在文件中的碱基调用核苷酸序列的字符串。
- qual
碱基调用序列的phred质量字符的字符串。
- qual_val
碱基调用序列的phred质量值的列表。
- id
序列文件名的字符串。
- name
在测序之前输入的样本名的字符串。
- trim(sequence[, cutoff=0.05])
使用Richard Mott的算法(在phred中使用)进行修剪序列,概率截止值为0.05。可以用于seq、qual和qual_val。
- get_data(key)
返回文件中存储的元数据,接受来自tags(见下文)的键。
- export([out_file=””, fmt=’fasta’])
从轨迹文件中写入fasta(fmt='fasta')、qual(fmt='qual')或fastq(fmt='fastq')文件。默认格式是fasta。
- close()
关闭Trace文件对象。
- seq_remove_ambig(seq)
将多余的模糊碱基字符(K, Y, W, M, R, S)替换为‘N’。接受seq作为输入。
- EXTRACT
确定哪些元数据被提取的字典。
- data
包含文件元数据的字典。键是EXTRACT的值。
- tags
包含数据目录类实例值的标签字典。键是标签名和标签号的组合。使用get_data()访问每个tags条目中的值。
用法
$ python >>> from abifpy import Trace >>> yummy = Trace('tests/3730.ab1')
或者如果您想直接执行基修剪
>>> yummy = Trace('tests/3730.ab1', trimming=True)
序列可以通过seq属性访问。其他值得注意的属性包括qual用于phred质量字符,qual_val用于phred质量值,id用于测序轨迹文件名,name用于样本名。
>>> yummy.seq 'GGGCGAGCKYYAYATTTTGGCAAGAATTGAGCTCT... >>> yummy.qual '5$%%%\'%%!!!\'!+5;726@>A=3824DESHSS... >>> yummy.qual_val [20, 3, 4, 4, 4, 6, 4, 4, 0, 0, 0, 6, 0, 10, 20, 26, 22, 17, 21... >>> yummy.id '3730' >>> yummy.name '226032_C-ME-18_pCAGseqF'
如果在实例化时没有执行修剪,您之后还可以执行
>>> yummy.trim(yummy.seq)
质量值本身也可以进行修剪
>>> yummy.trim(yummy.qual)
查看轨迹文件元数据很简单。使用EXTRACT的值作为data中的键
>>> yummy.data['well'] 'B9' >>> yummy.data['model'] '3730' >>> yummy.data['run start date'] datetime.date(2009, 12, 12)
不在data中的元数据可以使用get_data()查看,其中一个keys在tags中作为参数,例如
>>> yummy.get_data('PTYP1') '96-well'
有关这些标签的含义和文件元数据的更多信息,请参阅官方规范。
安装
pip install abifpy,或者
将abifpy目录添加到您的$PYTHONPATH(在.bashrc中使其持久化)
许可证
abifpy许可协议为MIT License。
版权所有(c) 2011 Wibowo Arindrarto <bow@bow.web.id>
在此特此授予任何获得本软件及其相关文档文件(“软件”)副本的任何人免费处理软件的权利,包括但不限于使用、复制、修改、合并、发布、分发、再许可和/或销售软件副本,并允许向提供软件的人员提供这样做,但受以下条件约束
上述版权声明和本许可声明应包含在所有副本或实质性部分中。
软件按“现状”提供,不提供任何明示或暗示的保证,包括但不限于适销性、针对特定目的的适用性和非侵权性保证。在任何情况下,作者或版权所有者均不对任何索赔、损害或其他责任负责,无论是在合同行为、侵权行为或其他行为中产生的,与软件或软件的使用或其他交易有关。
项目详情
abifpy-0.9.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 268bf2ae57a99c41bf6fde38d27fcd8d4bf01105afb7eed749d7557e953fbcac |
|
MD5 | 98af4a85565ba2631b67a8cae5672ecf |
|
BLAKE2b-256 | 096d3771d292d04cccbd9f09fd58e2e6c4dfbcf3caed7a9573bea2e7edc3d50a |