跳转到主要内容

基础生物序列操作

项目描述

按常规导入

>>> import nebseq

反向互补

这里唯一的注意事项是,revcomp 不会检查输入序列是否看起来像DNA或RNA。

>>> nebseq.revcomp('ACGT')
'ACGT'
>>> nebseq.revcomp('TTACC')
'GGTAA'

如果我们给它垃圾,它就会给我们垃圾。

>>> nebseq.revcomp('ZQ')
'QZ'

翻译

翻译函数应该允许完全支持序列翻译。这包括像修剪前几个碱基和使用备用翻译表这样的功能。还有对某些Genbank文件中可以找到的更奇特的后翻译修饰的支持,以及翻译部分肽段(例如模糊坐标)。

基本翻译

>>> nebseq.translate('TTGGCCAAGGAACGA', table=11)
'MAKER'

展示部分肽段翻译的效果。默认情况下,根据所选的翻译表,第一个密码子应该是起始密码子,如果不是,则将其转换为‘X’

>>> nebseq.translate('GCCAAG')
'XK'
>>> nebseq.translate('GCCAAG', partial=True)
'AK'

或者我们可以删除前几个碱基以适应模糊坐标。

>>> nebseq.translate('TTGCCAAG', start=2, partial=True)
'AK'

修饰由一个(索引,氨基酸)二元组指定。请注意,修饰索引被指定为氨基酸序列中的一基索引。

>>> nebseq.translate('ATGAAGGAA', modifications=[(2, 'U')])
'MUE'

提取

序列提取用于当您想要从较大的序列中切片出部分时。如果您使用 nebgb 模块及其从像 join(1..5,9..100) 这样的字符串解析出的位置定义,这很有用。

>>> location = {'type': 'span', 'from': 4, 'to': 10}
>>> nebseq.extract('ACCGTACCATAGTT', location)
('GTACCAT', (False, False))
>>> location = {
...     "type": "complement",
...     "segment": {
...         "type": "join",
...         "segments": [
...             {"type": "span", "from": 3, "to": 8},
...             {"type": "span", "from": 10, "to": 14}
...         ]
...     }
... }
>>> nebseq.extract('ACCGTATTTCGGGGACAT', location)
('CCCCGAATACG', (False, False))

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

nebseq-0.0.2.tar.gz (10.4 kB 查看哈希值)

上传时间

支持