基础生物序列操作
项目描述
按常规导入
>>> import nebseq
反向互补
这里唯一的注意事项是,revcomp 不会检查输入序列是否看起来像DNA或RNA。
>>> nebseq.revcomp('ACGT') 'ACGT' >>> nebseq.revcomp('TTACC') 'GGTAA'
如果我们给它垃圾,它就会给我们垃圾。
>>> nebseq.revcomp('ZQ') 'QZ'
翻译
翻译函数应该允许完全支持序列翻译。这包括像修剪前几个碱基和使用备用翻译表这样的功能。还有对某些Genbank文件中可以找到的更奇特的后翻译修饰的支持,以及翻译部分肽段(例如模糊坐标)。
基本翻译
>>> nebseq.translate('TTGGCCAAGGAACGA', table=11) 'MAKER'
展示部分肽段翻译的效果。默认情况下,根据所选的翻译表,第一个密码子应该是起始密码子,如果不是,则将其转换为‘X’
>>> nebseq.translate('GCCAAG') 'XK' >>> nebseq.translate('GCCAAG', partial=True) 'AK'
或者我们可以删除前几个碱基以适应模糊坐标。
>>> nebseq.translate('TTGCCAAG', start=2, partial=True) 'AK'
修饰由一个(索引,氨基酸)二元组指定。请注意,修饰索引被指定为氨基酸序列中的一基索引。
>>> nebseq.translate('ATGAAGGAA', modifications=[(2, 'U')]) 'MUE'
提取
序列提取用于当您想要从较大的序列中切片出部分时。如果您使用 nebgb 模块及其从像 join(1..5,9..100) 这样的字符串解析出的位置定义,这很有用。
>>> location = {'type': 'span', 'from': 4, 'to': 10} >>> nebseq.extract('ACCGTACCATAGTT', location) ('GTACCAT', (False, False)) >>> location = { ... "type": "complement", ... "segment": { ... "type": "join", ... "segments": [ ... {"type": "span", "from": 3, "to": 8}, ... {"type": "span", "from": 10, "to": 14} ... ] ... } ... } >>> nebseq.extract('ACCGTATTTCGGGGACAT', location) ('CCCCGAATACG', (False, False))
项目详情
关闭
nebseq-0.0.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | eb1305ab4e6ebbee4ab9e60c1bbc6378c9e2867e9152ee5cab1b38ff43ed6b62 |
|
MD5 | 455abb62956b5695c948ac5f2e626890 |
|
BLAKE2b-256 | 7ffe2fff040bd2a09a36ffbc3e2bc0c9d464c7a1afe44483d240f2f5afe57e3d |