基因组交互注释库
项目描述
此库提供了 InteractiveAnnotation,它是基因组注释的高级表示,允许用户轻松提取信息、操作和重新格式化常用的注释文件,如BED和GFF。
该软件包目前处于alpha阶段,且仅在 python3 上运行。
支持的格式
输入:BED,GFF3,GTF
输出:BED
脚本
为了方便,我们提供了两个命令行工具: annotParser.py 和 annotMergeSmallGap.py。
$ annotParser.py -h
usage: annotParser.py [-h] [-i INPUT] [-o OUTPUT] [-f {gff3,gtf,bed}]
[-t {extb,bed}] [-n MIN_EXON_COUNT]
[-igs IGNORE_GAPS_SMALLER_THAN]
[-igb IGNORE_GAPS_BIGGER_THAN] [-v]
Parse, filter and convert annotation files
optional arguments:
-h, --help show this help message and exit
-i INPUT, --input INPUT
input file. to read from pipe, use the argument
'stdin'
-o OUTPUT, --output OUTPUT
output file
-f {gff3,gtf,bed}, --input_format {gff3,gtf,bed}
input file format
-t {extb,bed}, --output_format {extb,bed}
output file format
-n MIN_EXON_COUNT, --min_exon_count MIN_EXON_COUNT
min number of exons
-igs IGNORE_GAPS_SMALLER_THAN, --ignore_gaps_smaller_than IGNORE_GAPS_SMALLER_THAN
-igb IGNORE_GAPS_BIGGER_THAN, --ignore_gaps_bigger_than IGNORE_GAPS_BIGGER_THAN
-v, --invert_match select non matching annotations (similar to grep -v)
$ annotMergeSmallGaps.py -h
usage: annotMergeSmallGaps.py [-h] [-i INPUT] [-o OUTPUT] [-f {gff3,bed,gtf}]
[-t {extb,bed}] [-s SMALL_GAP_SIZE]
Merge exons separated by small gaps. Can also be used to convert different
kinds of annotations.
optional arguments:
-h, --help show this help message and exit
-i INPUT, --input INPUT
input file. to read from pipe, use the argument
'stdin'
-o OUTPUT, --output OUTPUT
output file
-f {gff3,bed,gtf}, --input_format {gff3,bed,gtf}
input file format
-t {extb,bed}, --output_format {extb,bed}
output file format
-s SMALL_GAP_SIZE, --small_gap_size SMALL_GAP_SIZE
gap size.
上述脚本也可以用于将不同类型的注释文件进行转换。通过导入库可以实现更高级的使用。
安装说明
在Ubuntu上全局安装
sudo apt-get install python3-pip
sudo pip3 install genial
致谢
我想感谢我的朋友,Lucas Silva 和 David Pires,他们在我学习Python和软件开发的过程中提供了很多帮助和鼓励。没有他们,我几乎找不到这么多乐趣来编码,这个项目也不会出现。我还感谢 Marcelo Reis 帮助我为这个库命名 :D
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。
源代码发行版
本发布版本没有提供源分布文件。请参阅有关生成分发存档的教程。
已构建的分发
genial-0.1.0a1-py3-none-any.whl (20.3 kB 查看散列值)