ucsc-genomes-downloader · PyPI

Python包，用于快速从UCSC下载基因组。

这些详情尚未通过PyPI验证

项目链接

主页

项目描述

Supported Python Versions

Python包，用于快速从UCSC网站下载和处理基因组。

如何安装此包？

像往常一样，只需使用pip下载即可

pip install ucsc_genomes_downloader

获取COVID-19基因组

要下载COVID19基因组，只需运行

from ucsc_genomes_downloader import Genome
covid = Genome("wuhCor1")

genome = covid["NC_045512v2"]

使用示例

简单地实例化一个新的基因组

要下载并加载指定基因组组装的染色体到内存中，可以使用以下代码片段

from ucsc_genomes_downloader import Genome
hg19 = Genome(assembly="hg19")

下载选定的染色体

如果您想选择要下载的染色体子集，可以使用“chromosomes”属性

from ucsc_genomes_downloader import Genome
hg19 = Genome("hg19", chromosomes=["chr1", "chr2"])

获取间隙区域

该方法返回一个类似bed的DataFrame，包含仅存在n或N个核苷酸的区域。

all_gaps = hg19.gaps() # Returns gaps (region formed of Ns) for all chromosomes
# Returns gaps for chromosome chrM
chrM_gaps = hg19.gaps(chromosomes=["chrM"])

获取填充区域

该方法返回一个类似bed的DataFrame，包含没有未知核苷酸存在的区域，基本上是间隙方法的补集。

all_filled = hg19.filled() # Returns filled for all chromosomes
# Returns filled for chromosome chrM
chrM_filled = hg19.filled(chromosomes=["chrM"])

删除基因组缓存

要删除包括染色体和元数据的基因组缓存，可以使用delete方法

hg19.delete()

基因组对象表示

当打印时，基因组对象具有可读的表示。这允许您按如下方式打印基因组对象列表

print([
    hg19,
    hg38,
    mm10
])

# >>> [
#    Human, Homo sapiens, hg19, 2009-02-28, 25 chromosomes,
#    Human, Homo sapiens, hg38, 2013-12-29, 25 chromosomes,
#    Mouse, Mus musculus, mm10, 2011-12-29, 22 chromosomes
# ]

获取特定的bed文件序列

给定一个类似bed的pandas DataFrame，您可以使用bed_to_sequence方法获取加载组装的相应基因组序列

my_bed = pd.read_csv("path/to/my/file.bed", sep="\t")
sequences = hg19.bed_to_sequence(my_bed)

属性

基因组对象具有以下属性

hg19.assembly # Returns "hg19"
hg19.date # Returns "2009-02-28" as datetime object
hg19.organism # Returns "Human"
hg19.scientific_name # Returns "Homo sapiens"
hg19.description # Returns the brief description as provided from UCSC
hg19.path # Returns path where genome is cached

实用工具

检索可用基因组的列表

您可以通过以下方法从UCSC网站获取可用基因组的完整列表：

from ucsc_genomes_downloader.utils import get_available_genomes
all_genomes = get_available_genomes()

镶嵌bed文件

创建给定大小的类似于pandas dataframes的bed文件镶嵌。

可用的对齐方式是左侧、右侧或居中。

from ucsc_genomes_downloader.utils import tessellate_bed
import pandas as pd

my_bed = pd.read_csv("path/to/my/file.bed", sep="\t")
tessellated = tessellate_bed(
    my_bed,
    window_size=200,
    alignment="left"
)

扩展bed文件区域

使用选择的对齐方式扩展给定bed格式dataframe。

可用的对齐方式是左侧、右侧或居中。

from ucsc_genomes_downloader.utils import expand_bed_regions
import pandas as pd

my_bed = pd.read_csv("path/to/my/file.bed", sep="\t")
expanded = expand_bed_regions(
    my_bed,
    window_size=1000,
    alignment="left"
)

摆动bed文件区域

通过摆动初始区域生成基于给定bed文件的新区域。

from ucsc_genomes_downloader.utils import wiggle_bed_regions
import pandas as pd

my_bed = pd.read_csv("path/to/my/file.bed", sep="\t")
expanded = wiggle_bed_regions(
    my_bed,
    max_wiggle_size=100, # Maximum amount to wiggle region
    wiggles=10, # Number of wiggled samples to introduce
    seed=42 # Random seed for reproducibility
)

项目详情

这些详情尚未通过PyPI验证

项目链接

主页

发布历史发布通知 | RSS源

此版本

1.1.26

2022年4月29日

1.1.25

2020年7月31日

1.1.24

2020年7月20日

1.1.23

2020年7月19日

1.1.22

2020年7月18日

1.1.21

2020年7月18日

1.1.20

2020年7月18日

1.1.19

2020年7月18日

1.1.18

2020年3月29日

1.1.17

2020年3月22日

1.1.16

2020年3月19日

1.1.15

2020年3月10日

1.1.14

2020年3月1日

1.1.13

2020年2月20日

1.1.12

2020年2月3日

1.1.11

2020年2月3日

1.1.10

2020年2月1日

1.1.9

2020年1月30日

1.1.8

2020年1月30日

1.1.7

2020年1月29日

1.1.6

2020年1月29日

1.1.5

2020年1月28日

1.1.4

2020年1月25日

1.1.2

2020年1月20日

1.1.1

2020年1月9日

1.1.0

2020年1月7日

1.0.2

2019年12月14日

1.0.1

2019年6月2日

1.0.0

2019年5月27日

下载文件

下载您平台上的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分布

ucsc_genomes_downloader-1.1.26.tar.gz (13.4 kB 查看哈希值)

上传时间 2022年4月29日 源

ucsc_genomes_downloader-1.1.26.tar.gz的哈希值

ucsc_genomes_downloader-1.1.26.tar.gz的哈希值
算法	哈希摘要
SHA256	`82e0ce8aed9e42f1a4d2a2bbfed90247ed689830fefff9023767746c4f7ce193`
MD5	`fcf0541765251825a56fba7c8e0c25c2`
BLAKE2b-256	`654b169fa8cfd7262e01bc3125e0ea7c090221847287627a58a0f550fb6183e9`

ucsc-genomes-downloader 1.1.26

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

如何安装此包？

获取COVID-19基因组

使用示例

简单地实例化一个新的基因组

下载选定的染色体

获取间隙区域

获取填充区域

删除基因组缓存

基因组对象表示

获取特定的bed文件序列

属性

实用工具

检索可用基因组的列表

镶嵌bed文件

扩展bed文件区域

摆动bed文件区域

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源分布

ucsc-genomes-downloader 1.1.26

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

如何安装此包？

获取COVID-19基因组

使用示例

简单地实例化一个新的基因组

下载选定的染色体

获取间隙区域

获取填充区域

删除基因组缓存

基因组对象表示

获取特定的bed文件序列

属性

实用工具

检索可用基因组的列表

镶嵌bed文件

扩展bed文件区域

摆动bed文件区域

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源分布

发布历史发布通知 | RSS源