跳转到主要内容

高效读写FASTA和FASTQ文件

项目描述

https://zenodo.org/badge/DOI/10.5281/zenodo.10548864.svg GitHub Actions badge PyPI badge Codecov badge

dnaiO处理FASTQ、FASTA和uBAM文件

dnaio 是一个适用于Python 3.8+的库,用于非常高效的解析和写入FASTQ文件,以及也支持FASTA文件。自dnaio版本1.1.0起,已实现高效解析uBAM文件的支持。这允许直接从dorado basecaller读取ONT文件。

代码之前是Cutadapt工具的一部分,自从它被拆分出来后已经进行了显著改进。

示例用法

主要接口是dnaio.open函数

import dnaio

with dnaio.open("reads.fastq.gz") as f:
    bp = 0
    for record in f:
        bp += len(record)
print(f"The input file contains {bp/1E6:.1f} Mbp")

有关更多信息,请参阅教程API文档

安装

使用pip

pip install dnaio zstandard

如果不需要Zstandard (.zst)文件的支持,则可以省略zstandard

功能和支持文件类型

  • FASTQ输入和输出

  • FASTA输入和输出

  • BAM输入

  • 压缩输入和输出 (.gz.bz2.xz.zst会自动检测)

  • 两个文件中的配对端数据

  • 单个文件中的交错配对端数据

  • 支持读取带有DOS/Windows行结束符的文件

  • 支持带有第二个标题行(在+之后)的FASTQ文件

局限性

  • 不支持多行FASTQ文件

  • FASTQ和uBAM解析是该库的重点。FASTA解析器未进行优化

项目详情


下载文件

下载适合您平台的应用程序。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

dnaio-1.2.2.tar.gz (59.4 kB 查看哈希值)

上传时间

构建分发

dnaio-1.2.2-cp312-cp312-win_amd64.whl (86.1 kB 查看哈希值)

上传时间 CPython 3.12 Windows x86-64

dnaio-1.2.2-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (109.6 kB 查看哈希值)

上传时间 CPython 3.12 manylinux: glibc 2.17+ x86-64

dnaio-1.2.2-cp312-cp312-macosx_11_0_arm64.whl (90.1 kB 查看哈希值)

上传时间 CPython 3.12 macOS 11.0+ ARM64

dnaio-1.2.2-cp312-cp312-macosx_10_9_x86_64.whl (95.9 kB 查看哈希值)

上传时间 CPython 3.12 macOS 10.9+ x86-64

dnaio-1.2.2-cp311-cp311-win_amd64.whl (86.5 kB 查看哈希值)

上传时间 CPython 3.11 Windows x86-64

dnaio-1.2.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (111.6 kB 查看哈希值)

上传时间 CPython 3.11 manylinux: glibc 2.17+ x86-64

dnaio-1.2.2-cp311-cp311-macosx_11_0_arm64.whl (89.2 kB 查看哈希值)

上传时间 CPython 3.11 macOS 11.0+ ARM64

dnaio-1.2.2-cp311-cp311-macosx_10_9_x86_64.whl (95.4 kB 查看哈希值)

上传时间 CPython 3.11 macOS 10.9+ x86-64

dnaio-1.2.2-cp310-cp310-win_amd64.whl (86.9 kB 查看哈希值)

上传时间 CPython 3.10 Windows x86-64

dnaio-1.2.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (111.7 kB 查看哈希值)

上传时间 CPython 3.10 manylinux: glibc 2.17+ x86-64

dnaio-1.2.2-cp310-cp310-macosx_11_0_arm64.whl (89.4 kB 查看哈希值)

上传时间 CPython 3.10 macOS 11.0+ ARM64

dnaio-1.2.2-cp310-cp310-macosx_10_9_x86_64.whl (95.3 kB 查看哈希值)

上传时间 CPython 3.10 macOS 10.9+ x86-64

dnaio-1.2.2-cp39-cp39-win_amd64.whl (87.5 kB 查看哈希值)

上传时间 CPython 3.9 Windows x86-64

dnaio-1.2.2-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (113.0 kB 查看哈希值)

上传时间 CPython 3.9 manylinux: glibc 2.17+ x86-64

dnaio-1.2.2-cp39-cp39-macosx_11_0_arm64.whl (89.9 kB 查看哈希值)

上传时间 CPython 3.9 macOS 11.0+ ARM64

dnaio-1.2.2-cp39-cp39-macosx_10_9_x86_64.whl (95.9 kB 查看哈希值)

上传于 CPython 3.9 macOS 10.9+ x86-64

dnaio-1.2.2-cp38-cp38-win_amd64.whl (87.6 kB 查看哈希值)

上传于 CPython 3.8 Windows x86-64

dnaio-1.2.2-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (113.4 kB 查看哈希值)

上传于 CPython 3.8 manylinux: glibc 2.17+ x86-64

dnaio-1.2.2-cp38-cp38-macosx_11_0_arm64.whl (89.6 kB 查看哈希值)

上传于 CPython 3.8 macOS 11.0+ ARM64

dnaio-1.2.2-cp38-cp38-macosx_10_9_x86_64.whl (95.2 kB 查看哈希值)

上传于 CPython 3.8 macOS 10.9+ x86-64

由以下机构支持

AWSAWS 云计算和安全赞助商 DatadogDatadog 监控 FastlyFastly CDN GoogleGoogle 下载分析 MicrosoftMicrosoft PSF赞助商 PingdomPingdom 监控 SentrySentry 错误日志 StatusPageStatusPage 状态页面