使用k-mer草图比较生物序列的工具
项目描述
sourmash
快速搜索、比较和分析基因组与宏基因组数据集。
用法
sourmash sketch dna *.fq.gz
sourmash compare *.sig -o distances.cmp -k 31
sourmash plot distances.cmp
sourmash 1.0 已在 JOSS 上发表;如果使用 sourmash,请引用该论文(doi: 10.21105/joss.06830):
最新主要版本是 sourmash v4,与旧版本存在一些命令行和 Python 不兼容性问题。请访问我们的迁移指南升级!
sourmash 是一个 k-mer 分析多工具,我们旨在提供稳定、健壮的程序化和命令行 API,用于各种序列比较。我们的一些特色包括
FracMinHash
sketching,允许在不同大小数据集之间进行准确比较(包括 ANI)sourmash gather
,一种组合 k-mer 方法,用于更精确的宏基因组分析
请参阅sourmash 发表物以获取详细信息。
这个名字是对 Mash 的致敬,结合了 @ctb 对威士忌的喜爱。(酸浆 用于制作威士忌。)
维护者:C. Titus Brown (@ctb),Luiz C. Irber, Jr (@luizirber),以及 N. Tessa Pierce-Ward (@bluegenes)。
sourmash 最初由 数据密集型生物学实验室 开发,该实验室位于 UC Davis 兽医学院,现在包括来自全球研究者和开发者社区的贡献。
安装
我们建议使用 conda-forge 安装 sourmash
conda install -c conda-forge sourmash-minimal
这将安装 sourmash 4 的最新稳定版本。
您也可以使用 pip 安装 sourmash
pip install sourmash
快速入门教程可用。
要求
sourmash 在 Windows、Mac OS X 和 Linux 上使用 Python 3.10 及以上版本运行。基本要求是 screed、cffi、numpy、matplotlib 和 scipy。conda 将安装所有必需的软件包,并且是我们推荐安装方法(见下文)。
使用 conda 安装
conda-forge 是 conda 包管理器的一个社区维护频道。安装 conda 后,您可以通过运行以下命令安装 sourmash:
$ conda create -n sourmash_env -c conda-forge sourmash-minimal
$ conda activate sourmash_env
$ sourmash --help
这将安装最新发布的版本。
支持
如有疑问,请通过 Github 上的问题打开问题,或在我们的聊天中提问。
开发
开发在 github 上的sourmash-bio/sourmash进行。
sourmash 使用 Python 和 Rust 开发,您需要 Rust 环境来构建它;请参阅开发人员说明以获取我们建议的开发设置。
安装后,sourmash
是主要的命令行入口点;使用 python -m sourmash
运行它,或者通过 pip install -e /path/to/repo
在虚拟环境中进行开发者安装。
sourmash/
目录包含 Python 库和命令行界面代码。
src/core/
目录包含实现核心功能的 Rust 库。
测试需要 py.test,可以使用 make test
运行。
有关设置开发环境的更多信息,请参阅开发者说明。
CTB 2024年1月
项目详情
sourmash-4.8.11.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1a06a76df464b92685779aaaa6ed02a577bdd73a4ab32972e8134581034d34bf |
|
MD5 | 481d16560efdb7c8ce7bc64550e6b1f3 |
|
BLAKE2b-256 | 68601945250c5b312f23b86f61ab0ca0e1f1b03f9ba44cd6c979a334b6cdab2a |
sourmash-4.8.11-py3-none-win_amd64.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b584193bddbc5a71e2baf1ea88b21384f8a6a06f3752d9d2b1ae956b255e65b6 |
|
MD5 | 42bfef461d4b19bfa8feb361d733d508 |
|
BLAKE2b-256 | 98171b34fa227c0f2a8f2c83e97c66fa6f5e5a71ab9c87ef4db7880526451f1b |
sourmash-4.8.11-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 19141ff6763ca4c59ebfe6ef948a7619cb5cf75c6d12461b7984cc5f76618ecf |
|
MD5 | 8d1f2beab73cfe90fe1d1a5fc5df613b |
|
BLAKE2b-256 | fd504611b4c97c6811b4a534067efc89c082b19d234eb6c40d68baa6dc8ba764 |
sourmash-4.8.11-py3-none-manylinux_2_17_aarch64.manylinux2014_aarch64.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6d4ccd0429945b57318ab537b9d84c40697d0e3cda3c8cc41c54eb9dc66dc85b |
|
MD5 | 3c6f0f2a0104ad54244a53834bd7e687 |
|
BLAKE2b-256 | e36d5f17e969d3d465d466ea8a945d77e052635463a412d7ace6b8a05f31a188 |
sourmash-4.8.11-py3-none-macosx_11_0_x86_64.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6dcb358c2122e8e9f0c020ee28466c0a61f12f14506424da69c07f590823c358 |
|
MD5 | cb0fb25ce4ba9824c35a5e1a3e935e26 |
|
BLAKE2b-256 | b695d698631c05d2c0b15ce7d5c52f64cedd7996ea39e3174d397abe14f244a5 |
sourmash-4.8.11-py3-none-macosx_11_0_arm64.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 49304432fd50a02e796c40677a6587565a8fecb87d97168ac770e38e803aa269 |
|
MD5 | 82958b15e2de88abaab1685f9bed20a3 |
|
BLAKE2b-256 | a36fac146d27d37a120d170c5e13ea01fc8b2b1644f9ec5b4881266ccdec953b |