跳转到主要内容

sourcehash插件,用于计算多个sketch中的公共哈希。

项目描述

sourmash_plugin_commonhash

如果您已经绘制了许多样本,并且想要删除“罕见”的k-mer(只存在于1个或几个样本中),此插件适合您!此过程有助于减少样本之间的Jaccard比较中的噪声。

有关更详细的讨论,请参阅 sourmash#2383

感谢Taylor Reiter和Jessica Lumian为此所做的一切!

安装

pip install sourmash_plugin_commonhash

用法

sourmash scripts commonhash <multiple sketches> -o commonhashes.zip

commonhash将为每个输入sketch输出一个过滤后的sketch。然后您可以使用各种 sourmash sig 命令来合并这些sketch,提取单个的,等等。

示例

sourmash scripts commonhash examples/*.sig.gz -o commonhash.zip

应该产生

...

Selecting k=31, DNA
Loaded 10587 hashes from 3 sketches in 3 files.
Of 10587 hashes, keeping 2529 that are in 2 or more samples.
Saved 3 signatures to 'commonhash.zip'

支持

我们建议在 主要sourmash问题跟踪器 上提交问题,因为它会得到更多的关注!

开发文档

commonhashhttps://github.com/ctb/sourmash_plugin_commonhash 上开发。

生成发布版本

pyproject.toml 中提升版本号并推送。

在GitHub上创建新的发布。

然后拉取,并

python -m build

接着运行 twine upload dist/...

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源代码分发

sourmash_plugin_commonhash-0.4.tar.gz (4.8 kB 查看哈希)

上传时间: 源代码

构建分发

sourmash_plugin_commonhash-0.4-py3-none-any.whl (5.0 kB 查看哈希值)

上传时间: Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面