跳转到主要内容

该存储库包含运行更快sentence-transformers的代码。简单,快速,sentence-transformers。

项目描述

快速句子转换器

该存储库包含使用量化、优化和ONNX等工具运行更快特征提取器的代码。只需运行您的模型,同时使用更少的内存。没有太多的事情!

Python package Current Release Version pypi Version PyPi downloads Code style: black

Phillip Schmid: "我们成功地将Hugging Face的原始Transformers模型进行了量化,并将模型延迟从25.6ms加速到12.3ms或2.09倍,同时保持了stsb数据集上的100%准确率。但我要说的是,这不是一个可以转移到任何Transformers模型、任务或数据集的即插即用过程。"

安装

pip install fast-sentence-transformers

或者,用于GPU支持

pip install fast-sentence-transformers[gpu]

快速入门

from fast_sentence_transformers import FastSentenceTransformer as SentenceTransformer

# use any sentence-transformer
encoder = SentenceTransformer("all-MiniLM-L6-v2", device="cpu")

encoder.encode("Hello hello, hey, hello hello")
encoder.encode(["Life is too short to eat bad food!"] * 2)

基准

非精确、指示性的速度和内存使用基准,针对sentence-transformers上的较小和较大模型

模型 类型 默认 ONNX ONNX+量化 ONNX+GPU
paraphrase-albert-small-v2 内存 1x 1x 1x 1x
速度 1x 2x 5x 20x
paraphrase-multilingual-mpnet-base-v2 内存 1x 1x 4x 4x
速度 1x 2x 5x 20x

Shout-Out

本软件包高度依赖https://www.philschmid.de/optimize-sentence-transformers

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

fast_sentence_transformers-0.5.tar.gz (5.4 kB 查看哈希值)

上传时间

构建分布

fast_sentence_transformers-0.5-py3-none-any.whl (6.0 kB 查看哈希值)

上传时间 Python 3

由以下组织支持