跳转到主要内容

使用sentence-transformers进行LLM嵌入

项目描述

llm-sentence-transformers

PyPI Changelog Tests License

LLM 插件,用于使用 sentence-transformers 进行嵌入模型

进一步阅读

安装

将此插件安装在与LLM相同的环境中。

llm install llm-sentence-transformers

配置

安装插件后,您需要注册一个或多个模型才能使用它。默认注册的 all-MiniLM-L6-v2 模型将在您第一次使用时下载。

您可以像这样尝试该模型

llm embed -m mini-l6 -c 'hello'

这将返回一个浮点数JSON数组。

您可以使用 llm sentence-transformers register 命令添加更多模型。这里有可用的模型列表

两个可以开始实验的好模型是 all-MiniLM-L12-v2 - 一个120MB的下载 - 和 all-mpnet-base-v2,它是420MB。

要安装 all-mpnet-base-v2 模型,运行

llm sentence-transformers register \
  all-mpnet-base-v2 \
  --alias mpnet

--alias 是可选的,但可以用来为模型配置一个或多个较短的别名。

您可以使用 llm aliases 运行来确认您已配置的别名,并使用 llm aliases set 来配置更多别名。

用法

安装嵌入模型后,您可以像这样使用它

llm embed -m sentence-transformers/all-mpnet-base-v2 \
  -c "Hello world"

或使用其别名

llm embed -m mpnet -c "Hello world"

将嵌入存储在数据库中会更加有用 - 有关如何操作的说明,请参阅 LLM 文档

务必查看您所使用模型的文档。许多模型会默认截断超过一定数量的令牌的内容。《all-mpnet-base-v2》说明“输入文本超过384个词元将被截断”,例如。

开发

要本地设置此插件,首先检出代码。然后创建一个新的虚拟环境

cd llm-sentence-transformers
python3 -m venv venv
source venv/bin/activate

现在安装依赖项并测试依赖项

pip install -e '.[test]'

要运行测试

pytest

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源分布

llm-sentence-transformers-0.2.tar.gz (8.3 kB 查看哈希)

上传

构建分布

llm_sentence_transformers-0.2-py3-none-any.whl (8.4 kB 查看哈希)

上传 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面