运行GGUF文件分发的模型

这些详情尚未由PyPI验证

项目链接

项目描述

llm-gguf

使用LLM运行以GGUF文件形式分发的模型

安装

在LLM相同的环境中安装此插件

llm install llm-gguf

用法

此插件运行以GGUF文件形式分发的模型。

您可以让插件直接下载这些文件，或者您可以注册已下载的模型。

要下载Llama 3.1 8B Instruct的LM Studio GGUF，请运行以下命令

llm gguf download-model \
  https://hugging-face.cn/lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF/resolve/main/Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf \
  --alias llama-3.1-8b-instruct --alias l31i

使用--alias选项设置该模型的别名，如果您不想设置任何别名，则可以省略。

此命令将下载4.92GB的文件，并将其存储在运行llm gguf models-dir时显示的目录中 - 在macOS上，这将是在~/Library/Application Support/io.datasette.llm/gguf/models。

运行llm models以确认已安装模型。

然后您可以像这样运行该模型的提示

llm -m gguf/Meta-Llama-3.1-8B-Instruct-Q4_K_M 'Five great names for a pet lemur'

或者使用您设置的别名之一，例如

llm -m l31i 'Five great names for a pet lemur'

您可以使用llm chat与该模型启动持久聊天会话 - 这将避免在每个提示时将模型加载到内存中

llm chat -m l31i

Chatting with gguf/Meta-Llama-3.1-8B-Instruct-Q4_K_M
Type 'exit' or 'quit' to exit
Type '!multi' to enter multiple lines, then '!end' to finish
> tell me a joke about a walrus, a pelican and a lemur getting lunch
Here's one: Why did the walrus, the pelican, and the lemur go to the cafeteria for lunch? ...

如果您已经下载了模型，则可以像这样使用插件注册它，同时保持文件在当前位置

llm gguf register-model \
  ~/Downloads/Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf \
  --alias llama-3.1-8b-instruct --alias l31i

此插件目前仅适用于聊天模型 - 这些模型通常以具有前缀-Instruct、-Chat或类似的文件分发。

对于非聊天模型，您可能更适合使用较旧的llm-llama-cpp插件。

开发

要本地设置此插件，首先检出代码。然后创建一个新的虚拟环境

cd llm-gguf
python3 -m venv venv
source venv/bin/activate

现在安装依赖项和测试依赖项

llm install -e '.[test]'

运行测试

pytest

项目详情

这些详情尚未由PyPI验证

项目链接

发行历史发行通知 | RSS源

本版本

0.1a0 预发布

2024年7月23日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解有关安装包的更多信息。

源分发

llm_gguf-0.1a0.tar.gz (8.5 kB 查看哈希值)

上传时间 2024年7月23日 源

构建分发

llm_gguf-0.1a0-py3-none-any.whl (8.8 kB 查看哈希值)

上传时间 2024年7月23日 Python 3

llm_gguf-0.1a0.tar.gz的哈希值

llm_gguf-0.1a0.tar.gz的哈希值
算法	哈希摘要
SHA256	`4c5ed29f9fbafc5bb917b5b93115650d707b24fefcc83039c8bf0e6dbe120fb4`
MD5	`d2f6f22bfb25d1325ae51ec963a8dbe6`
BLAKE2b-256	`24f64502d240c03bcd16839bbf8921d9963f2a8fd18e28ee225c782087a44665`

llm_gguf-0.1a0-py3-none-any.whl的哈希值

llm_gguf-0.1a0-py3-none-any.whl的哈希值
算法	哈希摘要
SHA256	`8ec81023b844f35b6280cd8c868279ca04e5a1da6978e9c03b23bb2f6b6f8b09`
MD5	`04471f7b9b85939dbe42a2b3fa015dd0`
BLAKE2b-256	`6ae48ad223859b52207f0c507a288884de4893bb09838b8a7c3a9596e10a16d8`

llm-gguf 0.1a0

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

llm-gguf

安装

用法

开发

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发行历史发行通知 | RSS源

下载文件

源分发

构建分发

llm-gguf 0.1a0

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

llm-gguf

安装

用法

开发

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发行历史 发行通知 | RSS源

下载文件

源分发

构建分发

发行历史发行通知 | RSS源