跳转到主要内容

ONNX Runtime generate() API

项目描述

ONNX Runtime generate() API

使用ONNX Runtime在设备上和云中运行SLMs/LLMs和多模态模型。

目前支持的模型架构(更多即将推出):Gemma、Llama、Mistral、Phi(语言和视觉)。

更多详细信息,请参阅:文档 https://runtime.onnx.org.cn/docs/genai 和仓库: https://github.com/microsoft/onnxruntime-genai

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。

源分布

此版本没有提供源分布文件。请参阅 生成分布存档的教程

构建分布

onnxruntime_genai_cuda-0.4.0-cp312-cp312-win_amd64.whl (14.5 MB 查看散列)

上传时间: CPython 3.12 Windows x86-64

onnxruntime_genai_cuda-0.4.0-cp312-cp312-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (15.3 MB 查看哈希值)

上传时间: CPython 3.12 manylinux: glibc 2.27+ x86-64 manylinux: glibc 2.28+ x86-64

onnxruntime_genai_cuda-0.4.0-cp311-cp311-win_amd64.whl (14.5 MB 查看哈希值)

上传时间: CPython 3.11 Windows x86-64

onnxruntime_genai_cuda-0.4.0-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (15.3 MB 查看哈希值)

上传时间: CPython 3.11 manylinux: glibc 2.27+ x86-64 manylinux: glibc 2.28+ x86-64

onnxruntime_genai_cuda-0.4.0-cp310-cp310-win_amd64.whl (14.5 MB 查看哈希值)

上传时间: CPython 3.10 Windows x86-64

onnxruntime_genai_cuda-0.4.0-cp310-cp310-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (15.3 MB 查看哈希值)

上传时间: CPython 3.10 manylinux: glibc 2.27+ x86-64 manylinux: glibc 2.28+ x86-64

onnxruntime_genai_cuda-0.4.0-cp39-cp39-win_amd64.whl (14.5 MB 查看哈希值)

上传时间: CPython 3.9 Windows x86-64

onnxruntime_genai_cuda-0.4.0-cp39-cp39-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (15.3 MB 查看哈希值)

上传时间: CPython 3.9 manylinux: glibc 2.27+ x86-64 manylinux: glibc 2.28+ x86-64

onnxruntime_genai_cuda-0.4.0-cp38-cp38-win_amd64.whl (14.5 MB 查看哈希值)

上传时间: CPython 3.8 Windows x86-64

onnxruntime_genai_cuda-0.4.0-cp38-cp38-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (15.3 MB 查看哈希值)

上传时间: CPython 3.8 manylinux: glibc 2.27+ x86-64 manylinux: glibc 2.28+ x86-64

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面