跳转到主要内容

KServe Python SDK

项目描述

KServe Python SDK

KServe服务器和客户端的Python SDK。

安装

KServe Python SDK可以通过pippoetry安装。

pip安装

pip install kserve

要安装具有存储支持的Kserve

pip install kserve[storage]

poetry

通过poetry安装。

make dev_install

要安装具有存储支持的Kserve

poetry install -E storage

poetry install --extras "storage"

KServe Python服务器

KServe的python服务器库实现了一个标准库,该库由Scikit Learn、XGBoost和PyTorch等模型服务框架扩展。它封装了数据平面API定义和模型的存储检索。

它提供了许多功能,包括但不限于

  • 注册模型并启动服务器
  • 预测处理程序
  • 预处理/后处理处理程序
  • 活动处理程序
  • 就绪处理程序

它支持以下存储提供商

  • 具有前缀“gs://”的Google Cloud Storage
    • 默认情况下,它使用GOOGLE_APPLICATION_CREDENTIALS环境变量进行用户认证。
    • 如果未提供GOOGLE_APPLICATION_CREDENTIALS,则将使用匿名客户端下载工件。
  • 具有前缀“s3://”的S3兼容对象存储
    • 默认情况下,它使用环境变量 S3_ENDPOINTAWS_ACCESS_KEY_IDAWS_SECRET_ACCESS_KEY 进行用户认证。
  • Azure Blob 存储格式为:“https://{$STORAGE_ACCOUNT_NAME}.blob.core.windows.net/{$CONTAINER}/{$PATH}”
  • 本地文件系统,可以是没有任何前缀的,也可以是带有前缀“file://”的。例如
    • 绝对路径:/absolute/pathfile:///absolute/path
    • 相对路径:relative/pathfile://relative/path
    • 对于本地文件系统,我们建议使用不带前缀的相对路径。
  • 持久卷声明(PVC)格式为 "pvc://{$pvcname}/[path]"。
    • pvcname 是包含模型的 PVC 的名称。
    • [path] 是 PVC 上模型的相对路径。
    • 例如:pvc://mypvcname/model/path/on/pvc
  • 通用 URI,通过 HTTPHTTPS,分别以 http://https:// 前缀。例如
    • https://<some_url>.com/model.joblib
    • http://<some_url>.com/model.joblib

指标

对于延迟指标,向 /metrics 发送请求。对于每个步骤(预处理/后处理、解释、预测),Prometheus 延迟直方图都会发出。此外,每个步骤的延迟都会在每个请求中记录。

指标名称 描述 类型
request_preprocess_seconds 预处理请求延迟 直方图
request_explain_seconds 解释请求延迟 直方图
request_predict_seconds 预测请求延迟 直方图
request_postprocess_seconds 预处理请求延迟 直方图

KServe 客户端

入门指南

KServe 的 Python 客户端与 KServe 控制平面 API 交互,以在远程 KServe 集群上执行操作,例如创建、修补和删除 InferenceService 实例。请参阅 Python SDK 客户端示例 以开始使用。

客户端 API 文档

请查阅 KServe 客户端 API 文档。

模型文档

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

kserve-0.13.1.tar.gz (330.3 kB 查看哈希值)

上传时间 源代码

构建分发

kserve-0.13.1-py3-none-any.whl (452.7 kB 查看哈希值)

上传时间 Python 3

支持者