自动且统一测量许多AI系统的行为。

这些详情尚未由PyPI验证

项目链接

项目描述

ModelGauge

目标：使自动和统一测量许多AI系统的行为变得简单。

[!警告] 此存储库仍在 测试版，计划在2024年秋季进行全面发布。在此期间，我们保留根据需要做出向后不兼容更改的权利。

ModelGauge 是 crfm-helm 的演变，旨在满足其现有用例以及 MLCommons AI Safety 项目所需的用例。

摘要

ModelGauge 是一个库，提供了一组接口，用于测试和受测试系统（SUT），使得

每个测试都可以应用于所有具有所需底层能力（例如，它是否接受文本输入）的SUT。
添加新的测试或SUT无需修改核心库或ModelGauge作者的支援。

目前，ModelGauge 针对LLM和单轮提示响应测试，由自动注释器（例如 LlamaGuard）评分。然而，我们预计随着我们向全面发布迈进，将扩展库以涵盖更多测试、SUT和注释类型。

文档

项目详情

这些详情尚未由PyPI验证

项目链接

发布历史发布通知 | RSS源

此版本

0.6.3

2024年9月13日

0.6.2

2024年9月5日

0.6.1

2024年9月5日

0.6.0

2024年8月6日

0.5.1

2024年4月27日

0.5.0

2024年4月15日

0.3.3

2024年4月12日

下载文件

下载适用于您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分发

modelgauge-0.6.3.tar.gz (55.5 kB 查看哈希值)

上传时间 2024年9月13日 源

构建分发

modelgauge-0.6.3-py3-none-any.whl (72.5 kB 查看哈希值)

上传时间 2024年9月13日 Python 3

哈希值 for modelgauge-0.6.3.tar.gz

modelgauge-0.6.3.tar.gz 的哈希值
算法	哈希摘要
SHA256	`181ad1f691e5d3bdd3b1de519919ec48da9618cdd3eaebd38d4b655af9391e8b`
MD5	`1d556c642d2e0630335cf1459108f079`
BLAKE2b-256	`51796892bea160dda36c74bbe8c4275db4351df7f3d3469e98e1abdecbbbf9fe`

哈希值 for modelgauge-0.6.3-py3-none-any.whl

modelgauge-0.6.3-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`a7317b1a8d39221b1ea8455cdb49c895959e57890a0254a26cc1e0ad03ad4344`
MD5	`d8787fd74768ff78060ffa6c1e302a94`
BLAKE2b-256	`61d2dccef44f5399c0ade89ecf319e25ef6f4e9dbec5c71bf84e6d1eae214d84`

modelgauge 0.6.3

导航

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

项目描述

ModelGauge

摘要

文档

项目详情

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源分发

构建分发

modelgauge 0.6.3

导航

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

项目描述

ModelGauge

摘要

文档

项目详情

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源分发

构建分发

发布历史发布通知 | RSS源