跳转到主要内容

Lemos等人2024年的PQMass双样本测试实现

项目描述

PQMass:使用概率质量估计对生成模型的质量进行概率评估

PyPI - Version CI Code style: black PyPI - Downloads arXiv

Lemos等人2024年的PQMass双样本测试实现在此

安装

只需这样做

pip install pqm

使用方法

这是主要的使用案例

from pqm import pqm_pvalue, pqm_chi2
import numpy as np

x_sample = np.random.normal(size = (500, 10))
y_sample = np.random.normal(size = (400, 10))

# To get pvalues from PQMass
pvalues = pqm_pvalue(x_sample, y_sample, num_refs = 100, re_tessellation = 50)
print(np.mean(pvalues), np.std(pvalues))

# To get chi^2 from PQMass
chi2_stat = pqm_chi2(x_sample, y_sample, num_refs = 100, re_tessellation = 50)
print(np.mean(chi2_stat), np.std(chi2_stat))

如果您的两个样本是从同一分布中抽取的,那么p值应该从随机均匀(0,1)分布中抽取。这意味着如果您得到一个非常小的值(即,1e-6),那么您已经失败了零假设检验,并且两个样本不是从同一分布中抽取的。

对于卡方指标,给定你的两组样本,如果它们来自同一分布,你的卡方值的直方图应该遵循卡方分布。该分布的峰值将在自由度 - 2 处,标准差为 √(2 * DoF)。如果你的直方图偏离预期的卡方分布向右,这表明样本不在分布中。相反,如果直方图偏离左侧,这表明可能存在重复或记忆(特别是对于生成模型来说尤为重要)。

开发中

如果你是开发者

git clone git@github.com:Ciela-Institute/PQM.git
cd PQM
git checkout -b my-new-branch
pip install -e .

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

pqm-0.5.1.tar.gz (289.1 kB 查看哈希)

上传时间

构建分布

pqm-0.5.1-py3-none-any.whl (7.3 kB 查看哈希)

上传时间 Python 3

由以下组织支持