Lemos等人2024年的PQMass双样本测试实现
项目描述
PQMass:使用概率质量估计对生成模型的质量进行概率评估
Lemos等人2024年的PQMass双样本测试实现在此
安装
只需这样做
pip install pqm
使用方法
这是主要的使用案例
from pqm import pqm_pvalue, pqm_chi2
import numpy as np
x_sample = np.random.normal(size = (500, 10))
y_sample = np.random.normal(size = (400, 10))
# To get pvalues from PQMass
pvalues = pqm_pvalue(x_sample, y_sample, num_refs = 100, re_tessellation = 50)
print(np.mean(pvalues), np.std(pvalues))
# To get chi^2 from PQMass
chi2_stat = pqm_chi2(x_sample, y_sample, num_refs = 100, re_tessellation = 50)
print(np.mean(chi2_stat), np.std(chi2_stat))
如果您的两个样本是从同一分布中抽取的,那么p值应该从随机均匀(0,1)分布中抽取。这意味着如果您得到一个非常小的值(即,1e-6),那么您已经失败了零假设检验,并且两个样本不是从同一分布中抽取的。
对于卡方指标,给定你的两组样本,如果它们来自同一分布,你的卡方值的直方图应该遵循卡方分布。该分布的峰值将在自由度 - 2 处,标准差为 √(2 * DoF)。如果你的直方图偏离预期的卡方分布向右,这表明样本不在分布中。相反,如果直方图偏离左侧,这表明可能存在重复或记忆(特别是对于生成模型来说尤为重要)。
开发中
如果你是开发者
git clone git@github.com:Ciela-Institute/PQM.git
cd PQM
git checkout -b my-new-branch
pip install -e .
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分布
pqm-0.5.1.tar.gz (289.1 kB 查看哈希)
构建分布
pqm-0.5.1-py3-none-any.whl (7.3 kB 查看哈希)