基于百分比的初始化实现
项目描述
初始化 是一个Python库,允许您从数据中构建置信区间。这在各种环境中都很有用,包括在临时的a/b测试分析期间。
激励示例 - A/B测试
想象我们拥有一个网站,并认为更改“订阅”按钮的颜色将提高注册率。衡量改进的一种方法是通过A/B测试进行,其中我们向50%的人展示旧版本,向另外50%的人展示新版本。我们可以使用初始化来了解按钮颜色如何提高响应率,并给出与测试相关的误差棒 - 这将给出我们期望变化有多好的下限和上限!
要点 - 样本均值
给定一组数据 - 我们可以通过从我们所收集的“重新抽样”来生成大量新的样本。我们计算每个生成样本的均值。我们可以使用生成样本的均值来了解更大人群中的变化,并可以构建真实均值的误差棒。
初始化 - 优点
高效计算置信区间
处理单个群体和a/b测试的函数
了解统计功效的函数
多线程支持,以加速初始化计算
支持密集和稀疏数组
示例用法
import numpy as np
import bootstrapped.bootstrap as bs
import bootstrapped.stats_functions as bs_stats
mean = 100
stdev = 10
population = np.random.normal(loc=mean, scale=stdev, size=50000)
# take 1k 'samples' from the larger population
samples = population[:1000]
print(bs.bootstrap(samples, stat_func=bs_stats.mean))
>> 100.08 (99.46, 100.69)
print(bs.bootstrap(samples, stat_func=bs_stats.std))
>> 9.49 (9.92, 10.36)
扩展示例
要求
bootstrapped 需要安装 numpy。功率分析函数需要 matplotlib 和 pandas。
安装
pip install bootstrapped
bootstrapped 的工作原理
bootstrapped 提供基于重采样(替换)的基于经验的重要(即经验)置信区间。还提供了百分位数方法。
更多信息请参阅
Bootstrap 置信区间(良好介绍)
(书籍)Bootstrap 简介
(书籍)Bootstrap 方法及其应用
有关如何帮助的更多信息,请参阅 CONTRIBUTING 文件。
贡献者
Spencer Beecher,Don van der Drift,David Martin,Lindsay Vass,Sergey Goder,Benedict Lim,和 Matt Langner。
特别感谢 Eytan Bakshy。
许可证
bootstrapped 采用 BSD 许可证。我们还提供额外的专利许可。
项目详情
关闭
bootstrapped-0.0.2.tar.gz 的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 7d2cc81642c86dd3426518e1aa3e828f227ffb423fabaeaf4acc7e268d02f9e9 |
|
MD5 | 9351d190a2a5b23cf893d2dc679df624 |
|
BLAKE2b-256 | b2f7beb22809fdc4781ae73d12c78e2cf14ae533ad9eec2fb84ec22e5b0b660c |