跳转到主要内容

基于百分比的初始化实现

项目描述

初始化 是一个Python库,允许您从数据中构建置信区间。这在各种环境中都很有用,包括在临时的a/b测试分析期间。

激励示例 - A/B测试

想象我们拥有一个网站,并认为更改“订阅”按钮的颜色将提高注册率。衡量改进的一种方法是通过A/B测试进行,其中我们向50%的人展示旧版本,向另外50%的人展示新版本。我们可以使用初始化来了解按钮颜色如何提高响应率,并给出与测试相关的误差棒 - 这将给出我们期望变化有多好的下限和上限!

要点 - 样本均值

给定一组数据 - 我们可以通过从我们所收集的“重新抽样”来生成大量新的样本。我们计算每个生成样本的均值。我们可以使用生成样本的均值来了解更大人群中的变化,并可以构建真实均值的误差棒。

初始化 - 优点

  • 高效计算置信区间

  • 处理单个群体和a/b测试的函数

  • 了解统计功效的函数

  • 多线程支持,以加速初始化计算

  • 支持密集和稀疏数组

示例用法

import numpy as np
import bootstrapped.bootstrap as bs
import bootstrapped.stats_functions as bs_stats

mean = 100
stdev = 10

population = np.random.normal(loc=mean, scale=stdev, size=50000)

# take 1k 'samples' from the larger population
samples = population[:1000]

print(bs.bootstrap(samples, stat_func=bs_stats.mean))
>> 100.08  (99.46, 100.69)

print(bs.bootstrap(samples, stat_func=bs_stats.std))
>> 9.49  (9.92, 10.36)

扩展示例

要求

bootstrapped 需要安装 numpy。功率分析函数需要 matplotlib 和 pandas。

安装

pip install bootstrapped

bootstrapped 的工作原理

bootstrapped 提供基于重采样(替换)的基于经验的重要(即经验)置信区间。还提供了百分位数方法。

更多信息请参阅

  1. Bootstrap 置信区间(良好介绍)

  2. Bootstrap 方法简介

  3. Bootstrap,高级数据分析

  4. 当 Bootstrap 不起作用时

  5. (书籍)Bootstrap 简介

  6. (书籍)Bootstrap 方法及其应用

有关如何帮助的更多信息,请参阅 CONTRIBUTING 文件。

贡献者

Spencer Beecher,Don van der Drift,David Martin,Lindsay Vass,Sergey Goder,Benedict Lim,和 Matt Langner。

特别感谢 Eytan Bakshy。

许可证

bootstrapped 采用 BSD 许可证。我们还提供额外的专利许可。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关 安装软件包 的更多信息。

源代码分发

bootstrapped-0.0.2.tar.gz (11.6 kB 查看散列)

上传时间 源代码

由以下支持