跳转到主要内容

Python的高维统计推断工具

项目描述

HiDimStat: Python的高维统计推断工具

Build codecov CodeStyle

HiDimStat软件包提供统计推断方法来解决高维和空间结构数据中的支持恢复问题。

安装

HiDimStat仅适用于Python 3,最好使用Python 3.6以上版本。要从终端安装,请运行以下命令

pip install hidimstat

或者如果您想使用最新版本(例如,为开发此项目做出贡献)

pip install -U git+https://github.com/mind-inria/hidimstat.git

或者

git clone https://github.com/mind-inria/hidimstat.git
cd hidimstat
pip install -e .

依赖项

joblib
numpy
scipy
scikit-learn

要运行示例,需要安装 matplotlib,而要运行测试,还需要安装 pytest

文档 & 示例

HiDimStat的所有文档均可在https://mind-inria.github.io/hidimstat/找到。

截至目前,在examples文件夹中有三个Python脚本,展示了如何使用主要的HiDimStat函数。在每个脚本中,我们处理不同类型的数据集:plot_2D_simulation_example.py处理具有2D空间结构的模拟数据集,plot_fmri_data_example.py解决Haxby fMRI数据集的解码问题,plot_meg_data_example.py解决多个MEG/EEG数据集的源定位问题。

# For example run the following command in terminal
python plot_2D_simulation_example.py

参考文献

本软件包中开发的算法已在多个会议/期刊文章中详细介绍,可以在https://mind-inria.github.io/research.html下载。

主要参考文献

聚类去稀疏Lasso(ECDL)

  • Chevalier, J. A., Salmon, J., & Thirion, B. (2018). 使用聚类去稀疏Lasso进行统计推断. 在国际医学图像计算与计算机辅助干预会议(第638-646页)。Springer, Cham.

  • Chevalier, J. A., Nguyen, T. B., Thirion, B., & Salmon, J. (2021). 高维线性模型的空间放松推断. arXiv预印本arXiv:2106.02590。

多重敲除(AKO)聚合

  • Nguyen T.-B., Chevalier J.-A., Thirion B., & Arlot S. (2020). 多重敲除的聚合. 在第37届国际机器学习会议,维也纳,奥地利,PMLR 119。

解码(fMRI数据)应用

  • Chevalier, J. A., Nguyen T.-B., Salmon, J., Varoquaux, G. & Thirion, B. (2021). 解码的置信度:解码映射的统计控制. 在神经影像学,234,117921。

源定位(MEG/EEG数据)应用

  • Chevalier, J. A., Gramfort, A., Salmon, J., & Thirion, B. (2020). 使用去稀疏多任务Lasso对时空MEG/EEG源成像进行统计控制. 在第34届神经信息处理系统会议(NeurIPS 2020),加拿大温哥华。

使用条件置换进行单/组统计验证的重要性

  • Chamma, A., Thirion, B., & Engemann, D. (2024). 高维环境下的变量重要性需要分组. 在第38届人工智能协会(AAA)会议(AAA 2024),加拿大温哥华。

  • Chamma, A., Engemann, D., & Thirion, B. (2023). 通过条件置换进行统计有效的变量重要性评估. 在第37届神经信息处理系统会议(NeurIPS 2023),美国新奥尔良。

如果您使用我们的包,我们希望引用上述相关论文。

其他有用的参考文献

关于去稀疏(或去偏)Lasso

  • Javanmard, A., & Montanari, A. (2014). 高维回归的置信区间和假设检验. 机器学习研究杂志,15(1),2869-2909。

  • Zhang, C. H., & Zhang, S. S. (2014). 高维线性模型中低维参数的置信区间. 皇家统计学会系列B:统计方法,217-242。

  • Van de Geer, S., Bühlmann, P., Ritov, Y. A., & Dezeure, R. (2014). 高维模型中的渐近最优置信区域和测试. 统计学年鉴,42(3),1166-1202。

关于敲除推断

  • Barber, R. F; Candès, E. J. (2015). 通过敲除控制假发现率. 统计学年鉴。43 , no. 5, 2055--2085. doi:10.1214/15-AOS1337. https://projecteuclid.org/euclid.aos/1438606853

  • Candès, E., Fan, Y., Janson, L., & Lv, J. (2018). 淘金:用于高维受控变量选择的模型-X敲除. 皇家统计学会系列B,80(3),551-577。

许可证

本项目采用BSD 2-Clause许可证。

致谢

本项目得到了Labex DigiCosme(ANR-11-LABEX-0045-DIGICOSME)的支持,作为“投资未来”计划(ANR-11-IDEX-0003-02)的一部分,以及Fast Big项目(ANR-17-CE23-0011)和KARAIB AI教授职位(ANR-20-CHIA-0025-01)。本研究还得到了欧盟地平线2020研究和创新计划(协议号945539,人类大脑项目SGA3)的支持。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

hidimstat-0.2.0.tar.gz (7.6 MB 查看哈希值)

上传时间 源代码

构建分发

hidimstat-0.2.0-py3-none-any.whl (87.5 kB 查看哈希值)

上传时间 Python 3

由以下组织支持