缺失数据插补细化与因果学习
项目描述
MIRACLE (缺失数据插补细化与因果学习)
代码作者:Trent Kyono
此存储库包含用于“MIRACLE:通过学习缺失数据机制进行因果感知插补”论文(2021)的代码。
安装
pip install -r requirements.txt
pip install .
CUDA支持(可选)
为了支持CUDA,您应确保满足TensorFlow 2 CUDA要求。
按照上述方式安装库,然后根据官方说明安装启用CUDA的TensorFlow版本。
测试
您可以使用以下方式运行测试
pip install -r requirements_dev.txt
pip install .
pytest -vsx
内容
miracle/MIRACLE.py
- 插补器/细化类。此类接受基线插补并返回细化插补。此代码已从[2]中分叉。miracle/third_party
- 参考插补器:均值、Missforest、MICE、GAIN、Sinkhorn、KNN。tests/run_example.py
- 运行非线性玩具DAG示例。使用均值填充作为基线,并应用MIRACLE进行细化。
示例
基于玩具DAG的基线示例。
$ cd tests/
$ python run_example.py
这个特定的实例返回基线RMSE约为0.95,MIRACLE RMSE约为0.40。
示例:使用30%缺失值的2000个数据集大小运行玩具示例,最大步骤数为300。
$ python3 run_example.py --dataset_sz 2000 --max_steps 300 --missingness 0.3
引用
@inproceedings{kyono2021miracle,
title = {MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms},
author = {Kyono, Trent and Zhang, Yao and Bellot, Alexis and van der Schaar, Mihaela},
year = 2021,
booktitle = {Conference on Neural Information Processing Systems(NeurIPS) 2021}
}
参考文献
[1] Jinsung Yoon, James Jordon, 和 Mihaela van der Schaar. Gain: 使用生成对抗网络进行缺失数据填充。在ICML,2018。
[2] Trent Kyono, Yao Zhang, 和 Mihaela van der Schaar. CASTLE: 通过辅助因果图发现进行正则化。在NeurIPS,2020。
[3] Zheng, X., Aragam, B., Ravikumar, P., & Xing, E. P. (2018). DAGs with NO TEARS: 结构学习连续优化(NeurIPS 2018)。
[4] Zheng, X., Dan, C., Aragam, B., Ravikumar, P., & Xing, E. P. (2020). 学习稀疏非参数DAGs(AISTATS 2020)。
项目详情
关闭
哈希 for miracle_imputation-0.1.6-py3-none-macosx_10_14_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c2098c5852795de63826734a6f8a1974529ee3deba7258166e7a3d052e880336 |
|
MD5 | 2a0b2984f86150186772887f3a314ee9 |
|
BLAKE2b-256 | a1641017e119a9e1cfffc99d1a42126ab6dfd93b3e10eefd5ac0b6222a7b0d03 |