跳转到主要内容

缺失数据插补细化与因果学习

项目描述

MIRACLE (缺失数据插补细化与因果学习)

Tests License

代码作者:Trent Kyono

此存储库包含用于“MIRACLE:通过学习缺失数据机制进行因果感知插补”论文(2021)的代码。

安装

pip install -r requirements.txt
pip install .

CUDA支持(可选)

为了支持CUDA,您应确保满足TensorFlow 2 CUDA要求

按照上述方式安装库,然后根据官方说明安装启用CUDA的TensorFlow版本。

测试

您可以使用以下方式运行测试

pip install -r requirements_dev.txt
pip install .
pytest -vsx

内容

  • miracle/MIRACLE.py - 插补器/细化类。此类接受基线插补并返回细化插补。此代码已从[2]中分叉。
  • miracle/third_party - 参考插补器:均值、Missforest、MICE、GAIN、Sinkhorn、KNN。
  • tests/run_example.py - 运行非线性玩具DAG示例。使用均值填充作为基线,并应用MIRACLE进行细化。

示例

基于玩具DAG的基线示例。

$ cd tests/
$ python run_example.py

这个特定的实例返回基线RMSE约为0.95,MIRACLE RMSE约为0.40。

示例:使用30%缺失值的2000个数据集大小运行玩具示例,最大步骤数为300。

$ python3 run_example.py --dataset_sz 2000 --max_steps 300 --missingness 0.3

引用

@inproceedings{kyono2021miracle,
	title        = {MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms},
	author       = {Kyono, Trent and Zhang, Yao and Bellot, Alexis and van der Schaar, Mihaela},
	year         = 2021,
	booktitle    = {Conference on Neural Information Processing Systems(NeurIPS) 2021}
}

参考文献

[1] Jinsung Yoon, James Jordon, 和 Mihaela van der Schaar. Gain: 使用生成对抗网络进行缺失数据填充。在ICML,2018。

[2] Trent Kyono, Yao Zhang, 和 Mihaela van der Schaar. CASTLE: 通过辅助因果图发现进行正则化。在NeurIPS,2020。

[3] Zheng, X., Aragam, B., Ravikumar, P., & Xing, E. P. (2018). DAGs with NO TEARS: 结构学习连续优化(NeurIPS 2018)。

[4] Zheng, X., Dan, C., Aragam, B., Ravikumar, P., & Xing, E. P. (2020). 学习稀疏非参数DAGs(AISTATS 2020)。

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

此版本没有可用的源代码分发文件。请参阅生成分发存档的教程。

构建分发

miracle_imputation-0.1.6-py3-none-macosx_10_14_x86_64.whl (15.1 kB 查看哈希)

上传时间 Python 3 macOS 10.14+ x86-64

miracle_imputation-0.1.6-py3-none-any.whl (15.3 kB 查看哈希)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面