使用copulas建模创建表格合成数据。

这些详情尚未被PyPI验证

项目链接

项目描述

此仓库是合成数据保险库项目的一部分，该项目由 DataCebo 提供支持。

概述

Copulas 是一个用于建模多元分布和通过copula函数从中采样的Python库。给定一个数值数据表，使用Copulas学习分布并生成遵循相同统计特性的新合成数据。

关键特性

建模多元数据。 从各种单变量分布和copula中选择 – 包括阿基米德copula、高斯copula和Vine copula。
在模型构建后直观比较真实和合成数据。 可视化包括1D直方图、2D散点图和3D散点图。
访问和操作学习到的参数。 完全访问模型的内部，设置或调整参数以满足您的需求。

安装

使用pip或conda安装Copulas库。

pip install copulas

conda install -c conda-forge copulas

用法

使用示例数据集开始。此数据集包含3个数值列。

from copulas.datasets import sample_trivariate_xyz

real_data = sample_trivariate_xyz()
real_data.head()

使用copula建模数据，并使用它创建合成数据。Copulas库提供许多选项，包括高斯copula、Vine copula和阿基米德copula。

from copulas.multivariate import GaussianMultivariate

copula = GaussianMultivariate()
copula.fit(real_data)

synthetic_data = copula.sample(len(real_data))

直观地并排显示真实和合成数据。让我们用3D图来查看完整的数据集。

from copulas.visualization import compare_3d

compare_3d(real_data, synthetic_data)

Quickstart

教程

点击以下链接在Colab笔记本上运行代码，并发现新特性。

社区和支持

从我们的文档站点了解更多关于Copulas库的信息。

有问题或疑问？ 加入我们的 Slack频道讨论更多关于Copulas和合成数据的话题。如果您发现错误或有功能请求，您也可以在我们的GitHub上提交问题。

有兴趣为Copulas做出贡献？ 阅读我们的贡献指南开始。

致谢

Copulas开源项目始于2018年麻省理工学院的数据到人工智能实验室。感谢我们的贡献者团队多年来构建和维护此库！

查看贡献者

合成数据保险库项目首先于2016年在麻省理工学院的数据到人工智能实验室创建。经过4年的企业研究和推广，我们于2020年创建了 DataCebo，旨在扩大该项目。今天，DataCebo是SDV的骄傲开发者，SDV是合成数据生成和评估的最大生态系统。它拥有多个支持合成数据的库，包括

🔄 数据发现与转换。反转转换以重新生成现实数据。
🧠 多种机器学习模型 – 从Copulas到深度学习，以创建表格、多表和时间序列数据。
📊 衡量合成数据的质量和隐私，并比较不同的合成数据生成模型。

开始使用SDV包 – 一个完全集成的解决方案，是您合成数据的一站式商店。或者，您也可以使用独立的库来满足特定需求。

项目详情

这些详情尚未被PyPI验证

项目链接

发布历史发布通知 | RSS订阅

此版本

0.11.1

2024年8月21日

0.11.1.dev0 预发布

2024年8月20日

0.11.0

2024年4月10日

0.11.0.dev0 预发布

2024年4月9日

0.10.1

2024年3月13日

0.10.1.dev0 预发布版

2024年3月13日

0.10.0

2023年11月13日

0.10.0.dev0 预发布版

2023年11月13日

0.9.2

2023年10月12日

0.9.2.dev0 预发布版

2023年10月12日

0.9.1

2023年8月10日

0.9.1.dev0 预发布版

2023年8月10日

0.9.0

2023年4月26日

0.9.0.dev0 预发布版

2023年4月26日

0.8.1.dev0 预发布版

2023年4月25日

0.8.0

2023年1月6日

0.8.0.dev0 预发布版

2023年1月5日

0.7.1.dev0 预发布版

2022年12月26日

0.7.0

2022年5月10日

0.7.0.dev0 预发布版

2022年5月10日

0.6.1

2022年2月25日

0.6.1.dev0 预发布版

2022年2月18日

0.6.0

2021年11月5日

0.6.0.dev0 预发布版

2021年11月5日

0.5.2.dev1 预发布版

2021年11月4日

0.5.2.dev0 预发布版

2021年11月4日

0.5.1

2021年8月17日

0.5.1.dev1 预发布版

2021年8月12日

0.5.1.dev0 预发布版

2021年7月26日

0.5.0

2021年2月24日

0.5.0.dev1 预发布版

2021年2月23日

0.5.0.dev0 预发布版

2021年2月23日

0.4.0

2021年1月27日

0.4.0.dev0 预发布版

2021年1月27日

0.3.3

2020年9月18日

0.3.3.dev0 预发布版

2020年9月18日

0.3.2

2020年8月7日

0.3.2.dev1 预发布版

2020年8月7日

0.3.2.dev0 预发布版

2020年8月4日

0.3.1

2020年7月9日

0.3.1.dev0 预发布版

2020年7月9日

0.3.0

2020年3月28日

0.3.0.dev0 预发布版

2020年3月28日

0.2.5

2020年1月17日

0.2.4

2019年12月23日

0.2.3

2019年9月17日

0.2.1

2019年1月17日

0.2.0

2018年9月14日

0.1.1

2018年8月23日

0.1.0

2018年6月26日

0.0.0

2018年6月12日

下载文件

下载适合您平台的文件。如果您不确定该选择哪一个，请了解有关安装包的更多信息。

源代码发行版

copulas-0.11.1.tar.gz (44.1 kB 查看哈希值)

上传时间 2024年8月21日 源代码

构建发行版

copulas-0.11.1-py3-none-any.whl (51.6 kB 查看哈希值)

上传时间 2024年8月21日 Python 3

哈希值 for copulas-0.11.1.tar.gz

哈希值 for copulas-0.11.1.tar.gz
算法	哈希摘要
SHA256	`55cee8d2d0017b7124c4dbbd034e9a044528de13e4c4b0c79b43b8d35c49b764`
MD5	`95381dc2469d1a8a2a6f42f391ffe79d`
BLAKE2b-256	`e0ad62d4c15de01917d8daf67ef201f68a5f437bfdeb9e9129b022ff6f7d9a61`

哈希值 for copulas-0.11.1-py3-none-any.whl

哈希值 for copulas-0.11.1-py3-none-any.whl
算法	哈希摘要
SHA256	`1dfbe0b7ff07e953135aea66387564a7b9d01fefceb89822ada225f6ba708ceb`
MD5	`be5aa7a2fb0f328033bbf764fa55cb85`
BLAKE2b-256	`76a23972bc9afe1d95cc5766fd61d1302bbffd7bbd95ec9cc179c8624de999ec`

copulas 0.11.1

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

概述

安装

用法

教程

社区和支持

致谢

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS订阅

下载文件

源代码发行版

构建发行版

copulas 0.11.1

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

概述

安装

用法

教程

社区和支持

致谢

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS订阅

下载文件

源代码发行版

构建发行版

发布历史发布通知 | RSS订阅