跳转到主要内容

一个包含我机器学习项目中代码的包,具有可重用潜力。

项目描述

ddplt

PyPI version

一个包含我机器学习项目中代码的包,具有可重用潜力。

安装

由于库在PyPi上可用,因此包安装简单。

pip install ddplt

混淆矩阵

绘制分类结果的混淆矩阵

import numpy as np
from ddplt.heatmaps import draw_confusion_heatmap

# generate some data 
y_test = np.array([0, 0, 1, 1, 2, 0])
y_pred = np.array([0, 1, 1, 2, 2, 0])
class_names = np.array(['hip', 'hop', 'pop'])
ax, cm = draw_confusion_heatmap(y_test, y_pred, class_names)

conf_matrix

交叉验证的接收者操作特征和精确率-召回率曲线

使用k折交叉验证绘制接收者操作特征(ROC)和精确率-召回率(PR)曲线

from ddplt.classification import draw_roc_prc_cv

from sklearn.datasets import make_moons
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import KFold

X, y = make_moons(500, noise=.2, random_state=123)
estimator = LogisticRegression()
cv = KFold(n_splits=5, shuffle=True, random_state=123)

draw_roc_prc_cv(estimator, X, y, cv)

roc_prc_cv

函数draw_roc_prc_cv接受以下参数

  • estimator - 设置了超参数的Scikit-learn估计器。估计器不必已拟合。
  • X - 形状为(n_instances,n_features)的array-like
  • y - 形状为(n_instances,)的array-like,包含实例标签
  • cv - 负责创建Xy的k折拆分的交叉验证生成器

有关可选参数的更多信息,请参阅文档

在每个CV迭代中,估计器在训练折上拟合,并对测试折内的实例预测类概率。然后,从概率生成ROC和PR曲线。

该图由以下内容组成

  • 单个ROC/PR曲线
  • 平均ROC/PR曲线
  • 表示+-1标准差的阴影区域

在图例中报告ROC和PR曲线下的面积。

注意:使用函数draw_roc_cvdraw_prc_cv仅绘制ROC或PR曲线

学习曲线

待办事项 - 尚未实现

创建一个图,显示不同大小的训练数据的性能评估。该方法应接受

  • 现有的Axes
  • 性能度量(例如准确率、MSE、精确率、召回率等)
  • ...

相关性热图

待办事项 - 尚未实现

网格中每个方块的颜色代表预测变量之间的相关性强弱。您可以选择皮尔逊或斯皮尔曼相关系数,结果显示在方块内部。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

ddplt-0.0.2.tar.gz (7.1 kB 查看哈希值)

上传时间 源代码

构建分发

ddplt-0.0.2-py3.6.egg (8.8 kB 查看哈希值)

上传时间 源代码

ddplt-0.0.2-py3-none-any.whl (21.3 kB 查看哈希值)

上传时间 Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面