用于构建和测试机器学习特征的库
项目描述
此库提供了一组可用于许多机器学习应用(分类、聚类、回归等)的工具,如果您使用scikit-learn(尽管如果使用不同的算法也可以工作)将特别有用。
大多数机器学习问题都涉及特征定义和预处理的一个步骤。Feature Forge可以帮助您
定义和记录特征
测试您的特征与指定的案例和随机生成的案例(压力测试)。这有助于使您的应用程序更能抵御无效/格式错误的输入数据。这也帮助您检查在进行特征分析时出现的低相关性结果是否确实是因为特征不好,而不是因为特征代码中存在轻微的bug。
在数据集上评估您的特征,生成特征评估矩阵。评估器具有鲁棒模式,允许您对无效数据和有缺陷的特征有一定的容忍度。
实验:运行、注册、分类和重现实验,以确定您问题的最佳设置。
安装
只需 pip install featureforge。
文档
联系方式
Feature Forge 是 © 2014 Machinalis (http://www.machinalis.com/) 的财产。其主要作者是
Javier Mansilla <jmansilla@machinalis.com> (jmansilla at github)
Daniel Moisset <dmoisset@machinalis.com> (dmoisset at github)
Rafael Carrascosa <rcarrascosa@machinalis.com> (rafacarrascosa at github)
欢迎任何贡献或建议,官方渠道是提交github拉取请求或问题。
变更日志
- 0.1.6:
与稀疏矩阵相关的错误修复。
小幅改进文档。
减少默认日志详细程度。
- 0.1.5:
默认使用稀疏NumPy矩阵。
- 0.1.4:
放弃了使用Schema库分支版本的需求。
- 0.1.3:
添加了对运行和生成实验统计的支持
- 0.1.2:
修复安装器依赖关系
- 0.1.1:
添加了对python 3的支持
添加了对词袋特征的支持
- 0.1:
初始版本
项目详情
featureforge-0.1.6.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 8a91bb84080ea8ea84bd25ee43d70d27d1a60586fe4577a87f4bf15f9f313201 |
|
MD5 | d4545366da1a919268f316b12970bd6a |
|
BLAKE2b-256 | 67cbd081c130e4f064ab0e74c78d84f984053391bdf2fea1d48a8b015ad59c12 |