时间序列数据的基本和管道。
项目描述
来自MIT Data to AI Lab的开源项目
ml-stars
机器学习和时间序列的基本组件。
- Github: https://github.com/sintel-dev/ml-stars
- 许可证: MIT
- 开发状态: 预alpha
概述
此存储库包含用于MLBlocks库的原始注释,以及使其中一些与MLBlocks API要求完全兼容的必要Python代码。
此外,这个库还收集了一些直接贡献的定制原语,这些原语要么结合第三方工具,要么从头开始实现新功能。
安装
需求
ml-stars 已经在 Python 3.8、3.9、3.10 和 3.11 上开发和测试过
此外,虽然这不是强制性的,但为了防止 ml-stars 在运行时与其他系统中的软件发生冲突,强烈建议使用 virtualenv
使用 pip 安装
安装 ml-stars 最简单、最推荐的方法是使用 pip
pip install ml-stars
这将从 PyPi 拖取并安装最新的稳定版本。
如果您想从源代码安装或为项目做出贡献,请阅读 贡献指南。
快速入门
本节是一系列简短的教程,帮助您开始使用 ml-stars。
我们将执行一个用于数据转换的单个原语。
1. 加载原语
运行原语的第一步是加载它。
这将通过使用 mlstars.load_primitive
函数来完成,该函数将加载指定的原语作为来自 MLBlocks 的 MLBlock 对象
在这种情况下,我们将加载 sklearn.preprocessing.MinMaxScaler
原语。
from mlstars import load_primitive
primitive = load_primitive('sklearn.preprocessing.MinMaxScaler')
2. 加载数据
StandardScaler 是一个转换原语,它将您的数据缩放到给定范围内。
要使用此原语,我们生成了一些具有数字值的合成数据。
import numpy as np
data = np.array([10, 1, 3, -1, 5, 6, 0, 4, 13, 4]).reshape(-1, 1)
data
是一个整数列表,其原始范围在 [-1, 13] 之间。
3. 应用原语
为了运行我们的原语,我们首先需要将其应用。
这个过程是它分析数据以检测数据的原始范围。
这是通过调用其 fit
方法并将 data
作为 X
传递来完成的。
primitive.fit(X=data)
4. 生成结果
一旦管道应用,我们可以通过调用原语实例的 produce
方法并再次将 data
作为 X
传递来处理数据。
transformed = primitive.produce(X=data)
transformed
完成后,我们可以看到转换后的数据包含了转换后的值
array([[0.78571429],
[0.14285714],
[0.28571429],
[0. ],
[0.42857143],
[0.5 ],
[0.07142857],
[0.35714286],
[1. ],
[0.35714286]])
数据现在在 [0, 1] 范围内。
接下来是什么?
文档
历史
0.2.0 – 2023-10-24
- 升级 python 测试并移除 python 3.7 问题 #11 - 由 @sarahmish
- 为旧的 ARIMA 原语添加弃用警告 问题 #10 - 由 @sarahmish
- 移除 python 3.6 问题 #9 - 由 @sarahmish
- 添加对 python 3.10 和 3.11 的支持 问题 #8 - 由 @sarahmish
0.1.3 – 2023-09-25
- 更新
keras
适配器 问题 #7 - 由 @sarahmish
0.1.2 – 2023-08-04
- 添加 python 3.9 问题 #6 - 由 @sarahmish
0.1.1 - 2023-05-17
0.1.0 - 2023-04-18
ml-stars 首次正式发布到 PyPI:https://pypi.ac.cn/project/ml-stars/
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪一个,请了解更多关于 安装包 的信息。
源分布
构建分布
ml-stars-0.2.0.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f3ea8b6d9856b32d252ba84fbf7239127af63841ca588a891f1361364d79a789 |
|
MD5 | da6d4248933e69306202f1fd02c130bc |
|
BLAKE2b-256 | f832913e767492079d0158d04b9500a1fc0d013451bfe18cdd7e8ee721263bf7 |
ml_stars-0.2.0-py2.py3-none-any.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | d24c8ee3e5ec926b5383b9b566f139c28794ef1d97601c7c589883c8b8073920 |
|
MD5 | 136031c3b6fc9e0a25d5e4d812bcf4d1 |
|
BLAKE2b-256 | 075edd578294f40535657faa79fd83a9b548af3cb3b5f42e13d0cf00617afb16 |