时间序列预测基准测试
项目描述
TSBenchmarks
TSBenchmarks是一个时间序列基准测试服务。TSBenchmarks是一个用于在公共数据集上基准测试模型的SDK。
由于我们负责整个基础设施,基准测试变得和在你的python笔记本中运行一行命令或调用一个API一样简单。
为什么?
我们构建TSBenchmarks是因为我们希望有一个标准化的解决方案来基准测试时间序列预测模型。我们评估在知名公共数据集上提供的预测与基准模型。
目录
可用的基准数据集
- M4-Daily
可用的基准模型
- Naive1
- Naive2
- ETS
- Theta
- ARIMA
- MLP
- RNN
- ESRNN
- FFORMA
- NBEATS
可用的指标和图表
- MASE
- sMAPE
- 按时间序列的平均损失
- 按时间戳的平均损失
安装
pip安装tsbenchmarks
如何使用
您可以通过使用完全公开的S3 Bucket或通过将文件上传到我们提供的您自己的S3 Bucket来使用TSBenchmarks。
数据格式
目前我们只支持 .csv
文件。这些文件必须包含至少 3 列,包括唯一标识符(每个时间序列的标识符)、日期戳和值。唯一标识符和日期戳必须与所选基准数据集的测试集相匹配。
1. 请求免费试用
请发送邮件至 fede.garza.ramirez@gmail.com 申请免费试用,并获取您的 BUCKET_NAME
、API_ID
、API_KEY
、AWS_ACCESS_KEY_ID
和 AWS_SECRET_ACCESS_KEY
。
2. 在私有S3 Bucket上运行tsbenchmarks
如果您不希望其他人可能访问您的数据,您可以在私有 S3 桶上运行 tsbenchmarks
。为此,您需要将数据上传到我们为您提供的私有 S3 桶;您可以在 Python 内部完成此操作。
2.1 从python上传到S3
您将需要我们提供的 AWS_ACCESS_KEY_ID
和 AWS_SECRET_ACCESS_KEY
。
- 引入您的
BUCKET_NAME
、API_ID
、API_KEY
、AWS_ACCESS_KEY_ID
和AWS_SECRET_ACCESS_KEY
来导入和实例化TSBenchmarks
。
from tsbenchmarks.core import TSBenchmarks
tsbenchmarks = TSBenchmarks(bucket_name='<BUCKET_NAME>',
api_id='<API_ID>',
api_key='<API_KEY>',
aws_access_key_id='<AWS_ACCESS_KEY_ID>',
aws_secret_access_key='<AWS_SECRET_ACCESS_KEY>')
- 通过输入文件名上传本地文件。
s3_uri = tsbenchmarks.upload_to_s3(file='<YOUR FILE NAME>')
- 运行评估过程
要运行此过程,请指定
s3_uri
:调用tsbenchmarks.upload_to_s3()
后提供的 S3 uri。dataset
:数据集名称ds_column
:唯一标识符列的名称。y_column
:目标列的名称。
#Run Evaluation
response_tmp_ft = tsbenchmarks.evaluate_my_model(
s3_uri="<PRIVATE S3 URI HERE>",
dataset='M4-Daily',
unique_id_column="<NAME OF ID COLUMN>",
ds_column= "<NAME OF DATESTAMP COLUMN>",
y_column="<NAME OF TARGET COLUMN>"
)
response_tmp_ft
状态 | 消息 | 作业 ID | 目标 URL | |
---|---|---|---|---|
0 | 200 | 在 GET /tsbenchmarks/jobs/{jo... | d8d2ae2f-ac53-4b81-87f5-49520782365a | s3://ts-benchmarks-api-public/M4-Daily-benchma... |
|
- 使用以下代码监控过程。完成后,访问您的桶以下载生成的特征。
job_id = response_tmp_ft['id_job'].item()
tsbenchmarks.get_status(job_id)
状态 | 处理时间(秒) | |
---|---|---|
0 | 进行中 | 3 |
2.2 从 s3 下载您的结果
过程完成后,您可以从 s3 探索和下载结果。
待办事项
- 使用 Parquet 文件优化读写速度
- 处理 NaN
- 上传前检查数据完整性
- 信息性错误消息
- 信息性状态
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源分布
tsbenchmarks-0.0.2.tar.gz (13.4 kB 查看哈希)
构建分布
tsbenchmarks-0.0.2-py3-none-any.whl (10.5 kB 查看哈希)
关闭
tsbenchmarks-0.0.2.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b2951e6a53087a0df8769a2cd7a612136b4f3a697dd6a1921d912949b0579d8c |
|
MD5 | f9976bcf30cbd52ca52d4c678e3e7126 |
|
BLAKE2b-256 | d04a4a261e8493e529d616021c4f6acb7529d80f431bbaeef9316d5f1145201a |
关闭
tsbenchmarks-0.0.2-py3-none-any.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a4e53aeb6c72c66520c11cda845df4c20a02bc815b0cdf2157d515bc3f5dde9c |
|
MD5 | acda043c08d516b4a5608b86eca50a4e |
|
BLAKE2b-256 | 1991c0daceab8d3547cee52f693fdbf7f4500aa9bbf0b7f663b792ecdf8d8074 |