Azure机器学习特征存储SDK
项目描述
# Azure机器学习特征存储Python SDK
azureml-featurestore包是Azure ML特征存储的核心SDK接口。此SDK与azure-ai-ml SDK一起工作,以提供托管的特征存储体验。
## azureml-featurestore包中的主要功能 - 使用特征转换功能在Spark中开发特征集规范。 - 列出并获取在Azure ML特征存储中定义的特征集。 - 生成并解决特征检索规范。 - 使用时间点连接运行离线特征检索。
## 入门
您可以通过 `pip install azureml-featurestore` 安装此包
要了解更多关于Azure ML托管特征存储的信息,请访问 https://aka.ms/featurestore-get-started
# 更新日志
## 1.1.0 (2024.03.13)
新功能
【公共预览】支持特征定义的领域特定语言(DSL)。DSL是一种使用声明性语法定义特征集转换的简化方式。- DSL特征集支持自定义源 - DSL特征集支持时间窗口回溯、源延迟和源回溯 - DSL特征集支持从物化存储加载数据 - get_offline_features 支持不同转换的特征集(dsl、udf 或无)。
## 1.0.1 (2023.12.28)
更新依赖项
## 1.0.0 (2023.11.14)
【GA】自定义特征源:自定义特征源支持使用用户定义字典作为输入的自定义源处理代码脚本。
【GA】支持国际区域和主权云。
【GA】离线填充物化现在替换特征窗口内的所有数据,而不是基于时间戳进行upsert操作。
【GA】添加了物化的引导选项,该选项使数据从离线存储加载到在线存储成为可能。
现在重新启用特征集中的物化将使所有之前物化的数据无效。
特征集规范转储现在接受文件路径或文件夹路径作为转储目标,并接受覆盖选项以控制是否覆盖目标。
各种错误修复
## 0.1.0b6 (2023.11.1)
各种错误修复
## 0.1.0b5 (2023.10.4)
各种错误修复
## 0.1.0b4 (2023.08.28)
新功能
【公共预览】添加了自定义特征源。自定义特征源支持使用用户定义字典作为输入的自定义源处理代码脚本。
【公共预览】添加了csv特征源、deltatable特征源、mltable特征源、parquet特征源作为新的特征源体验。之前的特征源使用兼容性将在6个月内弃用。
错误修复
重大变更: - 将 init_online_lookup、shutdown_online_lookup 和 get_online_features 从 FeatureStoreClient 移出,并作为独立函数放入模块中。 - get_online_features 合同从接受(作为 observation_data 参数)并返回 pandas.DataFrame 更改为接受(作为 observation_data 参数)并返回 pyarrow.Table。
其他变更: - 将在线特征存储支持移入公共预览。
## 0.1.0b3 (2023.07.10)
各种错误修复
## 0.1.0b2 (2023.06.13)
新功能
【私有预览】添加了在线存储支持。在线存储支持物化和从Redis缓存中检索在线特征值以进行批量评分。
各种错误修复
## 0.1.0b1 (2023.05.15)
新功能
初始版本。
项目详情
下载文件
下载适合您平台的应用程序。如果您不确定选择哪一个,请了解更多关于 安装包 的信息。
源分布
构建分布
哈希值 for azureml_featurestore-1.1.0-py3-none-any.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | d1ccb0df469925db2ef89e4556912c71d91ce831943e1674085395664d4a32ab |
|
MD5 | 57aecf1086c7004ea1bcfe07162afbfc |
|
BLAKE2b-256 | af7679c6c3351284708ef7c7aed92546e068125875d4a646a913ba210d053a90 |