包含mltable包的MLTable加载和编写API。
项目描述
# mltable:机器学习表格数据工具包 MLTable 是一个 Python 包,它提供了快速、灵活的数据加载功能,旨在使访问“表格”数据变得简单直观。MLTable 将帮助您抽象表格数据的模式定义,使其更容易将表转换为 Pandas dataframe。MlTable 可以用于从云对象存储或本地磁盘中的分隔文本文件、parquet 文件、delta lake 和 json-lines 文件加载数据。
## 主要功能
以下是 mltable 做得很好的一些事情
大型数据上的灵活 采样和过滤 功能
强大的 IO 工具,可从 平面 文件(CSV 和分隔符)、parquet 文件、delta lake 和 json-lines 文件加载数据
捕获和定义平面文件中包含的 模式
快速将数据转换为Pandas DataFrame
## 入门
您可以通过pip安装MLTable包。 `bash pip install mltable `
请注意,MLTable包已在AzureML计算实例上预先安装。
## 文档
官方文档托管在[使用表](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-mltable?view=azureml-api-2&tabs=cli)。
MLTable工件元数据文件名为MLTable,遵循[AzureML MLTable模式](https://learn.microsoft.com/en-us/azure/machine-learning/reference-yaml-mltable)。
# 版本历史
## 1.6.1 (2024-01-24) ### 新增功能 - 添加了授权支持 - MLTable.save() 错误修复
## 1.5.0 (2023-08-14) ### 新增功能 - MLTable.save() 支持 cloud storage。更多详情请参阅[这里](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-mltable?view=azureml-api-2&tabs=cli)。 - from_delta_lake 默认支持拉取最新版本
### 修复了错误 - 修复 support_multi_line 对 MLTable.from_delimited_files 的问题
## 1.4.1 (2023-06-19) ### 修复了错误 - 降级加密库依赖,允许版本大于41.*.*
## 1.4.0 (2023-05-31) ### 新增功能 - 更新运行时依赖项 - 改进错误处理和参数验证
## 1.3.0 (2023-04-07) ### 新增功能 - bugfix (用户错误映射,mltable 保存/加载往返)
## 1.2.0 (2023-02-22)
### 新增功能 - bugfix (mltable 保存/加载,验证模式)
## 1.1.0 (2023-01-26)
### 新增功能 - bugfix (修复模式,flake8 错误) - 改进日志和异常消息
## 1.0.0 (2022-12-05)
### 新增功能 - 工厂 API (from_delta_lake) - 编写 API (convert_column_types, save, skip 等)
## 0.1.0b4 (2022-10-05)
### 新增功能 - 工厂 API (from_paths, from_delimited_files, from_parquet_files, from_json_lines_files)。 - 编写 API (keep_columns, drop_columns, take_random_sample, take 等)。 - 支持 mltable 从数据资产 URI 加载
## 0.1.0b3 (2022-06-30)
## 0.1.0b2 (2022-05-23)
## 0.1.0b1 (2022-05-17)
### 新增功能 - 初始公开预览版,用于加载到 pandas dataframe
项目详情
下载文件
根据您的平台下载文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源代码分发
构建的分发
mltable-1.6.1-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7b8cb29c116b85f3f8ade180123d1847dc803c0a10ef353ec64382ba12dfb9db |
|
MD5 | c8e58ae1584bed6999aa5b2d6c9896c2 |
|
BLAKE2b-256 | eafd5b8e59c886a9ae05a726621597484e828e9727ba37d6adf87d87f5073b78 |