跳转到主要内容

包含mltable包的MLTable加载和编写API。

项目描述

# mltable:机器学习表格数据工具包 MLTable 是一个 Python 包,它提供了快速、灵活的数据加载功能,旨在使访问“表格”数据变得简单直观。MLTable 将帮助您抽象表格数据的模式定义,使其更容易将表转换为 Pandas dataframe。MlTable 可以用于从云对象存储或本地磁盘中的分隔文本文件、parquet 文件、delta lake 和 json-lines 文件加载数据。

## 主要功能

以下是 mltable 做得很好的一些事情

  • 大型数据上的灵活 采样和过滤 功能

  • 强大的 IO 工具,可从 平面 文件(CSV 和分隔符)、parquet 文件、delta lakejson-lines 文件加载数据

  • 捕获和定义平面文件中包含的 模式

  • 快速将数据转换为Pandas DataFrame

## 入门

您可以通过pip安装MLTable包。 `bash pip install mltable `

请注意,MLTable包已在AzureML计算实例上预先安装。

## 文档

官方文档托管在[使用表](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-mltable?view=azureml-api-2&tabs=cli)。

MLTable工件元数据文件名为MLTable,遵循[AzureML MLTable模式](https://learn.microsoft.com/en-us/azure/machine-learning/reference-yaml-mltable)。

# 版本历史

## 1.6.1 (2024-01-24) ### 新增功能 - 添加了授权支持 - MLTable.save() 错误修复

## 1.5.0 (2023-08-14) ### 新增功能 - MLTable.save() 支持 cloud storage。更多详情请参阅[这里](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-mltable?view=azureml-api-2&tabs=cli)。 - from_delta_lake 默认支持拉取最新版本

### 修复了错误 - 修复 support_multi_lineMLTable.from_delimited_files 的问题

## 1.4.1 (2023-06-19) ### 修复了错误 - 降级加密库依赖,允许版本大于41.*.*

## 1.4.0 (2023-05-31) ### 新增功能 - 更新运行时依赖项 - 改进错误处理和参数验证

## 1.3.0 (2023-04-07) ### 新增功能 - bugfix (用户错误映射,mltable 保存/加载往返)

## 1.2.0 (2023-02-22)

### 新增功能 - bugfix (mltable 保存/加载,验证模式)

## 1.1.0 (2023-01-26)

### 新增功能 - bugfix (修复模式,flake8 错误) - 改进日志和异常消息

## 1.0.0 (2022-12-05)

### 新增功能 - 工厂 API (from_delta_lake) - 编写 API (convert_column_types, save, skip 等)

## 0.1.0b4 (2022-10-05)

### 新增功能 - 工厂 API (from_paths, from_delimited_files, from_parquet_files, from_json_lines_files)。 - 编写 API (keep_columns, drop_columns, take_random_sample, take 等)。 - 支持 mltable 从数据资产 URI 加载

## 0.1.0b3 (2022-06-30)

## 0.1.0b2 (2022-05-23)

## 0.1.0b1 (2022-05-17)

### 新增功能 - 初始公开预览版,用于加载到 pandas dataframe

项目详情


下载文件

根据您的平台下载文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

此版本没有可用的源代码分发文件。请参阅生成分发存档的教程

构建的分发

mltable-1.6.1-py3-none-any.whl (189.4 kB 查看哈希值)

上传时间 Python 3

由以下赞助

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面