跳转到主要内容

通用机器学习数据集包

项目描述

数据集库原型

Sedpack:可扩展且高效的数据打包

这是数据集库的一个原型。主要重构自SCAAML项目。

可用组件

  • 待办事项

安装

依赖项

使用此库需要安装TensorFlow 2.x的有效版本和Python >=3.8的版本。

数据集安装

开发安装

  1. 克隆仓库: git clone https://security-and-privacy-group-research.googlesource.com/dataset_lib_prototype
  2. 安装依赖项: python3 -m pip install --require-hashes -r requirements.txt
  3. 以开发模式安装包: python3 -m pip install --editable .(简写为pip install -e .或旧版python setup.py develop

更新依赖项

请确保已安装以下内容:sudo apt install python3 python3-pip python3-venv并激活了虚拟环境。

安装需求: pip install --require-hashes -r base-tooling-requirements.txt

更新: pip-compile requirements.in --generate-hashes --upgrade并提交requirements.txt。

包安装

安装包: pip install TODO(包名)

教程

TODO提供如何使用此包的说明。

免责声明

这不是官方的Google产品。

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面