跳转到主要内容

基于JSON Table Schema描述符生成BigQuery表,加载数据,提取数据。

项目描述

Travis
Coveralls
PyPi
SemVer
Gitter

根据JSON Table Schema描述符生成和加载数据的BigQuery表。

版本 v0.3 包含重大更改

  • Storage.tables 重命名为 Storage.buckets

  • Storage.read 更改为读取到内存中

  • 添加了 Storage.iter 以逐行生成

入门指南

安装

pip install jsontableschema-bigquery

存储

该软件包实现了 表格存储 接口。

要开始使用Google BigQuery服务

  • 创建一个新项目 - 链接

  • 创建一个服务密钥 - 链接

  • 下载json凭证并设置 GOOGLE_APPLICATION_CREDENTIALS 环境变量

我们可以这样获得存储

import io
import os
import json
from apiclient.discovery import build
from oauth2client.client import GoogleCredentials
from jsontableschema_bigquery import Storage

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '.credentials.json'
credentials = GoogleCredentials.get_application_default()
service = build('bigquery', 'v2', credentials=credentials)
project = json.load(io.open('.credentials.json', encoding='utf-8'))['project_id']
storage = Storage(service, project, 'dataset', prefix='prefix')

然后我们可以与存储进行交互

storage.buckets
storage.create('bucket', descriptor)
storage.delete('bucket')
storage.describe('bucket') # return descriptor
storage.iter('bucket') # yields rows
storage.read('bucket') # return rows
storage.write('bucket', rows)

映射

schema.json -> bigquery table schema
data.csv -> bigquery talbe data

驱动程序

默认使用Google BigQuery客户端 - 文档

API参考

快照

https://github.com/frictionlessdata/jsontableschema-py#snapshot

详细

贡献

请阅读贡献指南

如何贡献

谢谢!

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

jsontableschema-bigquery-0.5.0.tar.gz (8.0 kB 查看哈希)

上传时间

构建分发

jsontableschema_bigquery-0.5.0-py2.py3-none-any.whl (9.5 kB 查看哈希)

上传时间 Python 2 Python 3

由以下支持