Google BigQuery magics for Jupyter and IPython
项目描述
在没有适当硬件和基础设施的情况下,查询大量数据集可能既费时又昂贵。Google BigQuery通过使用Google基础设施的处理能力,实现了对追加型表的超快SQL查询,从而解决了这个问题。
快速入门
为了使用此库,您首先需要完成以下步骤
安装
使用pip在此虚拟环境中安装此库。 虚拟环境是一种创建独立Python环境的工具。它解决的基本问题是依赖性和版本,以及间接权限。
使用虚拟环境,可以无需系统安装权限,也不与已安装的系统依赖项冲突来安装此库。
支持的Python版本
Python >= 3.7
不支持的Python版本
Python == 3.5, Python == 3.6.
Mac/Linux
pip install virtualenv
virtualenv <your-env>
source <your-env>/bin/activate
<your-env>/bin/pip install bigquery-magics
Windows
pip install virtualenv
virtualenv <your-env>
<your-env>\Scripts\activate
<your-env>\Scripts\pip.exe install bigquery-magics
示例用法
要使用这些魔法,您必须首先注册它们。在Jupyter笔记本单元格中运行%load_ext bigquery_magics。
%load_ext bigquery_magics
执行查询
%%bigquery
SELECT name, SUM(number) as count
FROM 'bigquery-public-data.usa_names.usa_1910_current'
GROUP BY name
ORDER BY count DESC
LIMIT 3