Jupyter Notebook扩展,通过集成DataTables JS来利用pandas DataFrames。
项目描述
Jupyter DataTables
Jupyter Notebook扩展,通过集成DataTables JS来利用pandas DataFrames。
关于
数据科学家以及许多开发人员每天都会使用 pd.DataFrame
来解释和处理数据。在我的典型工作流程中。常见的流程是显示dataframe,查看数据模式,然后生成多个图表来检查数据的分布,以获得更清晰的视图,也许在表中搜索一些数据等...
如果那些分布图是标准DataFrame的一部分,并且我们能够通过最小努力快速搜索表格,那会怎么样?如果它是默认表示形式呢?
jupyter-datatables使用jupyter-require来绘制表格。
安装
pip install jupyter-datatables
使用
import numpy as np
import pandas as pd
from jupyter_datatables import init_datatables_mode
init_datatables_mode()
就这样,您的默认pandas表示现在将使用Jupyter DataTables!
df = pd.DataFrame(np.abs(np.random.randn(50, 5)), columns=list(string.ascii_uppercase[:5]))
在大多数情况下,您不需要过多担心数据的大小。Jupyter DataTables 根据置信区间(默认为0.95)和误差范围计算所需的样本大小,并将其向上取整到最高“智能”值。
例如,对于包含100,000
个样本的数据,给定0.975
的置信区间和0.02
的误差范围,Jupyter DataTables会计算需要3044
个样本,并将其向上取整到4000
。
附加说明
样本大小:100,000个中的4,000个
我们也可以轻松处理宽表。
df = pd.DataFrame(np.abs(np.random.randn(50, 20)), columns=list(string.ascii_uppercase[:20]))
从0.3.0版本开始,支持交互式工具提示
还支持自定义索引,包括日期
类型
dft = pd.DataFrame({'A': np.random.rand(5),
'B': [1, 1, 3, 2, 1],
'C': 'This is a very long sentence that should automatically be trimmed',
'D': [pd.Timestamp('20010101'), pd.Timestamp('20010102'), pd.Timestamp('20010103'), pd.Timestamp('20010104'), pd.Timestamp('20010105')],
'E': pd.Series([1.0] * 5).astype('float32'),
'F': [False, True, False, False, True],
})
dft.D = dft.D.apply(pd.to_datetime)
dft.set_index('D', inplace=True)
当前状态和未来计划
查看我们的项目板,在那里我们跟踪Jupyter工具的问题和待办事项!
作者:Marek Cermak macermak@redhat.com,@AICoE
项目详情
关闭
jupyter-datatables-0.3.9.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3d6d3651447f95e2f3c5ecbe70f929710d90a9cf9aac732938f20a1cdc1a5aba |
|
MD5 | b29a68c1b623977873e7b3cd52387ba0 |
|
BLAKE2b-256 | def1a6a0645f96d215946915513d3a592b1d3c34bd0607a0727a95c7d170859a |
关闭
jupyter_datatables-0.3.9-py2.py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 913722a440c55ac6764d97e24a910dc746ba71eb8fe64cf76b1a3ee9f0ba0e7e |
|
MD5 | a22940c80403a7c51f26e9641763f3ad |
|
BLAKE2b-256 | 74856bc94c915955e72a36f0a736d376a31d25de02ccddd90519f5fd02a2fe14 |