跳转到主要内容

Deephaven Engine Python 包

项目描述

Deephaven Python 集成包

Deephaven Python 集成包由Deephaven数据实验室创建。它允许Python开发者(包括数据科学家)直接在Deephaven数据服务器中访问数据、运行查询和执行Python脚本,以实现最佳性能。通过利用Deephaven独特的流式表能力和其众多的数据摄取设施(Kafka、Parquet、CSV、SQL等),Python开发者可以快速构建高性能且易于消费的实时数据处理管道。

如果您使用的是Windows操作系统,则通过pip运行Deephaven不需要WSL。

安装

由于此包依赖于Deephaven服务器,它预先安装了Deephaven Docker镜像,并在Deephaven Web UI的Python控制台中在运行时提供。

快速开始

from deephaven import read_csv
from deephaven.stream.kafka.consumer import kafka_consumer, TableType
from deephaven.plot import Figure, PlotStyle
csv_table = read_csv("data1.csv")
kafka_table = kafka_consumer.consume({'bootstrap.servers': 'redpanda:29092'}, topic='realtime_feed', table_type=TableType.Append)
joined_table = kafka_table.join(csv_table, on=["key_col_1", "key_col_2"], joins=["data_col1"])
plot = Figure() \
    .axes(plot_style = PlotStyle.STACKED_BAR )\
    .plot_cat(series_name="Categories1", t=joined_table, category="Key_col_1", y = "data_col1") \
    .show()

相关文档

API参考

从这里开始

支持者:

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面