基于Faust流处理库的Kafka聚合器。
项目描述
kafka-aggregator
基于Faust Python流处理库的Kafka聚合器。
kafka-aggregator的开发基于Safir应用程序模板。
概述
kafka-aggregator使用Faust的窗口功能来聚合来自Kafka的消息流。
kafka-aggregator实现了一个Faust代理,一个“流处理器”,它将源主题的消息添加到Faust表中。该表配置为一个固定大小的窗口,表示窗口持续时间(时间间隔)和过期时间,它指定为每个窗口分配的数据存储的持续时间。每次窗口过期时,都会调用回调函数来聚合分配给该窗口的消息。窗口的大小控制了聚合流的频率。
kafka-aggregator使用faust-avro为Faust添加Avro序列化和Schema Registry支持。faust-avro可以将Faust模型解析为Avro模式。
有关更多信息,请参阅文档。
变更日志
0.2.0 (2020-08-14)
将第一四分位数(q1 和 q3)添加到聚合器计算出的汇总统计列表中。
能够配置要计算的汇总统计列表。
固定顶级需求。
将 Kafka Connect 添加到 docker-compose 设置中。
默认使用单个 Schema Registry 以简化本地执行。
首次发布到 PyPI。
0.1.0 (2020-07-13)
首次发布 kafka-aggregator,具有以下功能:
使用 Faust 窗口功能对消息流进行聚合。
使用 Faust-avro 向 Faust 添加 Avro 序列化和 Schema Registry 支持。
支持内部 Schema Registry 以存储聚合主题的架构(可选)。
根据源主题架构和要计算的汇总统计列表创建聚合主题架构。
能够从聚合主题架构动态创建 Faust 记录。
能够为 Faust 代理(流处理器)自动生成代码。
计算数值字段的汇总统计:min(),mean(),median(),stdev(),max()。
添加示例模块以初始化 Kafka 中的多个源主题,控制每个主题中的字段数量,并在给定频率下为这些主题生成消息。
使用 Kafdrop 检查源和聚合主题的消息。
添加 kafka-aggregator 文档网站。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源分布
构建分布
kafka-aggregator-0.2.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 0189b674d6468360652c2efbff322ee18987cdfadb21f6d41ce843609b95dbb4 |
|
MD5 | 00df48ba8c929fd012bfc291f25cbd67 |
|
BLAKE2b-256 | 03aed4ea6da57518a3760900f397191613e66b23166044a3d5017a96172452cd |
kafka_aggregator-0.2.0-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 24e0ab5853788d22d9654be3ca4e4e0793b11f5b37421bde9a77a2b53d9c8e81 |
|
MD5 | 6efb27fd81ab53fe74ca9d15eddc1e85 |
|
BLAKE2b-256 | 8f4be670e57e52d20e5edab7453fe4fa9cf2fc9e767165f1dd686173f2257dca |