第20章 流处理基础 Posted on 2026-04-26 In spark-读书笔记 连续处理与微批处理连续处理: 优势: 1. 时延低 不足: 1. 吞吐量小 2. 连续处理系统通常有固定的计算拓扑,如果不停止整个系统,在运行状态下是无法改变的,这也可能会导致负载均衡的问题。计算拓扑是什么,为什么会有负载均衡的问题? 微批处理: 优势: 可以在每个节点上实现高吞吐量,因为他们可以利用与批处理系统相同的优化操作(例如,向量化处理,Vectorized Processing)。什么是向量化处理?