第1关: Spark Streaming 基础 与 套接字流 1. Spark Streaming的基本概念和工作原理 Spark Streaming是Apache Spark的一个扩展模块,用于处理实时数据流。它将数据流切分为一系列小批次(微批次),并使用与批处理相同的API进行处理。这种微批处理的架构使得Spark Streaming能够高效地处理实时数据,并提供高容错性和可扩展...
具有KV商店的Spark History Server v2 [ SPARK-18085 ] 与结构化数据流[机器学习管道API模型评分SPARK-13030,SPARK-22346,SPARK-23037 ] MLlib增强亮点[ SPARK-21866,SPARK-3181,SPARK-21087...