教育行业A股IPO第一股(股票代码 003032)

全国咨询/投诉热线:400-618-4000

大数据离散流是什么?

更新时间:2021年01月05日16时10分 来源:传智教育 浏览次数:

Spark Streaming提供了一个高级抽象的流,即DStream(离散流)。DStream表示连续的数据流,可以通过Kafka、Flume和Kinesis等数据源创建,也可以通过现有DStream的高级操作来创建。DStream的内部结构如图1所示。

图1 DStream流的内部结构

从图1可以看出,DStream的内部结构是由一系列连续的RDD组成,每个RDD都是一小段时间分隔开来的数据集。实际上,对DStream的任何操作,最终都会转变成对底层RDDs的操作。




猜你喜欢:

Spark与Hadoop有哪些区别?【大数据培训】

SparkMllib如何解决回归问题?[大数据培训]

Spark的集群安装与配置简介【大数据技术文章】

传智教育大数据培训课程

0 分享到:
和我们在线交谈!