#
引言 在上一篇中 大数据学习系列之五 ----- Hive整合HBase图文详解 : http://www.panchengming.com/2017/12/18/pancm62/ 中使用Hive整
本节主要内容Spark重要概念弹性分布式数据集(RDD)基础1. Spark重要概念本节部分内容源自官方文档:http://spark.apache.org/docs/latest/cluster-o
本篇博客将详细探讨DStream模板下的RDD是如何被创建,然后被执行的。在开始叙述之前,先来思考几个问题,本篇文章也就是基于此问题构建的。 1. RDD是谁产生的? 2. 如何产
API应用可以通过使用Spark提供的库获得Spark集群的计算能力,这些库都是Scala编写的,但是Spark提供了面向各种语言的API,例如Scala、Python、Java等,所以可以使用以上语
import org.apache.hadoop.hbase.{HBaseConfiguration, HTableDescriptor} import org.apac
本期内容: 1、Receiver启动方式的设想 2、Receiver启动源码彻底分析一:Receiver启动方式的设想 1. S