目 录主机列表基础环境集群主机基础配置配置 NTP 服务配置 MySQL 服务器安装 Cloudera Manager Server 和 AgentServer配置 Server 端配置 Agent
1、Hadoop生态概况 Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效
1.protobuf编译安装[root@hadoop1 ~]# yum install svn autoconf automake 
1.Hadoop安装步骤将Hadoop文件拷贝到/usr/local目录下并解压Tar -zxvf hadoop-3.0.0.tar.gz将解压后文件重命名hadoop mv hadoop-3.0
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapRedu
接上:http://onlyoulinux.blog.51cto.com/7941460/1554951上文说到用hadoop2.4.1分布式结合hase0.94.23出现大量的报错,没能解决,最后用
2019/2/18 星期一 hdfs namenode HA高可用方案 1、hadoop-ha 集群运作机制介绍所谓HA,即高可用(7*24 小时不中断服务) //hadoop 2.x 内置了
1. HBase 一个构建在HDFS上的高可靠、高性能、面向列、可伸缩、分布式列存储开源数据库,主要用于存储海量数据,同时使用mapreduce处理HBa
openstack是一个开源的云计算框架,而Hadoop是一个开源的大数据框架,二者的侧重点不同。 区别: 云计算是在云平台上提供存储和计算资源。 而以Hadoop为模型的大数据是提供了一种分布
hadoop Common: 包括Hadoop常用的工具类,由原来的Hadoop core部分更名而来。主要包括系统配置工具Configuration、远程过程调用RPC、序列化机制和Hadoop抽象