hadoop作为分布式的系统, 集群机器之间的通信是最基本,最常见的需求。这种需求本质上是IPC, 即进程间通信。 按照传统的UINX编程模型,进程间通信无非是如下的几种方式:管道, FIFO, 消息
前提:一定要保证iptables是关闭的并且selinux是disabled1、准备硬件1台namenode和3台datanodenamenode 192.168.137.100datanode1 1
hadoop的安装,总共分为三个部分,分别是jdk的安装,ssh免密码,最后就是hadoop的安装1,jdk的安装,及其安装过程中遇到的问题:  
很多初学Hadoop开发的同学分不清Hadoop和Spark究竟有什么联系?搞不清Hadoop和Spark是两个独立的框架,还是必须相互依存才能完成工作?今天就给大家分析一下Hadoop和Spark几
数据采集是大数据分析全流程的重要环节,典型的数据采集工具包括ETL工具、日志采集工具、数据迁移工具等。 Flume是一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统。1.安装F
1、简介 Kafka is a distributed,partitioned,replicated commit logservice。它提供了类似于JMS的特
zookeeper提供了一个层次化目录结构,命名符合常规文件系统规范。每个节点在zookeeper中叫做znode,并且它有一个唯一的路径标识。znode有两种类型:短暂的(ephemeral)和持久
maven:配置maven环境①将maven解压到一个没有空格没有中文的路径上②添加环境变量M2_HOME,并添加PATH路径M2_HOME=C:\mysoft\apache-maven-3.5.0P
import java.io.IOException;import java.util.Iterator;import java.util.List;import org.apache.had
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 1.文档编写目的 本文档主要讲述如何使用Sentry对Hive外部表权限管理,并基于以下假设: 1.操作系统版本:RedHat6.5