一、hadoop扩容1、配置各节点hosts文件,加入新加入的两个节点的IP和主机名新添加的节点添加下面内容192.168.11.131 master11
1.1.什么是hadoop 1.hadoop是apache旗下的一套开源软件平台,可以通过http://apache.org/--->project- ->hadoop打开 2
import java.io.ByteArrayOutputStream;import java.io.FileInputStream;import java.io.FileOutputStream;
~~~~~~~~~~~~~~~~~~~~~
一、基本概念与模型1、大数据结构化数据:有严格定义半结构化数据:html、json、xml等,有结构但没有约束的文档非结构化数据:没有元数据,比如说日志类文档搜索引擎:ELK,搜索组件、索引组件组成,
./bin/hdfs dfsadmin -reporthttp://192.168.209.162:50070/dfshealth.html#tab-overview可以操作目录http://192.
请看上一篇linux 的安装。环境:centos6.5 3台主机 (复制主机,可以直接复制虚拟机文件)一台为主,复制的为从。 master-ip:1
第一天2.Hadoop框架介绍与搜索技术体系介绍1.大数据典型特性与分布式开发难点2.Hadoop框架介绍与搜索技术体系介绍3.Hadoop版本与特性介绍4.Hadoop核心模块之HDFS分布式文件系
博文后续编辑中
*基本操作(单集群):***1、创建文件夹命令[hadoop@master ~]$ hadoop fs -mkdir -p /201910212、上传文件命令[hadoop@master ~]$ h