#

hadoop

  • Hadoop 2.4安装与配置

    一、hadoop2.4编译方法可参考:Linux64位操作系统(CentOS6.6)上如何编译hadoop2.4.0。二、准备工具1.部署准备两个机器test1为Master,test2为Slave。

    作者:liyong0802
    2020-08-06 03:14:24
  • Hadoop 系列(五)—— Hadoop 集群环境搭建

    一、集群规划 这里搭建一个 3 节点的 Hadoop 集群,其中三台主机均部署 DataNode 和 NodeManager 服务,但只有 hadoop001 上部署 NameNode 和 Resou

    作者:heibaiying
    2020-08-06 02:41:06
  • Hadoop学习--通过配置文件修改文件副本数块大小--day04

    import java.io.ByteArrayOutputStream;import java.io.FileInputStream;import java.io.FileOutputStream;

    作者:zhicx
    2020-08-06 00:08:01
  • 6、MapReduce自定义分区实现

    MapReduce自带的分区器是HashPartitioner原理:先对map输出的key求hash值,再模上reduce task个数,根据结果,决定此输出kv对,被匹配的reduce任务取走。自定

    作者:victor19901114
    2020-08-05 23:30:39
  • hive 基本架构

    如下图所示,从逻辑上来看,Hive包含了3大部分。 Hive Clients Hive Services Hive Storage and Computing 用户操作Hive的接口主要有三个:C

    作者:choulanlan
    2020-08-05 22:06:12
  • Distcp 分布式拷贝

    (1)discp原理    DistCp(Distributed Copy)是用于大规模集群内部或者集群之间的高性能拷贝工具,和在linux上执行cp,scp实

    作者:酱酱酱子啊
    2020-08-05 16:29:32
  • Yarn流程、Yarn与MapReduce 1相比

    [TOC] Yarn流程 可以参考《Hadoop权威指南》P79中的图示与介绍进行理解,当然结合下面这个图示与其中的解释进行理解则会更加清晰易懂,当然,基本的参考个人觉得书本上的图示要更精简,下面这

    作者:xpleaf
    2020-08-05 16:19:48
  • yarn知识体系总结

    2019/2/18 星期一 yarn知识体系总结 Yarn 产生的原因(1)MapreduceV1 中,jobtracker 存在瓶颈:集群上运行的所有mr 程序都有jobtracker 来调度SPO

    作者:马吉辉
    2020-08-05 16:02:06
  • zookeeper环境配置

    先下载zookeeper的linux安装包 //安装zookeeper必须要先安装jdk,现在都是1.8以上的版本//注意版本的控制,现在线上版本 zookeeper3.4.8无明显bug,生产上要

    作者:马吉辉
    2020-08-05 14:54:23
  • Hadoop定义及其安全优势是什么

    本篇文章给大家分享的是有关Hadoop定义及其安全优势是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。  一、Hadoop定义  H

    作者:Leah
    2020-08-05 14:44:33