#

hadoop

  • 数据集成:Flume和Sqoop

    Flume和Sqoop是Hadoop数据集成和收集系统,两者的定位不一样,下面根据个人的经验与理解和大家做一个介绍:Flume由cloudera开发出来,有两大产品:Flume-og和Flume-ng

    作者:caosheng03
    2020-07-01 18:22:05
  • Apache Hadoop 入门教程第二章

    Apache Hadoop 单节点上的安装配置 下面将演示快速完成在单节点上的 Hadoop 安装与配置,以便你对 Hadoop HDFS 和 MapReduce 框架有所体会。 先决条件 支持平

    作者:哈斗篷
    2020-07-01 16:07:02
  • hive安装记录

    hive独立模式安装--jared该部署笔记是在2014年年初记录,现在放在51cto上。有关hadoop基础环境的搭建请参考如下链接:http://ganlanqing.blog.51cto.com

    作者:kuankuan001vip
    2020-07-01 02:28:28
  • Spark入门指南

       一、初识Spark和Hadoop     Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark

    作者:卫莨
    2020-07-01 01:23:12
  • 通过hadoop自带的demo运行单词统计

    1)mkdir input2)cd  intput3)echo “hello word” > file1.txt4)echo “hello Hadoop” 

    作者:大数据部落
    2020-07-01 00:35:17
  • Hadoop运维记录系列(二十六)

    一分钟内部署jupyterlab + pyspark2 + hive,前提是spark2是可以在yarn上正常运行的。最近甲方打着滚的向乙方要求装 jupyterlab,然后还要用spark2,所以,

    作者:Slaytanic
    2020-06-30 21:04:28
  • Hadoop环境搭建cdh版本

    hadoop环境搭建单机(cdh版本)1.下载安装包      下载地址http://hadoop.apache.org/下载hadoop-2.6.0-cdh6.12.22.安装tar -zxvf 

    作者:不鼓自鸣
    2020-06-30 18:55:07
  • Hadoop 源码目录树

    1、NameNode---FSNamesystem:------FSDirectory 目录树---------INodeDirectory节点目录------------List

    作者:javawelcome
    2020-06-30 18:51:02
  • HDFS HA架构

    HA背景对于HDFS、YARN的每个角色都是一个进程,比如HDFS:NN/SNN/DN   老大是NNYARN:RM/NM   老大是RM对于上面,都会存在单点故障的问题,假如老大NN或者RM挂了,那

    作者:xiao酒窝
    2020-06-30 18:39:45
  • Hadoop HDFS Balancer

    Hadoop HDFS Balancer    Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。当HDFS出现不平衡状况的时

    作者:zlfwmm
    2020-06-30 15:16:04