#

hadoop

  • 安装Oozie4.1.0-CDH版本

    安装oozie经历了好长的时间,先是源码包,但是放弃了。。。然后就是安装的这个CDH版本的,弄了好久,经常报各种错误。最后整理出来这篇。这个安装过程同样适用于oozie4.1.0的其他的CDH版本。先

    作者:白话
    2020-07-26 12:53:28
  • 一文带你弄懂Livy——基于Apache Spark的REST服务

    背景 Apache Spark作为当前最为流行的开源大数据计算框架,广泛应用于数据处理和分析应用,它提供了两种方式来处理数据:一是交互式处理,比如用户使用spark-shell或是pyspark脚本启

    作者:Hjiangxue
    2020-07-26 11:58:04
  • 学习笔记--hadoop

    Hadoop hadoop-1.2.1.tar.gz jdk-6u32-linux-x64.binUseradd  -u 900 hadoopMv jdk1.6.0_32 &nbs

    作者:wx57d3f95165c0b
    2020-07-26 09:54:54
  • mac或linux下安装hadoop-2.8流程

    mac上安装hadoop 1,mac下的javall /usr/bin |grep'java'默认:/System/Library/Frameworks/JavaVM.framework/V

    作者:zhao_xiao_long
    2020-07-26 09:28:14
  • 老司机告诉你大数据开发:学Hadoop好还是Spark好?

    相信看这篇文章的你们,都和我一样对Hadoop和Apache Spark的选择有一定的疑惑,今天查了不少资料,我们就来谈谈这两种 平台的比较与选择吧,看看对于工作和发展,到底哪个更好。一、Hadoop

    作者:白金大数据
    2020-07-25 21:34:28
  • Hadoop常用的操作命令(2)

    Hadoop常用的操作命令 列出目录清单 [root@centos67 ~]# hdfs dfs -ls / 递归列出目录清单 [root@cen

    作者:小疯魔
    2020-07-25 14:25:41
  • namenode ha切换优化

    一、背景目前namenode使用了ha的部署模式,但系统会经常出现ha的自动切换(namenode节点其实正常)。经过调研发现可能的原因如下: HealthMonitor check本地namen

    作者:zouqingyun
    2020-07-25 09:57:58
  • Spark 的Core深入(二)

    Spark 的 Core 深入(二) 标签(空格分隔): Spark的部分 一: 日志清洗的优化 二:Spark RDD 三:SparkContext三大功能 四:Spark on YARN 五

    作者:flyfish225
    2020-07-25 09:40:23
  • 8、Yarn资源调度系统架构与原理分析

    @[TOC] 1、Yarn介绍    Apache Hadoop YARN 是 apache Software Foundation Hadoop的子项目,为分离Hado

    作者:victor19901114
    2020-07-25 06:06:10
  • Hadoop大数据开发学习路线图阶段一

    Hadoop发展到今天家族产品已经非常丰富,能够满足不同场景的大数据处理需求。作为目前主流的大数据处理技术,市场上很多公司的大数据业务都是基于Hadoop开展,而且对很多场景已经具有非常成熟的解决方案

    作者:风声少年
    2020-07-25 00:38:10