#

hadoop

  • Impala隐藏的惊天秘密

    元数据作为大数据的源泉,有着非常重要的作用。可在Impala中却隐藏着一个秘密?和元数据有着颇深的渊源,我们一起来追溯!一、Impala体系结构(1)每个slave节点运行一个Impala进程,和HD

    作者:caosheng03
    2020-08-22 13:20:19
  • 笔记-----配置NAT静态IP

     hadoop ---------------------1、可靠、可伸缩、分布式的计算框架,开源软件四大模块1、common hadoop0-common2、hdfs3、mapr

    作者:厦小岗
    2020-08-22 11:08:05
  • 深度解析数据挖掘关联规则Apriori算法

    01、关联规则挖掘背景和基本概念如下所示的数据集,表中的每一行代表一次购买清单,注意我们只关心记录出现与否,不关心某条记录购买了几次,如购买十盒牛奶也只计一次。数据记录的所有项的集合称为总项集,上表中

    作者:Hjiangxue
    2020-08-22 08:01:16
  • CentOS下 安装配置hadoop环境--单实例版

    CentOS下1、安装linux2、安装jdk[root@Cent0S1 ~]# javac //显示信息[root@Cent0S1 ~]# rpm -qa |grep jdk //查看是否有

    作者:敏而所学
    2020-08-19 05:44:34
  • CDH集群搭建步骤

    CDH集群搭建步骤详细文档  一、关于CDH和Cloudera ManagerCDH (Cloudera's Distribution,including Apache Hadoo

    作者:四京
    2020-08-19 02:39:24
  • 使用Hadoop提供的API操作HDFS

        本篇文章主要是记录一下如何使用Hadoop提供的API,通过编程的方式来对HDFS进行增删查改等操作。Hadoop的版本不同,可能函数的参数会有所不同,

    作者:艾斯的梦想
    2020-08-17 16:21:48
  • Hadoop-HBASE 热添加新节点

    Hadoop-HBASE 热添加新节点环境:192.168.137.101 hd1192.168.137.102 hd2192.168.137.103 hd3192.168.137.104 hd4四节

    作者:zlfwmm
    2020-08-16 23:37:33
  • Spark能做什么?Spark应用领域

    Spark能做什么?Spark应用领域Spark是大数据技术中数据计算处理的王者,能够一次处理PB级的数据,分布在数千个协作的物理或虚拟服务器集群中,它有一套广泛的开发者库和API,并且支持Java,

    作者:mo默芯
    2020-08-16 17:52:24
  • could't create native thread的问题跟踪

    一、问题描述之前因为java.lang.OutOfMemoryError: unable to create new native thread设置了Xss参数,见http://zouqingyun.

    作者:zouqingyun
    2020-08-16 16:09:05
  • MapReduce原理及实例分析

    前言由于最近开始涉及MR程序的编写,之前会一点HIVE,对MR接触不多,不论从原理还是实际操作上,都有些障碍,终于在今天柳暗花明,将这一过程记录下,与大家分享~环境准备在VM上搭建好LINUX虚拟机,

    作者:zfz_linux_boy
    2020-08-15 14:54:59