#

hadoop

  • Hadoop分布式集群最快部署配置攻略

    本文只是介绍apache hadoop完全分布式的最简化部署配置 没有对性能进行优化 实际生产环境hadoop的调优参数有几十个 Hadoop简介 Hadoop的框架最核心组成结构就是:HDFS和M

    作者:骏珏_
    2020-08-03 17:59:03
  • 初步认识hadoop的一些总结

    作者:we蝈蝈
    2020-08-03 16:42:20
  • 分布式微服务架和SOAj架构体系详解

    微服务架构的演变微服务架构的技术体系、社区目前已经越来越成熟。在最初系统架构的搭建,或者当现有架构已到达瓶颈需要进行架构演进时,很多架构师、运维工程师会考虑是否需要搭建微服务架构体系。虽然很多文章都说

    作者:编程南风
    2020-08-03 15:44:18
  • Apache Bigtop再论与卖书求生存

    快一年没写博客了,终于回来了,最近因公司业务需要,要基于cdh发行版打包自定义patch的rpm,于是又搞起了bigtop,就是那个hadoop编译打包rpm和deb的工具,由于国内基本没有相关的资料

    作者:Slaytanic
    2020-08-03 14:57:06
  • YARN HA架构

    Yarn HARM:a.启动时会通过向ZK的/hadoop-ha目录写一个lock文件,写成功则为active,否则standybystandy 的RM会一直监控lock文件是否存在,如果不存在就会尝

    作者:xiao酒窝
    2020-08-03 13:52:36
  • hadoop的几个常用命令

    官方文档:http://hadoop.apache.org/docs/r1.2.1/file_system_shell.html1、登录主节点,切换到hdfs用户[hdfs@cdhm1~]#su&nb

    作者:知者不言
    2020-08-03 12:30:25
  • 解密数据分区

       数据分区分为两种,动态分区和静态分区,那么两种分区是怎样创建的呢?它们各自怎么来使用呢?一、动态分区1、从已有的数据动态创建新的分区2、分区基于最后一个列值自动创建,如果分区

    作者:caosheng03
    2020-08-03 11:49:41
  • 数据挖掘领域经典算法——CART算法

    简介 CART与C4.5类似,是决策树算法的一种。此外,常见的决策树算法还有ID3,这三者的不同之处在于特征的划分: ID3:特征划分基于信息增益 C4.5:特征划分基于信息增益比 CART:特征划分

    作者:Hjiangxue
    2020-08-03 06:26:42
  • hadoop 开发---WordCount

    参考http://hadoop.apache.org/docs/r2.7.6/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduc

    作者:JUN_LJ
    2020-08-03 03:54:33
  • HDFS 入门和基本操作

    1、HDFS 是做什么的   Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS,hdfs是分布式计算中数据存储管理的基础,是基于流数据

    作者:万和IT教育
    2020-08-02 17:53:17