#

hadoop

  • 大数据技术学习推荐书籍(一)

    因为工作需要需要做一些与大数据开发有关的工作,加之网上的知识过于分散,经常往图书馆跑。看了很多与数据相关的书籍,认为以下基本比较不,错推荐给大家。因为本人接触大数据不足一年,肯定会有一些错误的观念,有

    作者:mr_power
    2020-05-18 23:11:42
  • 基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

    排序可以说是很多日志系统的硬指标(如按照时间逆序排序),如果一个大数据系统不能进行排序,基本上是这个系统属于不可用状态,排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是

    作者:wx58a7bb5e188a6
    2020-05-18 08:16:13
  • Hadoop权威指南摘录---1

    1、为何不用RAIDHDFS所提供的节点间数据复制技术已可满足数据备份需求,无需使用RAID冗余机制。RAID 0速度比JBOD(Just a Bunch Of Disks)慢,JBOD在所有磁盘之间

    作者:断臂人
    2020-05-15 13:36:51
  • 大数据之搭建HDP环境,以三个节点为例(下——扩展节点,删除节点,以及部署其他服务)

    部署主节点以及安装服务请看上https://blog.51cto.com/6989066/2173573 (八)节点的扩展(以HDFS为例)① 从节点的准备工作安装一台新的Linux从节点只需要安装

    作者:asdud
    2020-05-14 08:12:12
  • hadoop研究

    包下载http://archive.cloudera.com/cdh5/cdh/4/http://apache.fayea.com/hadoop/common/hadoop-2.6.4/hadoop-

    作者:zhoulinjun
    2020-05-12 16:47:16
  • Hadoop中最不容错过的压缩知识

      随着大数据时代的来临,数据体量越来越大,处理这些数据会越来越受到网络IO的限制,为了尽可能多的处理更多的数据我们必须使用压缩。那么压缩在Hadoop里面是不是所有格式都适用呢?

    作者:caosheng03
    2020-05-10 19:13:22
  • hadoop2.6.5+sqoop1.4.6环境部署与测试(二)

    首先再看一下四台VM在集群中担任的角色信息:IP            主机名&

    作者:琴里伊始
    2020-05-08 16:10:22
  • 学hadoop需要什么基础

    最近一段时间一直在接触关于 hadoop 方面的内容,从刚接触时的一片空白,到现在也能够说清楚一些问题。这中间到底经历过什么只怕也就是只有经过的人才会体会到吧。前几天看到有个人问“学 hadoop 需

    作者:首席数据师
    2020-05-03 10:52:22
  • 超详细的Hadoop2配置详解

    1. 集群环境Master 192.168.2.100Slave1 192.168.2.101Slave2 192.168.2.102 2. 下载安装包#Masterwget http://mirro

    作者:易金刚
    2020-05-01 03:47:24
  • HDFS重新初始化

    有时会碰到HDFS访问异常,此时可以重新初始化HDFS,但尽量不要过多次数初始化,而且初始化之前最好关闭Hadoop(stop-all.sh),不然会把之前文件都删除,还会造成从节点进程失效.1.关闭

    作者:微酸柠檬
    2020-04-25 14:54:55