#

hdfs

  • hdfs--hadoop--双namenode三datanode

    前提:搭建zookeeper集群、java环境、无秘互通注意:文中加粗部分表示需要按实际情况修改的部分 zookeeper可以参考:zookeeper传送门 下载安装包 https://mirr

    作者:yr_linux运维
    2020-07-07 12:40:14
  • 大数据之hadoop

    一、大数据大数据:解决海量数据问题的技术。大数据由巨型数据集组成,把数据集合并进行分析可得出许多额外的信息和数据关系性。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

    作者:神奇的小哈
    2020-07-06 08:28:20
  • Hadoop 查看某个文件分成几个块,分别在那台机架的哪个机器上

    命令是 hadoop fsck /g6/input/baidu.log -files -blocks -locations -racks [hadoop@hadoop002 ~]$ hadoop fs

    作者:Stitch_x
    2020-07-06 00:39:42
  • Hadoop核心组件:四步通晓HDFS

    Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统,它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序,那么在实际应用中我们如何来操作使用呢?一、HD

    作者:caosheng03
    2020-07-04 15:21:05
  • hadoop源码解析---INodeReference机制

    本文主要介绍了hadoop源码中hdfs的INodeReference机制。在hdfs2.6版本中,引入了许多新的功能,一些原有的源代码设计也有一定的改造。一个重要的更新就是引入了快照功能。但是当HD

    作者:yushaoqing
    2020-07-04 13:52:07
  • Hadoop集群(一) Zookeeper搭建

    作为Hadoop初学者,自然要从安装入手。而hadoop的优势就是分布式,所以,也一定要安装分布式的系统。整体安装步骤,包括Zookeeper+HDFS+Hbase,为了文章简洁,我会分三篇blog记

    作者:hsbxxl
    2020-07-03 14:43:36
  • 部署HDFS

    HDFS存放副本时会优先在同一个数据节点备份一份,然后在不同的虚拟机架上备份namenode的HA是靠主备方式保证的,自动切换时要用到zookeeper,手动切换可以通过命令,备节点可以在数据节点上,

    作者:sw5720
    2020-07-03 08:40:27
  • 搭建部署Hadoop 之 HDFS

    HDFS  Hadoop 分布式文件系统分布式文件系统分布式文件系统可以有效解决数据的存储和管理难题– 将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统– 众多的节点组成一个

    作者:Xuenqlve
    2020-07-02 23:13:37
  • 贴一段java读取hdfs 解压gz zip tar.gz保存到hdfs的代码

    package main.java;import java.io.*;import java.util.LinkedList;import java.util.List;import java.uti

    作者:ranfengzheng
    2020-07-02 17:05:53
  • 开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0

    1.前言“大云物移”是当年很火热的一个话题,分别指大数据、云计算、物联网和移动互联网,其中大数据领域谈论得多就是Hadoop。当然Hadoop不代表大数据,而是大数据处理领域的一个比较有名的开源框架而

    作者:周金桥
    2020-07-02 12:32:25