#

hdfs

  • 记一次HDFS的block corrupt事件

    还有最后两天班,明天晚上回家过年了,可是CDH突然报了一个block missing的错误,用 hdfs fsck /检查了一下,我们的块一共有500W个,missing了将近100W个,天呐,不过由

    作者:choulanlan
    2020-07-01 09:12:45
  • HDFS HA架构

    HA背景对于HDFS、YARN的每个角色都是一个进程,比如HDFS:NN/SNN/DN   老大是NNYARN:RM/NM   老大是RM对于上面,都会存在单点故障的问题,假如老大NN或者RM挂了,那

    作者:xiao酒窝
    2020-06-30 18:39:45
  • Hadoop HDFS Balancer

    Hadoop HDFS Balancer    Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。当HDFS出现不平衡状况的时

    作者:zlfwmm
    2020-06-30 15:16:04
  • 4、Intelij+Maven搭建Hadoop项目

    1创建工程 点击project——Maven——next 2通过maven导入项目依赖jar包 (1)设置maven自动导入依赖jar包勾选 Import Maven projects automa

    作者:victor19901114
    2020-06-29 07:40:39
  • 【总结】Hadoop配置文件hdfs-site.xml

    dfs.ha.automatic-failover.enabledtrue

    作者:巧克力黒
    2020-06-29 05:11:53
  • 第85课:基于HDFS的SparkStreaming案例实战和内幕源码解密

    一:Spark集群开发环境准备启动HDFS,如下图所示: 通过web端查看节点正常启动,如下图所示:2.启动Spark集群,如下图所示:通过web端查看集群启动正常,如下图所示:3.启动st

    作者:Spark_2016
    2020-06-27 06:00:35
  • 大数据生态学习__HS&MR

    Hadoop:版本迭代较快,最新为3.0版本,本次学习以2.0为主;

    作者:perfectgum
    2020-06-25 16:33:38
  • hdfs数据误删分析与恢复

    一、相关参数:1、core-site.xml  文件修改以下配置项:      fs

    作者:zouqingyun
    2020-06-23 11:10:35
  • 大数据分布式计算--hadoop

     Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop 核心

    作者:yi003958
    2020-06-22 09:36:11
  • Hadoop运维记录系列(二十七)

    记录一个调试 pyspark2sql 访问 HDFS 透明加密的问题。访问源码如下,使用 pyspark2.1.3,基于 CDH 5.14.0 hive 1.1.0 + parquet,其中selec

    作者:Slaytanic
    2020-06-21 17:50:19