#

hadoop

  • (第7篇)灵活易用易维护的hadoop数据仓库工具——Hive

       Hivehive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,Hive 定义了简单的类 SQL 查询语言,称为

    作者:I加加
    2020-08-14 11:20:37
  • Yarn命令使用及wordcount解析

    前言: 前面几篇博客主要介绍了MapReduce与Yarn的架构设计及简单工作流程,本篇文章将以wordcount程序为例,简单介绍下Yarn的使用。 1.wordcount示例运行 [root@

    作者:wangkunj
    2020-08-14 05:38:14
  • 最新hadoop新手入门教程汇总

    关于hadoop的分享此前一直都是零零散散的想到什么就写什么,整体写的比较乱吧。最近可能还算好的吧,毕竟花了两周的时间详细的写完的了hadoop从规划到环境安装配置等全部内容。写过程不是很难,最烦的可

    作者:adnb34g
    2020-08-13 05:03:30
  • 干货:HBase实践之读性能优化策略

    任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。总结

    作者:Hjiangxue
    2020-08-12 20:25:53
  • Hadoop机架感知

    背景 最近在整理以前学过的大数据相关知识,今天从Hadoop的机架感知开始,Hadoop机架感知的实现有2种方式:1)、通过实现一个Java接口DNSToSwitchMapping,然后在core-s

    作者:duanpeng198738
    2020-08-12 19:57:48
  • 虚拟机搭建Hadoop

    最近学习搭建hadoop,通过边查资料边搭建,花了半天也搭建好了,借此写下搭建总结,在这里感谢博友【数据放大镜】的文章,很不错,就是按照他的步骤搭建下来的,在这里,自己完善了一下,不说了,直接开搞:P

    作者:zhj789
    2020-08-11 18:19:14
  • hadoop命令行客户端支持的命令参数

     HDFS前言l 设计思想分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析; l 在大数据系统中作用:为

    作者:yushiwh
    2020-08-11 17:03:12
  • 大数据之---官方文档使用大全终极篇----持续更新中

    HDFS web访问 50070YARN web管理 8088HistoryServer web管理 19888Zookeeper 服务端口 2181Hive 服务端口 10000Kafka 服务端口

    作者:ycwyong
    2020-08-11 14:47:14
  • Hadoop集群问题集

    1、bigdata is not allowed to impersonate xxx 原因:用户代理未生效。检查core-site.xml文件是否正确配置。 &

    作者:蜷缩的蜗牛
    2020-08-11 06:52:07
  • YARN 内存参数终极详解

    很多朋友在刚开始搭建和使用 YARN 集群的时候,很容易就被纷繁复杂的配置参数搞晕了:参数名称相近、新老命名掺杂、文档说明模糊 。特别是那几个关于内存的配置参数,即使看好几遍文档也不能完全弄懂含义不说

    作者:cymvp
    2020-08-11 04:41:09