#

hive

  • 解密数据分区

       数据分区分为两种,动态分区和静态分区,那么两种分区是怎样创建的呢?它们各自怎么来使用呢?一、动态分区1、从已有的数据动态创建新的分区2、分区基于最后一个列值自动创建,如果分区

    作者:caosheng03
    2020-08-03 11:49:41
  • HIVE删除分区

    HIVE是不支持TRUNCATE或者DELETE一个分区的,不过有一种代偿的方式alter table v_log_ods drop partition(day='2015-05-31',gt='lo

    作者:刀刀_高扬
    2020-08-03 04:15:00
  • Hive SQL去重a,b和b,a类型

    昨天开发找到我们DBA,要我们写一条Hive SQL。需求:有一个t表,主要有机场名称airport,机场的经纬度distance这两个列组成,想得到所有距离小于100的两个机场名。其实写这个SQL的

    作者:Darren_Chen
    2020-08-03 01:59:02
  • hive 部署UDF函数

    一.临时添加UDF函数    1.上传jar包至hive服务器    2.hive shell执行如下命令:  add jar /

    作者:hahhahahahah
    2020-08-01 22:00:19
  • Hadoop 实践(一) 环境搭建

    大数据定义是:大量的非结构话的数据。量要大,要非结构化。Hadoop 分三部分组成,1.hdfs hadoop分布式文件系统。2.MapReduce 分布式计算。3.hive 分布式存储。操作系统:c

    作者:lu_zhishen
    2020-08-01 10:43:34
  • hadoop + spark+ hive 集群搭建(apache版本)

    0. 引言 hadoop 集群,初学者顺利将它搭起来,肯定要经过很多的坑。经过一个星期的折腾,我总算将集群正常跑起来了,所以,想将集群搭建的过程整理记录,分享出来,让大家作一个参考。由于搭建过程比较漫

    作者:hello_cjq
    2020-07-31 21:01:03
  • sparkSQL来完成对Hive的操作

    接下来做的操作是:(这个操作,将程序打成jar包到集群中运行)(1)编写spark程序在线上的hive中创建表并导入数据(2)查询hive中的数据(3)将查询结果保存到MySQL中代码: object

    作者:原生zzy
    2020-07-30 23:14:05
  • HBase Shell输入命令无法删除问题解决技巧

    HBase shell使用过程中,使用CRT客户端,命令输入后无法删除解决方案:    options-->session options -- >

    作者:cdel_liqi
    2020-07-30 14:22:44
  • 大数据入门指南(GitHub开源项目)

    项目GitHub地址:https://github.com/heibaiying/BigData-Notes 前 言 大数据技术栈思维导图 大数据常用软件安装指南 一、Had

    作者:heibaiying
    2020-07-29 17:26:49
  • Hive分区表简介

    简介:如果一个表中数据很多,我们查询时就很慢,耗费大量时间,如果要查询其中部分数据该怎么办呢,这时我们引入分区的概念。Hive中的分区表分为两种:静态分区和动态分区。 1.静态分区: 可以根据PAR

    作者:wangkunj
    2020-07-29 14:54:05