Hive的元数据表结构详解

查看信息

1
2
3
4
5
6
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/ruoze_d6?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8</value>
</property>

这是hive-size.xml中元数据信息的配置

VERSION

这张表的信息很重要,这张表存储的是 Hive的版本号,【非一条不可启动Hive】

比如该表不存在,当启动Hive-Cli时候,就会报错”Table ‘hive.version’ doesn’t exist”。

DBS:

数据库信息:

DB_ID:(数据库的id)

NAME:(数据库名字)

DB_LOCATION_URI:(数据库的存放路径)

TBLS:

表信息:

TBL_ID:(表id)

DB_ID:(表所属数据库的id,作为表的外键关联)

SD_ID:(文件存储类型信息表的id)

TBL_NAME:(表的名字)

TBL_TYPE:(表类型(内部表/外部表))

SDS:

文件存储类型信息

SD_ID:(文件存储类型id)

CD_ID:(对应CDS表的CD_ID)

INPUT_FORMAT:(输入文件类型)

OUTPUT_FORMAT:(输出文件类型)

LOCATION:(文件存放路径)

CDS

COLUMNS_V2:

列的信息表:

关联表:

CD_ID: 40【对应CDS表的CD_ID】

COLUMN_NAME: url【列名】

INTEGER_IDX: 1【列的index】

PARTITIONS:

分区表信息:

PART_NAME: day=20190416【分区的名字】

关联表:

SD_ID

TBL_ID

PARTITIONS_KEY

分区key的信息表

关联表

TBL_ID

PARTITIONS_VAULES

分区vaules的信息表:

关联表

PART_ID

场景应用

当Hadoop的hdfs与spark依赖的hdfs版本发生冲突的时候;删除hive里的表会发生元数据识别问题;这个时候的问题解决就是
更新hive表的元数据,从mysql手动删除元数据。

本文标题:Hive的元数据表结构详解

文章作者:skygzx

发布时间:2019年04月21日 - 12:24

最后更新:2019年04月21日 - 14:07

原始链接:http://yoursite.com/2019/04/21/Hive的元数据表结构详解/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

-------------本文结束感谢您的阅读-------------
0%