查看信息
1 | <property> |
VERSION
这张表的信息很重要,这张表存储的是 Hive的版本号,【非一条不可启动Hive】
比如该表不存在,当启动Hive-Cli时候,就会报错”Table ‘hive.version’ doesn’t exist”。
DBS:
数据库信息:
DB_ID:(数据库的id)
NAME:(数据库名字)
DB_LOCATION_URI:(数据库的存放路径)
TBLS:
表信息:
TBL_ID:(表id)
DB_ID:(表所属数据库的id,作为表的外键关联)
SD_ID:(文件存储类型信息表的id)
TBL_NAME:(表的名字)
TBL_TYPE:(表类型(内部表/外部表))
SDS:
文件存储类型信息:
SD_ID:(文件存储类型id)
CD_ID:(对应CDS表的CD_ID)
INPUT_FORMAT:(输入文件类型)
OUTPUT_FORMAT:(输出文件类型)
LOCATION:(文件存放路径)
CDS
COLUMNS_V2:
列的信息表:
关联表:
CD_ID: 40【对应CDS表的CD_ID】
COLUMN_NAME: url【列名】
INTEGER_IDX: 1【列的index】
PARTITIONS:
分区表信息:
PART_NAME: day=20190416【分区的名字】
关联表:
SD_ID
TBL_ID
PARTITIONS_KEY
分区key的信息表:
关联表:
TBL_ID
PARTITIONS_VAULES
分区vaules的信息表:
关联表:
PART_ID
场景应用
当Hadoop的hdfs与spark依赖的hdfs版本发生冲突的时候;删除hive里的表会发生元数据识别问题;这个时候的问题解决就是
更新hive表的元数据,从mysql手动删除元数据。