1.hive(数据仓库:data warehouse)
1 | 构建再Hadoop之上的数据仓库 |
2.有人说Hive不难,就是写SQL实现(这是错误的说法)
1 | 架构层面,语法层面,底层执行层面,考虑优化 |
3.install hive
1 | wget http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz |
4.配置环境变量
1 | vi ~/.bash_profile |
5.hive的存储
1 | 由于hive是构建再Hadoop之上的数据仓库,那么他的存储数据的位置也在hdfs中。 |
6.安装步骤
1 | 1)下载 |
7.Hive vs RDBMS
1 | 都可以使用SQL |
8.单点问题:
1 | Hive和mysql的链接中,mysql属于单点,如果mysql挂了,那么元数据也就没了,生产中我们一般需要让运维人员帮我们搭一个主备 |