Hive 安装

鉴客 发布于 2014/08/18 16:57
阅读 896
收藏 4

Hive 的安装非常直接,只需要 3 步搞定,走起!

软件要求
1. Java 6
2. 安装 Hadoop 2.x ,之前已经有描述过 Hadoop Setup
3. 如果是 Windows 系统则需要安装 Cygwin

下载
1. 下载 jar 包 http://hive.apache.org/releases.html
2. $ tar -xzvf hive-x.y.z.tar.gz
3. 解压到 /Users/nitin/software/hive-a.b.c

环境设置
1. $ export HIVE_HOME=/Users/application/apache-hive-0.13.0
2. $ export PATH=$HIVE_HOME/bin:$PATH
3. 将这些变量添加到 bash profile 中避免重复设置
4. 使用如下命令启动 Hive Shell
% hive
hive>
Hive 可通过 hive 命令启动,也可以用 -e 参数来直接运行。Hive 提供一个默认数据库。

hive> show databases;
Or $hive -e 'show databases'
OK
Default

HiveQL 对大小写不敏感。下面命令显示当前数据库的所有表:

Hive> show tables;
OK

Tables

Hive 表格的数据存储在 HDFS 文件系统中,表结构是作为元数据保存在本地的 Metastore,有两种类型的表:
1. Managed table: Hive 管理存储在 HDF 的数据,如果表被删除,数据将从 HDFS 中删除
2. External table: 外部表将一直存在于 HDFS 文件系统,尽管表已被删除
Create Table:
Create file with value
Employee.txt
================
name1,address1
name2,address2

Hadoop fs –copyFromLocal employee.txt /tmp/employee/
CREATE EXTERNAL TABLE IF NOT EXISTS employee (NAME STRING, ADDRESS STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
LOCATION '/tmp/employee';
hive>select * from employee;
OK
name1 address1
name2 address2
加载中
返回顶部
顶部