返回 导航

大数据

hangge.com

Hive - 快速入门教程1(Hive使用方式:Shell、JDBC代码、可视化工具)

作者:hangge | 2024-09-06 08:38
    Hive 可以使用 Shell 命令行方式操作,也可以使用 JDBC 代码的方式操作,还可以使用一些可视化工具操作。下面我将通过样例演示这三种操作方式。

一、Shell 命令行

1,基本介绍

(1)对于 Shell 命令行方式还可以细分为两种客户端:hive 客户端和 beeline 客户端。两者的区别如下:
  • hive 客户端:是从 Hive —出生就存在的,兼容所有 Hive 板本,但是跟不上时代的发展,属于重量级的客户端。
  • beeline 客户端:是从 Hive 1.1 版本开始出现的,现在都推荐使用 beeline 客户端。它可以实现权限控制,属于较量级的客户端。

(2)对于 Hive 的常规操作,使用 hive 客户端和 becline 客户端没有什么本质区别,所以在工作中使用哪一种方式都是可以的,可以依据个人的使用习惯来选择。

2,hive 客户端的使用

(1)直接使用 Hivebin 目录下的 hive 脚本即可启动 hive 客户端:
提示:要退出 hive 客户端,按 Ctrl + C 键即可。
bin/hive

(2)然后就可以执行 Hive 命令了:

(3)hive 客户端支持 -e 参数,通过该参数可以动态指定具体的 Hive 命令,这样即可把具体的 Hive 命令封装到脚本中定时执行了。
bin/hive -e "show databases;"

3,beeline 客户端

(1)beeline 客户端需要依赖 hiveserver2 服务,所以需要先启动该服务。
nohup bin/hiveserver2 >/dev/null 2>&1 &
 
(2)然后使用 Hivebin 目录下的 beeline 脚本即可启动 beeline 客户端:
提示:要退出 beeline 客户端,按 Ctrl + C 键即可。
bin/beeline -u jdbc:hive2://localhost:10000 -n root

(3)接着就可以执行 Hive 命令了:

(4)beeline 客户端支持 -e 参数,通过该参数可以动态指定具体的 Hive 命令,这样即可把具体的 Hive 命令封装到脚本中定时执行了。
bin/beeline -u jdbc:hive2://localhost:10000 -n root -e "show databases;"

二、JDBC 代码

注意JDBC 代码这种方式需要依赖 hiveserver2 服务,hiveserver2 服务具体启动命令见本文前面部分的内容。


1,添加依赖

首先需要在 Maven 项目的 pom.xml 文件中添加如下 hive-jdbc 依赖:
<dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-jdbc</artifactId>
    <version>3.1.3</version>
</dependency>

2,编写代码 

(1)下面代码通过 JDBC 连接到 HiveServer2,并执行一个展示数据库的 SQL 查询:
public class HiveJdbcTest {
  public static void main(String[] args) throws Exception {
    //指定 hiveserver2 的连接即可
    String jdbcUrl = "jdbc:hive2://192.168.60.9:10000";
    //获取 JDBC 连接,这里的 user 使用 root( Linux 中的用户名),password 随使指定
    Connection conn = DriverManager.getConnection(jdbcUrl, "root", "any");
    //获取 Statement
    Statement stmt = conn.createStatement();//指定查询的 SQL
    String sql = "show databases";//执行 SQL
    ResultSet res = stmt.executeQuery(sql); //循环读取结果
    while (res.next()) {
      System.out.println(res.getString("database_name"));
    }
  }
}

(2)运行结果如下:

三、使用可视化工具

注意:这种方式同样需要依赖 hiveserver2 服务,hiveserver2 服务具体启动命令见本文前面部分的内容。

(1)我们也可以使用像是 DataGrip 这样的可视化工具连接 hive,这里我以 IDEA 为例,在数据库面板点击左上角 + 号,然后选择 Data Source(数据源),最后选择“Apache Hive

(2)在弹出框中输入名称,Host 改成启动 hiveserver2 的主机名,Port 端口默认 10000。第一次连接需要下载驱动,完成上述步骤点击 Apply 应用,点击 OK 确定。

(3)这样可视化连接就完成了。
评论

全部评论(0)

回到顶部