首页导航

航歌

Impala - 内部表、外部表、分区表的使用详解（附样例）

mpala 中的 DDL 和 DML 语句和 Hive 中的用法基本上是一样的，并且 Impala 中也支持内部表、外部表和分区表，下面我将通过样例进行演示。一、内部表的使用 1，创建内部表下面命令创建一张名为 inner_t1 的内部表：注意：Impala 中日期类型不支持 Date，只支持 Timestamp......

2024-10-220
Impala - 解决查询到的数据不是最新的问题（refresh命令）

1，问题描述（1）首先我们创建一张名为 external_t1 的外部表： create external table external_t1( id int, name string, age int, birthday timestamp )row format delimited fields terminated by '\t' lines terminated by '\n' location '/external_t1'; （2）表需要加载的数据文件为 external_t1.dat......

2024-10-214
Impala - 解决Hive新增表在Impala查不到问题（invalidate metadata命令）

1，问题描述（1）首先我在 Hive 这边使用如下命令创建一张 user 表： create table user( id int, name string, age int, online boolean ) row format delimited fields terminated by '\t' lines terminated by '\n'; （2）接着往表中导入一些数据......

2024-10-1811
Impala - 使用操作方式详解（impala-shell命令行、Hue Web页面）

Impala 可以支持多种操作方式，在不同的应用场景中，可以选择不同的操作方式。在开发阶段，一般会使用 impala-shell 这个客户端命令行操作。在日常查询使用的时候，特别是针对非开发人员，常见的是在 Hue 这种 Web 页面中进行操作，不需要连接 Linux 服务器，直接在浏览器页面中操作，非常方便......

2024-10-1715
Impala - 在CDH平台中安装Impala教程

单独安装 Impala 需要自己编译，由于编译的时候需要依赖很多外部依赖，以及一些依赖冲突的问题，所以不建议单独安装。在日常使用中，还是强烈推荐通过 CDH 平台安装 Impala。CDH 中集成的有 Impala，安装非常方便，只需要点击下一步即可安装成功。演示一下如何在 CDH 平台中安装 Impala......

2024-10-168
Impala - 核心原理、特点、以及架构详解

在工作中我们希望能够在页面中输入一个 SQL 语句，点击查询按钮之后，可以快速查看结果，最好是能够在秒级别返回结果，这种数据分析需求也可以称之为即席查询。此时就需要有一个可以支持低延迟，并且计算效率也比较高的数据分析引擎了，所以 Impala 就出现了。Impala 的出现主要就是为了解决 Hive 执行效率低下的问题......

2024-10-1515
GPT4All - 一键搭建本地的AI大模型聊天机器人教程（支持离线使用）

现在 AI 大模型的发展很快，ChatGPT 的强大能力已经让很多人感到 AI 带来的变化。不过，目前商业化较高的 AI 大模型基本都是需要联网或者账号才能使用，这对于普通用户来说很不方便。特别是国内用户，由于网络问题，一些 AI 大模型无法直接使用，或者说在内网环境下也无法访问这些 AI 大模型......

2024-10-1440
Hive - 数据存储格式详解6（PARQUET格式）

六、PARQUET 格式 1，基本介绍（1）Parquet 是一种新型的与语言无关的，并且不和任何一种数据处理框架绑定的列式存储结构，适配多种语言和组件。Parquet 数据存储格式可以在 Hive、Impala、Spark 等计算引擎中使用。（2）Parquet 的存储格式如下图所示......

2024-10-1219
Hive - 数据存储格式详解5（ORC格式）

五、ORC 格式 1，基本介绍（1）ORC（Optimized Row Columnar）格式是为 Hive 优化的一种高效存储格式。它在 RCFile 的基础上进行了改进，提供了更高的压缩比和更快的查询速度。（2）ORC 的存储格式可以参考下面的官网图：可以看出来 ORC 中的数据首先会被划分为多个 Stripe......

2024-10-1115
Hive - 数据存储格式详解4（RCFile格式）

四、RCFile 格式 1，基本介绍（1）RCFile 是专门为 Hive 设计的数据存储格式。数据会首先按照行分组，每个组内部按照列存储。他整合了行存储和列存储的优点，可以称为是行列式存储，大层面还是属于列式存储的。（2）RCFile 的主要特点是压缩速度快，可分割，支持快速列存取......

2024-10-1016

1/267

回到顶部