首页导航

航歌

TIOBE - 2024年10月编程语言排行

十月头条：Rust 正在缓慢但稳定地接近榜单前十名在当今世界，各种类型的数据量正在迅速增加，对这些数据的处理需求也随之增长。因此，现在需要那些擅长数据处理、数值计算且速度快的编程语言。除此之外，还有两个特性也非常重要：易于学习和安全性......

2024-10-08816
Hive - 数据存储格式详解2（TextFile格式）

二、TextFile 格式 1，基本介绍（1）TextFile 是 Hive 的默认数据存储格式，基于行存储。（2）TextFile 的主要特点是磁盘存储开销大，数据解析开销大。磁盘存储开销大：因为存储的是原始文件内容，没有使用压缩，所以存储开销会比较大。数据解析开销大......

2024-10-06608
Hive - 数据存储格式详解1（基本介绍、各存储格式对比、选择建议）

为了高效存储和处理数据，Hive 支持多种数据存储格式。本文将介绍几种常见的 Hive 数据存储格式及其优缺点。通过合理选择存储格式，可以提高数据存储和查询的效率，满足不同的业务需求。一、存储格式介绍 1，基本介绍（1）常见的 Hive 数据存储格式主要如下......

2024-10-04780
IntelliJ IDEA - 解决没有“添加框架支持”（Add Framework Support）选项问题

1，问题描述（1）最近打算开发一个 Spark 项目，为了将 Scala 框架添加到这个项目中，过去我只需在项目名称上右键菜单中点击“添加框架支持”（Add Framework Support…）即可。（2）而新版的 IntelliJ IDEA（我这里使用的是 2023.2.6）右键菜单找不到“添加框架支持”......

2024-10-024247
Chrome插件 - 浏览器Mock插件安装使用教程（Mock:Intercept and directly return data）

在进行前端开发过程中，少不了要写一些 Mock 数据。而利用 Mock 插件，可以让我们开发时不用在代码中写死 Mock 数据。而要联调时，只需关闭插件中对应接口的 Mock 即可。下面将介绍这个插件的安装和使用。 1，插件介绍与安装（1）“Mock:Intercept and directly return data”是一款......

2024-09-301297
Hive - 数据倾斜的原因以及解决办法（附样例）

在大数据处理的过程中，Hive 是一种常用的工具。然而，在处理大规模数据时，数据倾斜问题往往会导致查询性能下降，甚至查询失败。本文将介绍 Hive 数据倾斜的原因，并提供几种有效的解决方案。一、数据倾斜原因分析 1，可能会触发 Hive 数据倾斜的情况......

2024-09-29895
Hive - 解决执行本地任务报“return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask”错误

1，问题描述（1）最近发现当我使用本地模式通过 Hive 客户端执行类似如下的 Hive 查询时，任务执行正常： select max(id) from t1; （2）而如果通过 beeline 客户端执行，则会报如下错误，无法成功执行。 Error: Error while processing statement: FAILED: Execution Error......

2024-09-272719
Docker - 制作PyTorch+YOLO+Jupyter模型训练环境镜像教程（深度学习环境）

要训练 AI 模型，我们除了直接可以在物理机上训练数据集外，也可在 Docker 容器中进行训练。并且由于 Docker 的可移植性，能让我们十分方便地进行安装部署、环境配置、备份还原等操作。本文分别通过 docker commit 和 Dockerfile 这两种方式演示如何制作一个 PyTorch + YOLOv5 + Jupyter 的算法镜像......

2024-09-261375
Hive - 解决建表语句中文注释乱码问题（comment乱码）

1，问题描述（1）我们知道在建表时使用用 comment 关键字可以给字段，以及表本身增加注释： create table t5( age int comment '年龄' ) comment '测试'; （2）但创建后查看这个表的信息，可能会发现我们添加的中文注释都是乱码： 2，问题原因（1）中文乱码的原因是因为 hive 数据库里面的表都是 latin1 编码......

2024-09-25822
Hive - 日志依赖包冲突解决、以及日志配置教程

一、日志依赖包冲突解决 1，问题描述当我们每次进入 hive 命令行的时候都会出现下面这么一坨日志，十分影响体验： 2，解决办法（1）通过红框内容可以看出，这是由于 hive 中的一个日志依赖包和 hadoop 中的日志依赖包冲突，所以需要删除一个......

2024-09-24745

53/318

回到顶部