hive_第6页_IT分享知识网

HIve

真正让你明白Hive参数调优系列1：控制map个数与性能调优参数「建议收藏」

真正让你明白Hive参数调优系列1：控制map个数与性能调优参数「建议收藏」本系列几章系统地介绍了开发中Hive常见的用户配置属性，并说明了哪些版本引入了哪些属性，常见有哪些属性的使用，哪些属性可以进行Hive调优，以及

2022-12-17

HIve

数仓｜优化–Hive 表关联数据倾斜「建议收藏」

数仓｜优化–Hive 表关联数据倾斜「建议收藏」当数据量比较大且分布不均匀时，对数据进行JOIN操作很容易造成数据倾斜，因为在JOIN的执行阶段会将JOIN KEY相同的数据分发到同一个tas

2022-12-17

HIve

Hive企业级PB级数据倾斜优化大全(建议收藏)「建议收藏」

Hive企业级PB级数据倾斜优化大全(建议收藏)「建议收藏」背景:由于数据倾斜,导致某一个或者几个reduce任务一直卡住在99%。特别当数据量越来越多的情况下,更加容易发生。

2022-12-17

HIve

算力提升117%，资源使用下降50%，打开集群优化正确姿势「建议收藏」

算力提升117%，资源使用下降50%，打开集群优化正确姿势「建议收藏」算力提升117%，资源使用下降50%，打开集群优化正确姿势

2022-12-17

HIve

数仓应用工具Hive：从底层设计窥见其优化策略「建议收藏」

数仓应用工具Hive：从底层设计窥见其优化策略「建议收藏」官网上对Hive的介绍可以简单理解为：它是一款构建在Hadoop之上的数据仓库软件，将已存储的数据结构化。

2022-12-17

HIve

数仓｜Hive性能调优[通俗易懂]

数仓｜Hive性能调优[通俗易懂]在企业中使用Hive构建离线数仓是一种十分普遍的方案。尽管Hive的使用场景是通过批处理的方式处理大数据，通常对处理时间不敏感。但是在资源有限的

2022-12-17

HIve

一文带你搞清楚什么是“数据倾斜”「建议收藏」

一文带你搞清楚什么是“数据倾斜”「建议收藏」原写法:SELECT mid， url， COUNT AS cntFROM subqGROUP BY mid， urlORDER BY cnt

2022-12-17

HIve

再谈hive–job数、mapper数和reducer数「建议收藏」

再谈hive–job数、mapper数和reducer数「建议收藏」我们在集群上提交hive作业时，通过打印的运行日志可以看到hive作业有多少个job、多少个mappper、多少个reducer。job数可以理

2022-12-17

HIve

你知道Hive统计函数count(*)为什么不走MR吗？[通俗易懂]

你知道Hive统计函数count(*)为什么不走MR吗？[通俗易懂]问题Hive执行count(*)不走MR呢？[what]先说结论：如果表数据是insert进表的，count(*)统计时，带where条件执行时

2022-12-17

HIve

Hive千亿级数据倾斜解决方案（好文收藏）[通俗易懂]

Hive千亿级数据倾斜解决方案（好文收藏）[通俗易懂]数据倾斜问题剖析数据倾斜是分布式系统不可避免的问题，任何分布式系统都有几率发生数据倾斜，但有些小伙伴在平时工作中感知不是很明显，这里要注意本篇文

2022-12-17

HIve

HiveSQL中级进阶常用技巧「建议收藏」

HiveSQL中级进阶常用技巧「建议收藏」方式一:通过设置每个 reducer 处理的数量大小，最多 reducer 数量来间接控制 reducer 数据。

2022-12-17

Flink

Hive,Flink,Spark出现数据倾斜了？别慌，原因和解决方法早知道[通俗易懂]

Hive,Flink,Spark出现数据倾斜了？别慌，原因和解决方法早知道[通俗易懂]在计算过程中有些地方数据早早地处理完了，有些地方数据迟迟没有处理完成，造成整个处理流程迟迟没有结束，这就是最直接数据倾斜的表现。

2022-12-17

Flink

京东：Flink SQL 优化实战[通俗易懂]

京东：Flink SQL 优化实战[通俗易懂]在 Flink SQL 任务里会出现以下这种情况:如果相同的 UDF 既出现在 LogicalProject 中，又出现在 Where 条件中，

2022-12-17

HIve

详解HiveSQL执行计划[通俗易懂]

详解HiveSQL执行计划[通俗易懂]一、前言Hive SQL的执行计划描述SQL实际执行的整体轮廓，通过执行计划能了解SQL程序在转换成相应计算引擎的执行逻辑，掌握了执行逻辑也就能

2022-12-17

HIve

架构实践——Hive大数据表的性能调优技巧「建议收藏」

架构实践——Hive大数据表的性能调优技巧「建议收藏」关键要点从 Hadoop 文件系统或 Hive 表读取数据时，从事大数据应用程序的开发人员会遇到挑战。合并作业是一种用于将较小文件合并到较大文件

2022-12-17

HIve

5.HIVE定位调优指导「建议收藏」

5.HIVE定位调优指导「建议收藏」1.1. 日志搜集1.1.1. HiveServer日志获取Hive调优需要看HiveServer的运行日志及GC日志。HiveServer日志

2022-12-17

HIve

我33岁，从国企主管零基础转型大数据开发，年薪涨了20W[通俗易懂]

我33岁，从国企主管零基础转型大数据开发，年薪涨了20W[通俗易懂]2013年本科毕业留在上学的二线城市，到2021年，在一家国企里干了8年，分别干过培训，行政，后勤，从专员干到主管，工资从3K一点点升到9K，日

2022-12-17

HIve

数据仓库中的SQL性能优化「建议收藏」

数据仓库中的SQL性能优化「建议收藏」一个Hive查询生成多个map reduce job，一个map reduce job又有map，reduce，spill，shuffle，so

2022-12-17

HIve

「面试宝典」2022年超全超详细的最新大数据开发面试题，附答案「建议收藏」

「面试宝典」2022年超全超详细的最新大数据开发面试题，附答案「建议收藏」前言:此套面试题来自于各大厂的真实面试题及常问的知识点，如果能理解吃透这些问题，你的大数据能力将会大大提升，进入大厂指日可待。

2022-12-17

HIve

Hive MetaStore 在快手遇到的挑战与优化「建议收藏」

Hive MetaStore 在快手遇到的挑战与优化「建议收藏」分享嘉宾：王磊@快手编辑整理：Frank出品平台：DataFunTalk导读：快手基于Hive构建数据仓库，并把Hive的元数据信息存储在MyS

2022-12-17

类别:

HIve