面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工

面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工作为一名程序员,求职面试时时常会遇到需要编写一些基础的sql,编写sql这样做的目的主要是考验求职者的逻辑思维及编写sql基础能力。而row_n

大家好,欢迎来到IT知识分享网。

今天我们来看看大数据开发中row_number函数。

作为一名程序员,求职面试时时常会遇到需要编写一些基础的sql,编写sql这样做的目的主要是考验求职者的逻辑思维及编写sql基础能力。而row_number() 函数在面试中得到了不少面试官的青睐,有的面试官喜欢用这个知识点来考察应聘者。

我们来看看下面这道题目。

有张员工表tb_employee 表包含员工基本信息,每个员工有其对应的 user_id、user_name、salary和department_name

面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工。

这种情况我们可以尝试用row_number() 函数实现。

语法

row_number() over(partition by [要分组的列] order by [排序列])

row_number() 函数将select语句返回的每一行,从1开始编号,赋予其连续的序号。在查询时应用了一个排序标准后,只有通过序号才能够保证其顺序是一致的,当使用row_number() 函数时,也需要专门一列用于预先排序以便于进行编号。

partition by关键字是分析性函数的一部分,它和聚合函数不同的地方在于它能返回一个分组中的多条记录,而聚合函数一般只有一条反映统计值的记录,partition by用于给结果集分组, 如果没有指定那么它把整个结果集作为一个分组,分区函数一般与排名函数一起使用。

create table if not exists test.tb_employee( `user_id` int , `user_name` string , `salary` double , `department_name` string )row format delimited fields terminated by ',' stored as textfile;

面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工

新增数据

insert into test.tb_employee(user_id,user_name,salary,department_name) values(1,'李四',4000,'运营部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(2,'王五',5000,'运营部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(3,'张工',6000,'运营部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(4,'小爱',7000,'运营部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(5,'小张',3000,'行政部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(6,'小李',4000,'行政部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(7,'小王',5000,'行政部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(8,'小洪',6000,'行政部'); insert into test.tb_employee(user_id,user_name,salary,department_name) values(9,'小刘',7000,'行政部');

能看出每个部门工资第二高的员工分别为

–运营部编号为3的张工 薪资6000

–行政部编号为8的小洪 薪资6000

那么Sql如何编写,我们可以用row_number() 这样写。

select * from (select *, row_number() over(partition by department_name order by salary desc) as rn from test.tb_employee )as a where rn = 2;

运行结果:

面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工

关于row_number()函数,在大数据开发中,更多的是用来去重。可以根据分组,取rn=1最新的一条记录。

由于笔者知识及水平有限,文中错漏之处在所难免,如有不足之处,欢迎交流。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/47930.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信