3个面试常见的SQL数据分析题（含数据和代码）

教育 2024-12-23 16:16 黑龙江

来源：数据森麟

在数据类岗位招聘过程中，经常会考察求职者的SQL能力，这里整理了3个面试常见的SQL数据分析题，按照由简单到复杂排序，一起来测试一下你掌握了么？

PS：以下SQL代码在MySQL8.0及其以上版本运行。

题目1

找出每个部门工资第二高的员工

现有一张公司员工信息表employee，表中包含如下4个字段。

employee_id（员工ID）：VARCHAR。
employee_name（员工姓名）：VARCHAR。
employee_salary（员工薪资）：INT。
department（员工所属部门ID）：VARCHAR。

employee表的数据如下表所示。

还有一张部门信息表department，表中包含如下两个字段。

department_id（部门ID）：VARCHAR。
department_name（部门名称）：VARCHAR。

department表的数据如下表所示。

数据导入的代码如下：

DROP TABLE IF EXISTS employee;CREATE TABLE employee(employee_id VARCHAR(8),employee_name VARCHAR(8),employee_salary INT(8),department VARCHAR(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOemployee (employee_id,employee_name,employee_salary,department) VALUE ('a001','Bob',7000,'b1')     ,('a002','Jack',9000,'b1')     ,('a003','Alice',8000,'b2')     ,('a004','Ben',5000,'b2')     ,('a005','Candy',4000,'b2')     ,('a006','Allen',5000,'b2')     ,('a007','Linda',10000,'b3');


DROP TABLE IF EXISTS department;CREATE TABLE department(department_id VARCHAR(8),department_name VARCHAR(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOdepartment (department_id,department_name) VALUE ('b1','Sales')     ,('b2','IT')     ,('b3','Product');

问题：查询每个部门薪资第二高的员工信息。

输出内容包括：

employee_id（员工ID）
employee_name（员工姓名）
employee_salary（员工薪资）
department_id（员工所属部门名称）

结果样例如下图所示。

可供参考的解题思路：使用窗口函数根据部门ID分组，在组内按照员工薪资降序排列并记为ranking，然后将该处理后的表和部门信息表进行内连接，从而把部门名称关联进来，最后在连接后的表上使用ranking=2作为薪资第二高的条件进行WHERE筛选，选择需要的列，即可得到结果。

涉及知识点：窗口函数、子查询、多表连接。

本题的SQL代码如下，供读者参考：

SELECT  a.employee_id       ,a.employee_name       ,a.employee_salary       ,b.department_idFROM(    SELECT  *           ,RANK() OVER (PARTITION BY department ORDER BY employee_salary DESC) AS ranking    FROM employee ) AS aINNER JOIN department AS bON a.department = b.department_idWHERE a.ranking = 2;

题目2

网站登录时间间隔统计

现有一张网站登录情况表login_info，该表记录了所有用户的网站登录信息，包含如下两个字段。

user_id（用户ID）：VARCHAR。
login_time（用户登录日期）：DATE。

login_info表的数据如下表所示。

数据导入的代码如下：

DROP TABLE IF EXISTS login_info;CREATE TABLE login_info(user_id VARCHAR(8),login_time DATE)ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOlogin_info (user_id,login_time) VALUE ('a001','2021-01-01'),('b001','2021-01-01'),('a001','2021-01-03'),('a001','2021-01-06'),('a001','2021-01-07'),('b001','2021-01-07'),('a001','2021-01-08'),('a001','2021-01-09'),('b001','2021-01-09'),('b001','2021-01-10'),('b001','2021-01-15'),('a001','2021-01-16'),('a001','2021-01-18'),('a001','2021-01-19'),('b001','2021-01-20'),('a001','2021-01-23');

问题：计算每个用户登录日期间隔小于5天的次数。

输出内容包括：

user_id（用户ID）
num（用户登录日期间隔小于5天的次数）

结果样例如下图所示。

可供参考的解题思路：本题考查LEAD()函数在处理时间间隔问题上的使用方法，观察内层的查询部分，使用LEAD()函数在原有的login_time字段的基础上创造一列新的时间字段（即该用户下一次登录日期），内层查询代码如下：

SELECT  user_id
       ,login_time
       ,LEAD(login_time,1) OVER (PARTITION BY user_id ORDER BY login_time) AS next_login_time
FROM login_info;

查询结果如下图所示。

在上图中可以发现，经过LEAD()函数处理后，数据会根据user_id字段分组后按照login_time字段排序。经过内层的处理后，只需在外层筛选出next_login_time与login_time字段的日期差小于5天的数据，即最终统计的目标数据，这里使用了TIMESTAMPDIFF(DAY, login_time, next_login_time)计算日期差，最后分组聚合统计不同user_id的记录个数，即每个用户登录日期间隔小于5天的次数。

涉及知识点：窗口函数、子查询、分组聚合、时间函数。

本题的SQL代码如下，供读者参考：

SELECT  a.user_id       ,COUNT(*) AS numFROM(    SELECT  user_id           ,login_time           ,LEAD(login_time,1) OVER (PARTITION BY user_id ORDER BY login_time) AS next_login_time    FROM login_info) AS aWHERE TIMESTAMPDIFF(DAY, login_time, next_login_time) < 5GROUP BY user_id;

题目3

用户购买渠道分析

现有一张用户购买信息表purchase_channel，该表记录了用户在某购物平台的购物信息，该购物平台具有网页端（web）和手机端（app）两种访问方式，表中包含如下4个字段。

user_id（用户ID）：VARCHAR。
channel（用户购买渠道）：VARCHAR。
purchase_date（购买日期）：DATE。
purchase_amount（购买金额）：INT。

purchase_channel表的数据如下表所示。

数据导入代码如下：

DROP TABLE IF EXISTS purchase_channel;CREATE TABLE purchase_channel(user_id VARCHAR(8),channel VARCHAR(8),purchase_date DATE,purchase_amount INT(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOpurchase_channel (user_id,channel,purchase_date,purchase_amount) VALUE ('a001','app','2021-03-14',200)     ,('a001','web','2021-03-14',100)     ,('a002','app','2021-03-14',400)     ,('a001','web','2021-03-15',3000)     ,('a002','app','2021-03-15',900)     ,('a003','app','2021-03-15',1000);

问题：查询每天仅使用手机端的用户、仅使用网页端的用户和同时使用网页端和手机端（both）的不同用户人数和总购物金额，并且即使某天某渠道没有用户的购买信息，也需要展示。

输出内容包括：

purchase_date（日期）

channel（购买渠道）

sum_amount（总购买金额）

total_users（不同用户人数）

结果样例如下图所示。

可供参考的解题思路：根据用户ID和日期进行分组，通过统计用户在各购买渠道购物的记录个数来判断某用户在某日期购物时采用的访问方式（web、app和both）。其中，web和app可以通过一个SELECT语句查询，both则可以通过另一个SELECT语句查询。将两部分使用UNION连接在一起，并将以上部分作为子查询内部，在子查询外部统计不同购买日期、购买渠道的总购买金额和总购买用户。

本部分SQL代码如下：

SELECT  purchase_date        ,channel        ,SUM(sum_amount) sum_amount        ,SUM(total_users) total_usersFROM(    SELECT  purchase_date            ,MIN(channel) channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date             ,user_id    HAVING COUNT(DISTINCT channel) = 1 UNION    SELECT  purchase_date            ,'both' channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date             ,user_id    HAVING COUNT(DISTINCT channel) > 1) cGROUP BY  purchase_date         ,channel;

本部分输出结果如下图所示。

上述部分似乎已经完成了本题要求，但仔细观察就会发现，题目要求即使某天某渠道没有用户的购买信息，也需要展示。而想要展示更全的信息，则考虑使用最全的信息（所有日期和3个渠道的笛卡尔积）与刚查询出的结果数据表进行LEFT JOIN连接，即可得到两张表根据日期和渠道进行连接的结果。

涉及知识点：UNION、分组聚合、数据去重。

本题的SQL代码如下，供读者参考：

SELECT  t1.purchase_date       ,t1.channel       ,t2.sum_amount       ,t2.total_usersFROM(    SELECT  DISTINCT a.purchase_date            ,b.channel    FROM purchase_channel a,     (        SELECT  "app" AS channel         UNION        SELECT  "web" AS channel         UNION        SELECT  "both" AS channel     ) b) t1LEFT JOIN(SELECTpurchase_date,channel,SUM(sum_amount) sum_amount,SUM(total_users) total_usersFROM (SELECT  purchase_date            ,MIN(channel) channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date,user_id    HAVING COUNT(DISTINCT channel) = 1    UNION    SELECT  purchase_date            ,'both' channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date,user_id    HAVING COUNT(DISTINCT channel) > 1)c GROUP BY purchase_date, channel) t2ON t1.purchase_date = t2.purchase_date AND t1.channel = t2.channel;

这些题目你做出了么？

爱数据福利大放送

《SQL学习路径导图》

《SQL数据分析常用语句》

扫描/识别下方二维码后

回复【SQL】即可领取

SQL学习路径思维导图部分内容

SQL数据分析常用语句概览

点击【阅读原文】测一测你适合做数据分析吗？

爱数据LoveData

国内领先数据分析社区，专注数据分析知识分享及求职辅导。爱数据作为一线数据厂商（帆软、观远、永洪等）培训合作伙伴，曾联合阿里、美团、滴滴等一线公司开展数据领域专题分享会。积累10年+行业经验，链接千人数据分析高端人脉，累计服务15w+用户。

最新文章

7个回归分析方法！数据分析师必须掌握

3个面试常见的SQL数据分析题（含数据和代码）

数据分析面试必看！某指标下降了，应该怎么办？

数据分析·业务面试班

7张图总结：SQL数据分析常用语句，一定要收藏！

深度好文：详解用线性回归模型做数据分析，数据分析师进阶必看!

数据分析·就业实战班，0基础高薪入职必备！

36个 Excel 函数！数据分析师常见必备法器！

数据分析前置工作指南 | 超详细版本

盘点数据分析必备的5大核心能力

全网最高性价比的「数据分析」课程，0基础到进阶！

数据清洗超详细概述！含实战演练！

数据分析面试题集锦(一)

数据分析面试题集锦(二)

4000字干货!「数据指标体系」搭建方法详解，赶紧收藏！

数据分析项目，这样做能满足运营的需求

10张图，详解「用户分层」怎么做！

月薪8K，15K，20K数据分析师简历，有哪些区别？

最硬核的数据领域课程，学完就能拿高薪！

一文读懂，数据分析综合评价方法——层次分析法！

分享6款超实用的抖音数据分析工具！助你成为运营高手！

超强干货—SQL语法大合集！看这一篇就够了！

9大「SQL面试题」常见知识点汇总！

5分钟「小红书」关键业务指标说明！数据分析师必看！

35岁后，互联网数据分析人的出路在哪里？

52个数据可视化图表鉴赏，收藏！

拒绝月薪18K的数据分析工作，为什么？

小白看过来！零基础转行数据分析攻略！

8步教你最有效的数据分析方法

如何在工作中快速提升数据分析能力？这五个习惯可以帮助到你！

10个顶级实用的Python库！

数据分析·就业实战班，0基础高薪入职必备！

数据分析规范总结，建议收藏！

10个顶级实用的Python库！

【逻辑思维】数据分析师必备

数据分析·就业实战班，0基础高薪入职必备！

涨薪：9种最常用数据分析方法！

Excel数据分析基础知识大盘点

数据分析师求职：薪资和行业，哪个更重要？

数据分析报告模板来啦！手把手教你做数据分析

转行跳槽，我如何做到成功入职字节跳动

数据分析·就业陪跑，0基础高薪入职必备！

史上最全SQL基础知识总结！

史上最全！数据分析进阶教程，看这一篇就够了！

MySQL导入SQL文件的三种方法！

8个必知必会的统计学基础概念，让你的数据分析更“精准”！

大厂SQL面试常考知识点总结，附真题！

干货|如何构建业务数据分析体系？

数据分析案例分享：1个完整的聚类分析怎么做？

微博商业分析师JD拆解，还有这些隐藏要求？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉