3个面试常见的SQL数据分析题（含数据和代码）

教育 2024-11-11 16:00 黑龙江

来源：俊红的数据分析之路

在数据类岗位招聘过程中，经常会考察求职者的SQL能力，这里整理了3个面试常见的SQL数据分析题，按照由简单到复杂排序，一起来测试一下你掌握了么？

PS：以下SQL代码在MySQL8.0及其以上版本运行。

题目1

找出每个部门工资第二高的员工

现有一张公司员工信息表employee，表中包含如下4个字段。

employee_id（员工ID）：VARCHAR。
employee_name（员工姓名）：VARCHAR。
employee_salary（员工薪资）：INT。
department（员工所属部门ID）：VARCHAR。

employee表的数据如下表所示。

还有一张部门信息表department，表中包含如下两个字段。

department_id（部门ID）：VARCHAR。
department_name（部门名称）：VARCHAR。

department表的数据如下表所示。

数据导入的代码如下：

DROP TABLE IF EXISTS employee;CREATE TABLE employee(employee_id VARCHAR(8),employee_name VARCHAR(8),employee_salary INT(8),department VARCHAR(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOemployee (employee_id,employee_name,employee_salary,department) VALUE ('a001','Bob',7000,'b1')     ,('a002','Jack',9000,'b1')     ,('a003','Alice',8000,'b2')     ,('a004','Ben',5000,'b2')     ,('a005','Candy',4000,'b2')     ,('a006','Allen',5000,'b2')     ,('a007','Linda',10000,'b3');


DROP TABLE IF EXISTS department;CREATE TABLE department(department_id VARCHAR(8),department_name VARCHAR(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOdepartment (department_id,department_name) VALUE ('b1','Sales')     ,('b2','IT')     ,('b3','Product');

问题：查询每个部门薪资第二高的员工信息。

输出内容包括：

employee_id（员工ID）
employee_name（员工姓名）
employee_salary（员工薪资）
department_id（员工所属部门名称）

结果样例如下图所示。

可供参考的解题思路：使用窗口函数根据部门ID分组，在组内按照员工薪资降序排列并记为ranking，然后将该处理后的表和部门信息表进行内连接，从而把部门名称关联进来，最后在连接后的表上使用ranking=2作为薪资第二高的条件进行WHERE筛选，选择需要的列，即可得到结果。

涉及知识点：窗口函数、子查询、多表连接。

本题的SQL代码如下，供读者参考：

SELECT  a.employee_id       ,a.employee_name       ,a.employee_salary       ,b.department_idFROM(    SELECT  *           ,RANK() OVER (PARTITION BY department ORDER BY employee_salary DESC) AS ranking    FROM employee ) AS aINNER JOIN department AS bON a.department = b.department_idWHERE a.ranking = 2;

题目2

网站登录时间间隔统计

现有一张网站登录情况表login_info，该表记录了所有用户的网站登录信息，包含如下两个字段。

user_id（用户ID）：VARCHAR。
login_time（用户登录日期）：DATE。

login_info表的数据如下表所示。

数据导入的代码如下：

DROP TABLE IF EXISTS login_info;CREATE TABLE login_info(user_id VARCHAR(8),login_time DATE)ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOlogin_info (user_id,login_time) VALUE ('a001','2021-01-01'),('b001','2021-01-01'),('a001','2021-01-03'),('a001','2021-01-06'),('a001','2021-01-07'),('b001','2021-01-07'),('a001','2021-01-08'),('a001','2021-01-09'),('b001','2021-01-09'),('b001','2021-01-10'),('b001','2021-01-15'),('a001','2021-01-16'),('a001','2021-01-18'),('a001','2021-01-19'),('b001','2021-01-20'),('a001','2021-01-23');

问题：计算每个用户登录日期间隔小于5天的次数。

输出内容包括：

user_id（用户ID）
num（用户登录日期间隔小于5天的次数）

结果样例如下图所示。

可供参考的解题思路：本题考查LEAD()函数在处理时间间隔问题上的使用方法，观察内层的查询部分，使用LEAD()函数在原有的login_time字段的基础上创造一列新的时间字段（即该用户下一次登录日期），内层查询代码如下：

SELECT  user_id
       ,login_time
       ,LEAD(login_time,1) OVER (PARTITION BY user_id ORDER BY login_time) AS next_login_time
FROM login_info;

查询结果如下图所示。

在上图中可以发现，经过LEAD()函数处理后，数据会根据user_id字段分组后按照login_time字段排序。经过内层的处理后，只需在外层筛选出next_login_time与login_time字段的日期差小于5天的数据，即最终统计的目标数据，这里使用了TIMESTAMPDIFF(DAY, login_time, next_login_time)计算日期差，最后分组聚合统计不同user_id的记录个数，即每个用户登录日期间隔小于5天的次数。

涉及知识点：窗口函数、子查询、分组聚合、时间函数。

本题的SQL代码如下，供读者参考：

SELECT  a.user_id       ,COUNT(*) AS numFROM(    SELECT  user_id           ,login_time           ,LEAD(login_time,1) OVER (PARTITION BY user_id ORDER BY login_time) AS next_login_time    FROM login_info) AS aWHERE TIMESTAMPDIFF(DAY, login_time, next_login_time) < 5GROUP BY user_id;

题目3

用户购买渠道分析

现有一张用户购买信息表purchase_channel，该表记录了用户在某购物平台的购物信息，该购物平台具有网页端（web）和手机端（app）两种访问方式，表中包含如下4个字段。

user_id（用户ID）：VARCHAR。
channel（用户购买渠道）：VARCHAR。
purchase_date（购买日期）：DATE。
purchase_amount（购买金额）：INT。

purchase_channel表的数据如下表所示。

数据导入代码如下：

DROP TABLE IF EXISTS purchase_channel;CREATE TABLE purchase_channel(user_id VARCHAR(8),channel VARCHAR(8),purchase_date DATE,purchase_amount INT(8))ENGINE = InnoDBDEFAULT CHARSET = utf8;INSERT INTOpurchase_channel (user_id,channel,purchase_date,purchase_amount) VALUE ('a001','app','2021-03-14',200)     ,('a001','web','2021-03-14',100)     ,('a002','app','2021-03-14',400)     ,('a001','web','2021-03-15',3000)     ,('a002','app','2021-03-15',900)     ,('a003','app','2021-03-15',1000);

问题：查询每天仅使用手机端的用户、仅使用网页端的用户和同时使用网页端和手机端（both）的不同用户人数和总购物金额，并且即使某天某渠道没有用户的购买信息，也需要展示。

输出内容包括：

purchase_date（日期）

channel（购买渠道）

sum_amount（总购买金额）

total_users（不同用户人数）

结果样例如下图所示。

可供参考的解题思路：根据用户ID和日期进行分组，通过统计用户在各购买渠道购物的记录个数来判断某用户在某日期购物时采用的访问方式（web、app和both）。其中，web和app可以通过一个SELECT语句查询，both则可以通过另一个SELECT语句查询。将两部分使用UNION连接在一起，并将以上部分作为子查询内部，在子查询外部统计不同购买日期、购买渠道的总购买金额和总购买用户。

本部分SQL代码如下：

SELECT  purchase_date        ,channel        ,SUM(sum_amount) sum_amount        ,SUM(total_users) total_usersFROM(    SELECT  purchase_date            ,MIN(channel) channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date             ,user_id    HAVING COUNT(DISTINCT channel) = 1 UNION    SELECT  purchase_date            ,'both' channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date             ,user_id    HAVING COUNT(DISTINCT channel) > 1) cGROUP BY  purchase_date         ,channel;

本部分输出结果如下图所示。

上述部分似乎已经完成了本题要求，但仔细观察就会发现，题目要求即使某天某渠道没有用户的购买信息，也需要展示。而想要展示更全的信息，则考虑使用最全的信息（所有日期和3个渠道的笛卡尔积）与刚查询出的结果数据表进行LEFT JOIN连接，即可得到两张表根据日期和渠道进行连接的结果。

涉及知识点：UNION、分组聚合、数据去重。

本题的SQL代码如下，供读者参考：

SELECT  t1.purchase_date       ,t1.channel       ,t2.sum_amount       ,t2.total_usersFROM(    SELECT  DISTINCT a.purchase_date            ,b.channel    FROM purchase_channel a,     (        SELECT  "app" AS channel         UNION        SELECT  "web" AS channel         UNION        SELECT  "both" AS channel     ) b) t1LEFT JOIN(SELECTpurchase_date,channel,SUM(sum_amount) sum_amount,SUM(total_users) total_usersFROM (SELECT  purchase_date            ,MIN(channel) channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date,user_id    HAVING COUNT(DISTINCT channel) = 1    UNION    SELECT  purchase_date            ,'both' channel            ,SUM(purchase_amount) sum_amount            ,COUNT(DISTINCT user_id) total_users    FROM purchase_channel    GROUP BY  purchase_date,user_id    HAVING COUNT(DISTINCT channel) > 1)c GROUP BY purchase_date, channel) t2ON t1.purchase_date = t2.purchase_date AND t1.channel = t2.channel;

这些题目你做出了么？

-END-

SQL题库

Excel函数/可视化/数据透视表

200+Python实战案例

......

想了解更多数据分析技能知识

欢迎扫描下方二维码加入

【爱数据技能交流群】

与5W+小伙伴们一起学习

还能定期领取资料哦~

http://mp.weixin.qq.com/s?__biz=MjM5MTI3MzUwMA==&mid=2650173582&idx=3&sn=7e2f600d0b7add97376f9e00dd4f0007

爱数据LoveData

国内领先数据分析社区，专注数据分析知识分享及求职辅导。爱数据作为一线数据厂商（帆软、观远、永洪等）培训合作伙伴，曾联合阿里、美团、滴滴等一线公司开展数据领域专题分享会。积累10年+行业经验，链接千人数据分析高端人脉，累计服务15w+用户。

最新文章

没Offer？就是「项目问题」！给你解决！

实操案例讲解！手把手教你搭建RFM客户价值分析模型（附实战代码）

数据分析5大软件「优势PK」：Python、Excel、R、SAS、SPSS你最爱哪个？

搞定统计学必知：P值、T检验、卡方检验、假设检验……

一文看懂：搭建活动分析体系

数据分析·就业实战班，0基础高薪入职必备！

学数据分析要懂哪些统计学知识？这份思维导图请收好！

知乎上40个有趣回复，很精辟！

3个面试常见的SQL数据分析题（含数据和代码）

数据分析·就业实战班，0基础高薪入职必备！

一文搞懂用户画像，数据分析师必看

统计学！！！8项数据分析师必学知识点！（附赠统计学大礼包）

入职数据分析解决方案！

8步教你最有效的<数据分析方法>

数据分析·就业实战班·入职必备！

数据运营入门，只需掌握这四个数据分析方法

如何撰写一份优秀的数据分析报告？记住这些关键点！

如何学习数据分析？7步快速搞定！

2000字实录！微博商业分析面经整理！收藏起来！

年底优质「数据分析报告」写作指南，这些错误千万不要犯！

小白入职数据分析攻略，你的所有问题都能解决！

拼多多已上岸面经分享|24个岗位面试题及答案解析

36个顶级数据分析方法与模型，高效分析必备！

收藏：20张数据分析学习思维导图大全，有了它学习思路超清晰！

1.8W岗位不如1.5W？选公司需谨慎，尤其是数据分析师！

【大厂面试】100道华为数据分析面试题（附答案）！

手把手教你数据分析方法论和业务实战——用户画像篇

全网最高性价比的「数据分析」课程，0基础→进阶！

数据分析必备——漏斗分析模型

详解数据分析的 9 个经典问题

【行业前沿】数据岗位有哪些？你不知道的职业机会和发展空间

万字总结，行业分析到底应该怎么做！

面试没有项目怎么办？？？？↘

人人都必须学会的 Excel 三大技能

干货| 这篇电商数据分析案例一定要看！

48道数据分析师高频面试题

数据分析·就业实战班，0基础高薪入职必备！

判断客户价值，用好这3个数据分析模型就足够了！

Excel常用电子表格公式大全！【汇总篇】

Python实现「数据可视化」的3大步骤，保姆级讲解！

4000字详解，数据标签体系构建方法

Excel数据分析的4大神技！高效处理数据！

万字长文——数据分析深度理解，全是方法论及经验，不看真的就亏了！

分享一个完整的数据分析流程

数据分析面试：常见问题回答战略

掌握这20个 SQL 优化方法，你就无敌了！

Python可视化利器：8个流行工具包，总有一款适合你！

一份优秀的数据分析报告，8步就能搞定！

微博商业分析师JD拆解，还有这些隐藏要求？

这10个统计学问题数据分析师可一定要知道！（附资源）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉