Linkedin数据分析面试真题

职位分类
全部
数据科学
数据分析
计算机科学
人工智能
产品经理
BQ
面试题
全部(19)
Coding(3)
SQL(2)
Stats(3)
ML basics(0)
Product Case(3)
高频题(0)
全部(19)
Coding(3)
SQL(2)
Stats(3)
ML basics(0)
Product Case(3)
高频题(0)
1.SQL aggregation funciton
2.排列组合
3.Sample data ml building
4.SQL query
5.Multimodal distribution
6.Distirbution
7.Business travel question
8.排列组合问题
9.SQL window function
10.CDF and probability
11.AB Test
12.AB Test - novelty effect
13.AB Test
14.P-value expaination
15.Job application rate changes
16.AB Test
17.SQL aggregation functions
18.SQL query
19.member ld
1. SQL aggregation funciton
 给一张Table: name | country | salary, 算每个国家的salary总数
2. 排列组合
五个窗口排队
3. Sample data ml building
用一个非常general的sample data来讲一下建模的过程
4. SQL query
Video_posts
 
 post_date| memberid| video_length
 
 2018-12-18 123 95
 
 2018-12-18 576 65
 
 2018-12-19 576 22
 
 2018-12-19 123 20
 
 2018-12-20 260 100
 
 2018-12-21 450 150
 
 2018-12-22 123 200
 
 members
 
 memberid| country| join_date
 
 123 usa 2018-11-03
 
 576 uk 2016-05-15
 
 807 aus 2012-04-12
 
 260 uk 2017-12-01
 
 450 india 2019-01-12
 
 a) How many members post their first video on the same day they've joined the platform?(SQL)
 
 b) We hypothesize that our video posting features might not be catching on as well internationally as they do in the US. Do US members upload more videos than non-US members?(SQL&PYTHON)
5. Multimodal distribution
Q1. 画出美国男人身高的分布
 
 Q2. 画出美国女人身高的分布
 
 Q3. 把男人女人合并在一起,分布是怎样 (后经查询考察的是Multimodal distribution)
6. Distirbution
Q1. 每个人在LI都有好友(比如a有100个好友,b有200个好友,c有500个好友),画出number of connections的分布图 (右偏)
 
 Q2. 问了下mean的值range,给出原因
 
 Q3. mean, median, mode比大小,并给出原因
7. Business travel question
Business traveler, 为什么要identify, 如何identify,collect哪些data,我说了IP就问了VPN怎么处理,还有mobile IP不准的情况,还问了在covid情况下如何判断是自己wf anywhere还是business travel,比之前看到的面经稍微多几个问题
8. 排列组合问题
两个银行branch,5个柜台队伍分开排,跟一个队动态分布到五个柜台,选哪个
9. SQL window function
找出每个洲人口面积最大的国家,要用window function
10. CDF and probability
Simulation, inverse CDF simulation. 具体是:有一个M sided die, roll到每一面有对应的probability,比如对于5-sided die: [0.1, 0.2, 0.3, 0.2, 0.2] (probability sum = 1)
 
 写算法实现,产生roll这个die N次的一个list,比如roll 7次,有可能产生的一列结果。
11. AB Test
如果search组做了新的搜索结果排序算法, 你负责测试这个feature, 你会怎么设计这个A/B测试, 选取哪些metrics衡量这个feature是否改善了用户体验?
12. AB Test - novelty effect
如果新feature有novelty effect, 新feature短暂上线带来显著的用户增长,两周后用户数量下降,你怎么分析新feature是否带来了用户增长呢?
13. AB Test
如果测试新feature的结果是:experiment group 7% click-through-rate, control group 5% click-through-rate, 你会怎么做决定?
14. P-value expaination
你怎么向外行(例子:产品经理)解释significance level? 比如,当实验样本数偏大,p-value 会偏小呢?
15. Job application rate changes
Job application decrease 5% , how to investigate.
16. AB Test
Marketing team想要对email做出一些change,一是title,二是content,问去看哪些metrics,怎么ab test,一共多少组,sample size怎么算,什么test方法。
17. SQL aggregation functions
JOB_ID, MEMBER_ID, job_posting_date
 
 1001, 1, 2017-04-14
 
 1002, 1, 2017-08-14
 
 1003, 2, 2017-05-31
 
 1004, 3, 2016-08-23
 
 1005, 3, 2017-04-28
 
 1006, 3, 2017-05-23
 
 1007, 3, 2017-07-08
 
 New job posting: Job posting by a member who's never posted a job on LinkedIn platform before
 
 Repeat job posting: Job posting by member who has posted a job on LinkedIn platform before
 
 1. 求number of new job posts
 
 2. 求number of repeat job posts
 
 3. 如果一个人超过180天没发帖,180天后发的贴是reactivated posts,求number of reactivated posts
18. SQL query
 -- table t1
 
 -- date product_name quantity_sold
 
 -- 1/1/2013 A 100
 
 -- 1/1/2013 B 200
 
 -- 1/1/2013 C 300
 
 -- 1/2/2013 A 101
 
 -- 1/2/2013 C 301
 
 -- 1/3/2013 A 102
 
 -- 1/3/2013 B 202
 
 -- 1/3/2013 C 302
 
 -- DESIRED OUTPUT
 
 -- date qty_prod_a qty_prod_b qty_prod_c
 
 -- 1/1/2013 100 200 300
 
 -- 1/2/2013 101 0 301
 
 -- 1/3/2013 102 202 302
 
 Q4. data manipulation,给input求output
19. member ld
 | |datetime|memberld| pageld|
 
 |2019-01-15 08:00:00| 100| home|
 |2019-01-15 08:00:01| 100l home
 |2019-01-15 08:00:05| 100|network|
 |2019-01-15 08:00:16| 100| jobsl
 |2019-01-15 08:00:20| 100| home|
 |2019-01-15 08:00:00| 200| home|
 |2019-01-15 08:00:05| 200| home|
 |2019-01-15 08:00:12| 200|network|
 |2019-01-15 08:00:20| 200| jobs|
 |2019-01-15 08:00:25| 200|network|
 |2019-01-15 08:00:00| 300| home|
 |2019-01-15 08:00:04| 300|network|
 |2019-01-15 08:00:10| 300| home|
 |2019-01-15 08:00:10| 300| home|
 |2019-01-15 08:00:20| 300| jobs|
 +-------------------+------------+---------------+
 
 Q1:同memberld在一秒内登录两次以上home page,除了第一次外都看做fraud,return fraud records.
 Q2:去掉fraud之后,member最喜欢在访问home之后访问什么pageld,return pageld.