目前数据分析行业大火,相信很多小伙伴都想去这一行业试试水。想要成功进入数据分析行业,就必须得通过数据分析面试,面试应该准备什么,怎么准备,各位小伙伴都知道吗?本文将从以下七个方面进行阐述:
01.Sql部分
•数据倾斜的理解及常见倾斜场景的优化。
•多表之间连接的查询。
•窗口函数的使用,如row_number,lead,lag等等
•连续登录问题。
•留存计算问题(新用户留存,活跃用户留存等等)。
•排名靠前的客户信息获取。
•其他一些需要使用到窗口函数的问题等等。
02.Python部分
•python数据结类型有哪些。
•range和xrange的区别。
•可变对象和不可变对象。
•深拷贝和浅拷贝。
•装饰器相关。
•numpy中的切片相关。
•list和dataframe的区别。
•列表转字典相关。
•生成器和可迭代对象的理解。
•sort和sorted排序的区别。
•正则表达式相关。
•leetcode在线code等。
03.报表类工具
比如Tableau和finebi等类似bi工具的使用,会被提及到。
04.统计知识相关
•线性回归和逻辑回归的理解,差异和共性:从假设到参数求解,再到实际的应用场景要有所理解,包括各自的缺点及改进。
•过拟合和欠拟合如何避免。
•常见聚类算法,kmeans,dbscan,gmm等等,主要在于方法的理解和实践使用上。
•传统knn计算量过大效率低怎么优化(kd树)。
•决策中如何理解,尤其是id3,c4.5,gini如何进行特征选择。
•决策树父节点和子节点的信息熵大小。
•决策树的过拟合问题。
•随机森林的理解。
•gbdt和xgb的差异理解。
•假设检验涉及到的统计知识的理解。
•置信区间的理解。
05.AB测试相关
•ab的理解。
•ab方案的设计。
•如何验证分流是ok的。
•如何证明ab效果是可信的。
•第一类错误和第二类错误的理解。
•ab效果评估的思维框架。
•关注指标正向和负向对应的场景下该如何处理。
•测试指标显著/不显著如何解释和处理。
•流量的测算,测试周期等相关问题等。
06.思维方法相关
•指标体系如何搭建。
一般是自己说对指标体系搭建的理解;还有就是给个场景给你,让你搭建指标体系,考察的是搭建指标体系的框架和思路。
•用户活跃度提升等类似的相关的场景分析题目。
举一个自己常用的app,说出自己觉得做的不好的功能,需要如何改进,如何去验证改进的效果等(字节爱问)。
•指标异常时怎么分析,定位原因?
•给出一些业务场景,让你设计考核所需的关键指标(类似北极星指标)。
•产品不同阶段时关注点是什么?
•面试岗位业务场景的常见指标,比如电商等等。用户流失预警怎么做,如何找出关键的业务因素。
•app中的推荐上商家,怎么选择,从数据分析角度出发来给方案。
07.软性问题
•性格的优缺点。
•工作中遇到的困难,如何解决的。
•工作中的合作模式。
•个人职业规划。
•你有什么问题要问的(建议有必要思考下)。
•薪酬期望。
以上就是数据分析会考到的一些问题了,希望可以帮助到大家!