叮~短期快速上岸大厂DS intern的经验和准备资料清单分享来咯!
叮~短期快速上岸大厂DS intern的经验和准备资料清单分享来咯!
篱笆资讯
叮~短期快速上岸大厂DS intern的经验和准备资料清单分享来咯!
Hi!这里是篱笆老师的上岸经验分享会!对于正在头痛如何上岸大厂DS intern,又愁于准备时间没有那么充分的小伙伴们,今天复习资料清单给你们打包带回家咯~
数据科学面试复习资料指南 数据科学工程(DS)的面试通常是对求职者技术实力的一次全面检验。具体地说,面试内容可能会包含但不限于以下几个方面:
Machine learning(包含ML case),statistics concept ,coding(包括SQL和算法),A/B testing(causal inference),Deep learning/NLP/CV/推荐系统等advanced topics(与简历project相关问题)
重要性排序大致是:ML>statistics concept>Coding>A/Btest=Deeplearning/NLP/CV
在准备面试时,要明确了解求职岗位重点考查的技术领域——是实验设计还是机器视觉和自然语言处理,这将对面试复习方向有显著指导作用。 为了帮助面试复习,下面为大家依次列举了一些资料和建议: 
·Machine learning
Machine learning的参考资料可以以AndrewNg的ML公开课的notes为主,链接:https://www.holehouse.org/mlclass/大家可以按专题一个一个过,比较常考的专题有:线性回归(考察基本功gradient descent regularization是常考内容)logistic regression(loss function是什么)SVM(模型推导)K-means(描述算法不同clustering的区别和use case)ensemble learning(bagging和boosting的区别decision tree的split criterion、算法实现等)除去各种模型之外model evaluation,data cleaning,mode lselection等也是常考内容。
通常面试官会提出实际业务问题进行考察,譬如: - 数据预处理与特征提取:比如在处理大量的用户数据时,如何有效过滤噪音并提取关键因素。 - 模型评估指标的选择:如何选择合适的评估指标以确保模型性能,例如分类模型中的准确率与F1分数。 - 模型上线后的实际表现评估:通过在线实验或用户调研观察推荐算法的变化。 - 面对不均衡数据时的指标选择:可能需要结合精确率和召回率来全面评估模型性能,等等
·Stats
统计我给大家推荐一个网站:Data Science for Beginners part2, 这个网站几乎囊括了数据分析的所有需要知识点,从最基础的统计概念到高级的机器学习方法,每一部分都以非常友好的方式详细解释,特别适合初学者。 在数据科学领域,想要深入,就必须牢牢把握住A/B test、标准误差、回归分析等基本概念。为了帮助大家更好地理解这些看似晦涩的统计知识,我还找到了Josh Starmer的YouTube频道Stat Quest with Josh Starmer,他以其幽默而生动的讲解手法,让数万名观众受益匪浅。 
·Coding
首先当然是语法基础学习,牢固理论知识,然后我们再刷题提升,这里呢给大家推荐几个网站:SQLLintern,Leetcode,SQLZOO,SQL Fiddle,大家可以自行选择哟~
接下来是算法题,在数据科学面试中,算法设计并不需要过于深入的技巧,大家可以在面试前从要面的公司的常考Leetcode题开始刷,一般刷30-50道题目就可以了;实际上,面试官通常期望候选人可以在面试中展现出逻辑清晰并且条理化的问题解决过程。因此,一般建议先从简单直接的方法入手然后在面试官逐步指导下深入提炼答案,最后千万不要遗漏了对方法时间复杂度的分析
·MLCase
深度学习面试准备指南面试季到了,你可能发现越来越多的公司在做面试的时候,喜欢问些有关机器学习(ML)的问题。他们可能会问你,比如支持向量机(SVM)知识点,或者是如何用正则化技术来避免过拟合。甚至,关于维度诅咒问题,可能会让你举例说明一下,损失函数选哪个,或者算法如何优化也是常见的面试题。如果你简历上有写过GAN、RNN这些高阶模型的经验,那你就准备好被追问清楚。 至于复习资料,这里给大家推荐一个很好的资料:ML Systems Design Interview Guide,作者是一个ML engineer,很好地将如何在面试中回答ML system design总计的很清楚,大家可以根据他的内容总结出合适自己的回答模版 
·A/B test
Cohen's d,significance,statistical power,P-value,two sample t-test,ANOVA还有Factorial designs这些基础概念都得牢牢掌握。A/B test入门可以上Udacity的AB testing网课,第一次听其实有很多地方会不理解,建议反复观看,加深理解!同时我还推荐YouTube博主Data Science Pro的AB test系列视频讲的简单易懂对于在high level层面理解AB test很有帮助。大致需要知道的topic有:AB test的完整流程和design sample size的计算AA test ,Mutiple A/B tests各种Novelty,primacy effect和network effect。 Netflix这类重视AB测试和实验设计的大公司往往会推荐细读《trustworthy online controlled experiments》,这本书讲的比较深入也针对各种AB test在实际应用中遇到的问题给出解决方案。至于如何提升你的AB测试技能到更高一级,那就得挖掘《Field Experiments: Design, Analysis, and Interpretation》这本书中关于指标不匹配和效应大小调节的深层知识。最后建议大家要对causal inference有所了解,如果你在面试时能够流利地解释干预分析(intervention analysis)及其如何通过matching adjusment process排除选择性偏差,你将极大提升通过面试的可能性

另外,掌握热门话题的知识及经验是获得理想职位的关键。尤其对于像深度学习、语义分析和内容推荐算法这类高级话题,你应该准备至少一个相关项目来在面试中展示你的能力。 市场上对深度学习工程师的需求非常大,对于一个开放职位,可能会有成百上千份简历在竞争,因此掌握深度学习能显著提高你的竞争力。语义分析和推荐算法工程师的年薪通常在10万至15万美元,而在某些热门公司和地区,薪资可能更高。 在准备面试时,至少在这些高级话题中展示一个你的项目,这有助于你在面试中更充分地与面试官交流。你不需要在每个领域都有深入的了解,但你至少应该掌握基本概念。以深度学习为例,你应该熟悉卷积神经网络(CNNs)。对于推荐算法,你应该明白什么是协同过滤。 重要的是,要能够轻松自如地讲述你的项目,就像聊天一样,向面试官展示你是如何应用这些技术处理实际问题并取得成果。充满信心并熟悉自己项目的细节,能够使面试官对你刮目相看,提升你在面试中的表现。 
好啦!今天关于DS intern快速上岸的准备资料和细节就在这里打包给大家啦~要是还有什么问题欢迎随时滴滴我们哟!

Arrow Up上一篇
Arrow Down下一篇
coffee 直连行业大牛导师,1v1模拟面试与求职指导
mentors
airplay 实战与求职精品课程
数据科学
软件工程
人工智能
金融商科
产品经理
产品设计
bookmark 2000+名企面试真题
amazon google tiktok microsoft meta