转行/入门数据科学,这些技能必不可少
转行/入门数据科学,这些技能必不可少
篱笆资讯
转行/入门数据科学,这些技能必不可少
01

 知识储备篇

1.Stats + Linear Algebra

想要入门数据科学,那么统计和线性代数简直是必不可少的两门基础课程。统计的重要性不言而喻,不管是想走偏analytical的方向,还是machine learning,stats的地位都不可撼动。至于linear algebra,我记得在入学前曾经听学长说过一句话,“stats决定了你(data science生涯)的下限,而linear algebra决定了你的上限”。

大家所知道的machine learning/deep learning,这些听起来就非常fancy的领域,其实linear algebra是最重要的基础。

下面推荐几本好用的教材:

?Hogg, Robert V. and Elliot A. Tanis. Probability and Statistical Inference, 9th edition.

?Ghahramani, Saeed. Fundamentals of Probability, with Stochastic Processes, 3rd edition.

?Howard Anton and Chris Rorres. Elementary Linear Algebra, 11th edition.

2.A/B Testing

最简单的应用大概就是,大家刷ins的时候都会刷到投放的广告,假设现在ins每隔8个posts会投放一个广告,那如果我propose每隔5个posts投放广告,会对revenue产生怎样的影响呢?这就可以用到A/B Testing啦。

A/B Testing的基础就是统计,所以对这方面感兴趣的小伙伴一定要好好学习统计啦。我对A/B Testing的学习全部源自于我们program老师自己编写的教材,所以不方便share,但是曾经看到过大家诚恳推荐Udacity的A/B Testing课程。感兴趣的小伙伴可以去看一下。

3.Machine Learning

Machine Learning的火爆程度,哪怕不是做tech的小伙伴,也应该都听得耳朵出茧子了吧。入门machine learning的第一步,大家可以先把statistics学起来了!当然如果之后想要进一步钻研deep learning,背后还有更庞大的数学知识需要掌握。

不过Twitter上流行这么一句话,“When you’re fundraising, it’s AI. When you’re hiring, it’s ML. When you’re implementing, it’s logistic regression.” 也正说明了,其实好多时候工业界的implementation和理论研究也相差很多。

02

 推荐课程篇

 ? Andrew Ng在Coursera上的Machine Learning课程

这大概是想要学习Machine Learning的朋友都会想去看的一门课啦。课程内容比较深入浅出,讲解得也比较细致,只是课后练习可能并没有必要跟着做,因为所用的技术已经比较过时了。

?apachecn/AiLearning

喜欢看中文版的小伙伴可以去搜这个github,里面的内容涵盖了machine learning, deep learning, 甚至还有natural language processing,非常齐全了。
 
?Kaggle

Kaggle是一个成立于2010年的进行数据发掘和预测竞赛的在线平台。Machine Learning初学者去到Kaggle很容易迷失方向,但是当你有一定了解之后,Kaggle就是个宝藏啦。

先排除比赛名次什么的不说,光是很多有趣的dataset就能让我们有很多发挥的余地。对于很多已经结束的比赛,我们还是可以继续做,比赛排名靠前/大牛们都喜欢发一些自己的notebook或者code来分享自己整个modeling的过程,从中可以学习到很多,建议有兴趣的小伙伴一定要去看看。

第一步从哪里开始呢?当然就是最著名的Titanic Machine Learning Competition啦!可以先跟着别人的notebook走一遍,再根据自己的想法添加features,选择model。不得不说有时候看着自己的model performance很好,真的会很有成就感~

coffee 直连行业大牛导师,1v1模拟面试与求职指导
mentors
airplay 实战与求职精品课程
数据科学
软件工程
人工智能
金融商科
产品经理
产品设计
bookmark 2000+名企面试真题
amazon google tiktok microsoft meta