<iframe src="https://www.googletagmanager.com/ns.html?id=GTM-KVGHS6G" height="0" width="0" style="display:none;visibility:hidden"></iframe>
Google求职:怎么培养数据分析的能力?
Google求职:怎么培养数据分析的能力?
篱笆资讯
Google求职:怎么培养数据分析的能力?
讲一个实操性强一些的学习思路。
 
数据分析的学习,包含两大块儿,硬技能和软技能。所谓硬技能,是那种通过短时间内大量的练习就可以快速掌握,可以迅速地应对各类面试、甚至是实际的工作的一类技能,硬技能的培养更强调熟能生巧。而软技能更多侧重思维逻辑层面,也即如何利用硬技能,解决实际的业务问题,产出可落地insights。
 
(1)基础硬技能
SQL
这是对于数据分析师来说最最基础的能力。很多情况下数据并没有被准备成你可以直接拿来搭建看板或做分析的状态,更多情况下你需要自己用sql进行一定的收集、整合,从而达到你认为的可以进一步做看板或做分析的理想状态。因此在数据分析师的日常工作中,sql成了最为重要的工具。基本上,sql中90%以上的取数逻辑,你都会在实际工作中遇到,比如对各种数据做加减乘除的聚合运算,把不同的表和数据合并到一起等。也正因为此,在数据分析师的面试过程中,sql被测试的频率最高。
 
关于sql的学习,这里帮大家总结了三种途径:udemy等课程网站上的sql基础课程、leetcode上所有的sql题目和日常面经中的题目。关于课程网站上的sql课程,大家不用特别在意到底是哪个网站,这些基础课程其实大同小异,最终的目的只是希望了解sql相关的语语句,获得一些感知。更重要的其实是在leetcode上刷题和收集其他人面经中的sql问题,不断地训练、不断地思考解决问题的逻辑,最终就能熟练地掌握sql。
 
Python
在这里,我就不再给大家推荐spss、r等其他统计学软件,原因是在实际的业务中,已经越来越少公司使用spss或r等老牌统计软件作为分析工具,Python几乎成了最通用的工具。Python的优势,在于基础的数据清洗方面,一些Python中基础的package会比sql处理数据更为灵活,比如想去掉一些数据中的空值、异常值,Python中的numpy和pandas两个包就可以帮助我们快速解决这个问题 。同时Python还可以支持对各种不同数据源的数据进行收集,比如你的数据在csv或者excel里,都可以利用Python实现快速导入、整合及分析,并且Python还可以支持更为灵活而多样的数据可视化。
 
关于Python的学习,同样需要我们了解Python的基础操作,比如最基本的,numpy和pandas这两个功能包的使用,大家同样可以选择udemy上的Python基础课程进行学习。在了解了基础的信息后,大家可以选择leetcode上easy和medium级别的题目进行强化训练,这足以帮助大家通过面试的考验。
 
AB测试
除了sql和Python,另外一种重要的硬技能是ab实验。
 
什么是ab实验呢,简单来讲,对于一组实验对象,你给他们施加一个干扰,对于另外一组很相似的对象,不做任何处理。经过一段时间的观测,可能你就会发现施加了干扰的那一组的一些行为和另外一组会有差异,再经过一些更精细地计算,你就能知道你的干扰是不是真的起了作用。ab实验在实际业务中的应用非常广泛,它是一个产品优化甚至是一个功能是否应该上线的重要依据之一。
 
关于ab实验。其实ab实验是非常非常需要你上手亲自做的一种技能,但考虑到现实中大部分的同学其实没有机会接触到ab实验,因此我推荐大家去学习udacity上的那门ab实验课,链接如下
 
是谷歌几位数据科学家做的,非常有代表性。大家只要集中精力学完这一门课,把里面涉及到的每一个统计学的小知识理解透彻,并学会如何去设计实验、分析结果,同时不断练习口述实验设计过程和结果分析过程。
 
以上呢,是关于基础的硬技能,是希望大家尽可能全部掌握的技能,接下来和大家介绍的,是更为进阶的硬技能,大家如果学有余力或者很感兴趣,也强烈推荐大家进行一定的了解和学习
 
(2)进阶硬技能
这个能力我们可以称它为python for data science以及机器学习:之所以说它们是进阶能力,是因为在常规的数据分析面试甚至工作中,其实很少用到机器学习的相关知识,但总有那么一些数据分析的岗位,它希望你最好拥有这样的知识,来应对更为复杂的业务问题。因此在这里建议大家,在完善了自己的基础能力后,尽可能挑战自己学习更进阶的知识。其实这些知识虽然被称为“进阶”,学起来也并不困难。比如机器学习,coursera上吴恩达的machine learning就是非常棒的入门课
 
这门课同时也有中文版供大家选择,知乎上有相当多的大神都曾经引用过吴恩达的机器学习知识。
 
在了解了机器学习的基础知识后,最有效的巩固方式就是上手做项目,也就是刚刚提到的python for data science。这里给大家推荐两个网站,国外的kaggle
 
Kaggle: Your Machine Learning and Data Science Community
和阿里的天池
 
天池大数据众智平台-阿里云天池
​tianchi.aliyun.com/
 
这两个网站上都有很多竞赛或是小项目,同时为大家准备好了数据。
 
(3)软技能
如果说硬技能是“术”,那软技能就是“道”,是数据分析的“心法”。更直白一些,就是所谓的产品感或业务感,英文中的product sense或business sense。在实际的工作中,通过自己对业务的感知,结合数据,建立一套解决问题的框架并最终产出有价值、可落地的结论和方案。这种“软”技能可能并不像硬技能一样,可以短时间内快速掌握,它更倾向于通过长期的思考、工作经验的积累和不断地提炼升华培养起来的。
 
这种产品感或业务感与你使用什么工具关系不大,更重要的是你如何利用数据去思考、去解决实际问题。而站在更高的层面上讲,这种能力不是说,我告诉你,帮我做这样一个看板、取出这样一些数据,然后你用sql、python,用这些硬技能把别人想要的东西拿到(我相信很多人对数据分析师的认知都是如此)。而是我们主动去思考,为什么我需要做这样一个看板去监控,它给我带来的收益是什么?遇到一个需要解决的问题,我应该从哪个角度去切入,怎么去结合数据,最终给出一个解决方案。
 
这种软技能的培养,对于曾经在一线工作过的业务同学来说,相对容易,大家在学会了基础的硬技能后,重新回头去思考自己曾经面对过的问题,试着从数据的角度试试,能不能给出一个更合理的方案。有了更合理的方案后,再深入想想,如果真的现在需要自己实操起来,需要哪些数据,sql怎么操作,python怎么操作,需要怎么样做ab实验。通过这种不断地训练,慢慢地就能内化成自己的一套运用数据解决实际问题的思考框架。同时也非常推荐大家去搜集数据分析面经上的题目,不断尝试模拟面试,训练自己的思维能力
 
不过这里还是要给大家推荐一些书,便于大家加深对数据分析和实际业务之间关系的理解。比如《增长黑客》、《产品思维30讲》、《运营之光》、《精益数据分析》(英文:Lean Data Analytics)
 
《增长黑客》:
 
增长黑客 (豆瓣)
​book.douban.com/subject/26541801/
 
《产品思维30讲》:
 
得到精品课《梁宁·产品思维30讲》课程学习笔记(内含PPT), 站长资讯平台
 
《运营之光》:
 
运营之光 (豆瓣)
​book.douban.com/subject/26873486/
 
《精益数据分析》:
 
精益数据分析 (豆瓣)
​book.douban.com/subject/26278639/
 
到目前为止,就差不多把很基础的数据分析入门需要的一些知识介绍给了大家。最后也在这里向大家自荐一下,篱笆老师可以提供非常系统的数据分析学习课程,可以和你一起从零开始学习SQL、Python、AB实验等技能,并配合着各种实战项目,让你不仅学到理论,更能体会实际的应用。同时我们还可以提供各种模拟面试,帮你从容不迫地应对各种数据分析相关的面试问题。而另一个向大家推荐篱笆老师的目的,也是体会到了自学过程的痛苦和持续坚持的不易,所以如果能有人帮你一起学习,相信会事半功倍!
coffee 直连行业大牛导师,1v1模拟面试与求职指导
mentors
airplay 实战与求职精品课程
数据科学
软件工程
人工智能
金融商科
产品经理
产品设计
bookmark 2000+名企面试真题
amazon google tiktok microsoft meta