篱笆资讯
作为一名DA或者DS,最需要的是什么technical skill?
作为一名DA或者DS,日常工作中最需要的是什么technical skill?Eva老师今天来告诉你。
每个公司不同的组会对不同的技能有侧重,面试的问题也会基于他们需要的技能来设计。大致有以下几种:

01 data visualization 

这个部分需要我们能将数据可视化,最大的突出data insight。
举个简单的例子,如果你想表现数据的trend,就最好用line plot, 用时间做x轴你的数据做y轴;如果你想表现几个segment之间的差异,bar plot是一个更好的选择,因为bar plot可以快速比较高低来了解数据相对关系;具体的如何利用不同的图表来最大化信息的展示效果让读者快速理解,我们之后会专门做视频来分析。

1.webp 53.35 KB

02 data manipulation: SQL, Python, R

先给大家推荐几个必须会的package。

Python:numpy和pandas
R:dplyr,tidyr,tidyverse,还有data.table. data.table是用python的语法在r里写语句,所以如果会pandas的朋友学data.table会很容易。

你要学会用这几个语言完成以下几种技能,我们用sql语言来举例子:

选择: select,选出你想得到的数据
排序:sort
统计:sum,average,max,min, lag, lead
filter:where
group by:分组统计,有一个需要注意的是和having的区别。where是对group by之前的数据做选择。
having:是通过对分组后的average或者统计数据进行选择,再只保留满足条件的组。
join: 链接几张表,从每张表获得一些信息。
window function:包括partition by,并且要注意partition by和group by的区分和应用。

这些同样可以用excel完成,大家不要小看excel,在快速作出分析,查处data的问题方面excel要比r和python快很多,缺点就是需要的步骤量大,容易出错,难以replicate结果。

03 简单modeling

当你的数据有超过两个dimension,难以同时visualize,并且需要predict的时候可以使用。linear regression别看它很简单,但是工作中往往很多model就是linear regression,因为很容易interprete,implementation也很简单。

以上就是data analyst的tool box内容,每一个部分我们会继续做视频讲解小tips和容易面试中犯错误的地方,请关注我们的后续视频哦。如果你对留学、求职和创业感兴趣的话,欢迎关注篱笆老师哟。