我要报名
适用人群
主要针对商业分析、数据分析,数据科学等申请方向,或者对数据感兴趣的学员。通过完成业界典型的行为分析和因果推断项目,学员能够了解到最前沿的科技公司怎么运用因果推断,并熟练掌握因果推断分析和建立模型所需要的技巧方法和思维方式,极大提升自己的申请和求职背景
你将收获
硅谷数据科学项目证明
Linkedin导师亲笔推荐信
产品数据决策的实战锻炼
你将学习的技能
商业分析
数据分析
数据科学
课题介绍
在现代科技公司中,进行用户行为分析并运用 A/B test 来得到事物的因果关系来推动产品决策变得至关重要且已经非常普遍。但是,并非所有的因果关系都能够很好的通过 A/B test 的来解决。比如说,有些时候我们需要了解用户本身自发的行为对于downstream metrics的影响,往往无法通过randomization实现。或者是有10+ features需要上线,怎么决定先上哪个feature呢?在面对这些问题时,通常团队都依赖数据科学团队运用causal inference(因果推断)的技能来解决. 因此, 学会这项技能也成了数据科学家的必修课, 并且将大大提高你作为数据科学家能够展现的imapct。
课程大纲
项目总时长为四周,第一周导师与学生线上沟通,明确项目流程和课题理解,在最短的时间内让学生明白什么是causal inference,以及有哪些causal inference 常用的手段(DR, Panel data, BSTS, IV etc.)。第二,三周 case project 训练,包括使用python/R 完成数据清理,特征工程,模型构建选择和评估。第四周则着重培养学生解读模型result的能力以及如何把结果呈现好的能力(storytelling), 导师将全程辅导并回答学生的问题,确保学生对于因果推断重要性的理解以及独立在公司推动因果推动项目的能力.
1
What is causal inference and why it’s important?
考察:Q&A
授课1.5小时; 学习2小时
2
Industry best practices for doing causal
考察:Homework
授课2小时; 学习2小时
3
Python/R 101 (Getting familiar with tooling and package for causal)
考察:Coding Homework
授课2小时; 学习4小时
4
Data Cleaning, ETL, feature engineering, model construction, evaluation and iteration
考察:Understanding of causal approach and correctness of result
授课3小时; 学习8小时
5
Result interpretation and conclusion. Summarize the entire project and present to stakeholders
考察:Interprets model results and construct presentation logically
授课2小时; 学习6小时
6
Questions on DS in tech, career advices etc.
考察:Q&A on any DS industry/career related questions
授课1.5小时; 学习1小时
课程导师
Ivan

经历

Linkedin 数据科学家(美国)
美国保险巨头BCBS data consultant
云歌智能数据科学实习
Purdue CLAN Lab RA
多次数据竞赛获奖

教育

普渡大学数学/统计学专业本科
西北大学分析专业硕士