一方面,就两门语言本身而言,python的适用性越来越好。基于python, 现在有数不胜数的开发者设计了方便好用的数据分析包,网上的学习资料也越来越丰富,非常便于快速学习和上手。
R的使用其实在统计学领域非常常见,并且R的很多功能都是专门针对数据统计开发的,如果做统计学研究,非常便利。但如果不是做统计学研究而更多是应用一些统计学概念, 那么python其实足够覆盖日常使用。
基本上R有的, python都有, 甚至python中的一些安装包能够适配R语言, 让R语言可以在python中运行。
另一方面,现在的很多科技公司,其实都对python的使用更加友好。无论是硅谷科技公司亦或是国内的互联网公司,内部都会丫各种适配python的工具。并且由于数据分析所需要涉及到的数据量的日益扩大, python能够更方便快捷的和各类大数据工具结合在一起。
因此python在科技公司中最受欢迎,基本上是99%的数据分析师或数据科学家会使用的代码语言。
(1)推荐学习顺序
按照"读写文件;数据类型;条件、循环语句;常用函数;常用package"这样的顺序来学习, 就能比较有体系地入门Python知识了,起码看代码能大致看懂了
(2)Python常用包
01
NumPy
NumPy是一个针对数据分析的Python库, 它支持多维数组°和矩阵, 是Python中最基础的库之一。其实它本身并没有提供多么高级的数据结构和分析功能,但它是很多高级工具(如pandas)构建的基础
02
Pandas
Pandas库提供了快速、简捷、易懂的数据结构,简化了数据整理步骤,绝大多数的数据预处理与数据分析都可以完成。大家可以简化认为Pandas是Python版本的excel, 但是当你熟练记住代码使用后, 它会比excel操作方便太多
03
Sci kit-Learn(Sk learn)
Sk learn主要是用于机器学习, 所以sk learn的模块也都是围绕机器学习算法的,可以说是一个完善的机器学习工具箱。你在里面可以完成分类、回归、聚类°、数据降维、模型选择和数据预处理等任务;几乎常见的机器学习°模型也都可直接调用:比如支持向量机、随机森林、k-means等。
04
Matplotlib
Matplotlib是一个用于科学计算绘图的库。可以帮助你完成描述性分析和数据可视化。你可以用它来进行快速绘制线形图、饼状图°直方图等。
05
Seaborn
Seaborn主要是基于Matplotlib构建的, 进行了更高级的API封装, 可以让用户把自己常用到的可视化绘图过程进行函数封装,形成的一个制图的"快捷方式"
希望以上分享对你有所帮助。