最近几年,用R, Python的人越来越多,于是出现很多用哪个软件做数据分析的争议。但对于数据分析师来说,数据分析是在有限时间内,用最可行的方式拿到最有用的结果。所以对数据分析师而言,不应该仅仅局限于任何一个单一的分析软件,而应该是各取所长,根据问题的形式而灵活选取或者结合。
对于R软件来说,R的数据分析优势是众所周知的,而数据分析师纠结使用R还是Python主要基于以下几个原因:
1. 运算速度:
针对于程序速度的比较,有众多的测试方法和不同的结果,大体上从基本运算速度来说,Python是快于R的,但是,如果你愿意多花些心思更好的利用矢量化编程进行计算,那么无论从程序的长度来是速度上,都会使R的表现有显著性提高,对大部分运算,R的速度是可以和python接近的。
2. 全面性:
从这点来说, Python是强于R的。无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python都有着明显优势。但R有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。
总的来说Python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python都有着明显优势。
而R是在统计方面比较突出。
所以,对于本地文件直接的数据分析,R相对于Python来说,分析更专业一点,但对于比较复杂的数据分析来说(例如调取网页数据、数据库等),的方式是将Python与R结合使用。
下面介绍几个Python与R结合使用的方法:
1.R和Python只共享文件,Python把源数据处理干净,生成格式化的文件放在预定的目录下,做个定时器让R去读文件,最终输出统计结果和图表。
这种做法一定程度上可行,除了做定时器外,还可以让Python即时执行”rscript”命令调用R脚本来工作,只是这种办法限制太大,只能够交换文件,Python不能对R进行的控制。
2.让Python直接调用R的函数,R是开源项目,肯定会有一些第三方库实现Python与R互通。
BTW:
如果之前没有学过R,可以先学Python然后决定是不是学R,如果学了R,学Python的时候会更快上手。
【R培训】R从零基础到精通_方匡南主讲
https://bbs.pinggu.org/thread-3820540-1-1.html
Python数据分析应用 掌握最in的数据分析软件:
https://bbs.pinggu.org/thread-3156765-1-1.html
联系方式:
魏老师
QQ:1143703950 
Tel:010-68478566
Mail:vip@pinggu.org