全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6685 19
2017-03-02
接触R语言块一年了,最近突然觉的R语言块要完了。R在运行的时候特费内存,大家觉的呢?还有就是大家觉的R语言的缺点是什么?欢迎大家踊跃谏言。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-3-2 23:08:22
哪一种语言不费内存呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-3 08:53:41
我们来看看R的优势,劣势,用途,再来谈R的前景。
R的优势是 简单,适合非计算机编程人员。因此使用的用户,是统计学,医学,经济学等非计算机专业人员。
第二个优势,免费,于是大量学术人员在使用,那么往往最新的理论的算法都会有工具包出来。

劣势,速度慢,内存占用大。不能写复杂的函数

那么用途就很明确了,用于数据量较小的计算。通常是传统企业的数据挖掘应用或者大数据应用前期,写个验证模型。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-3 08:53:44
我们来看看R的优势,劣势,用途,再来谈R的前景。
R的优势是 简单,适合非计算机编程人员。因此使用的用户,是统计学,医学,经济学等非计算机专业人员。
第二个优势,免费,于是大量学术人员在使用,那么往往最新的理论的算法都会有工具包出来。

劣势,速度慢,内存占用大。不能写复杂的函数

那么用途就很明确了,用于数据量较小的计算。通常是传统企业的数据挖掘应用或者大数据应用前期,写个验证模型。
从技术上讲,微软已经收购了R语言的公司。 并且SQLServer将全面支持R Script。 换言之,SQL Server将在数据挖掘方面,功能鸭肠强大,不再是只能用内置的几个常用模型了。

回来再讲,如果你是IT人员, 核心不是写数据模型。那么你还是不要用R了。如果你是专业做某些数据模型的专业人员,比如金融行业的风控,卫生机构流行病学统计,企业的业务数据分析。那么R上手最方便。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-3 09:22:40
让我们看一组数据,先是不同分析语言的工作职位需求的动态变化:
R_jobs.png
然后最新的静态数据:
Fig-1a-IndeedJobs-2017.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-3 11:13:51
一点个人看法,R的前景不是楼主想象的那么悲观,我这么说,是因为楼主可能忽略了一个因素,就是R是开源的,并且有非常活跃的社区。
能满足这两个条件的目前可能就是R和Python了。
R的占用内存的问题确实是一个瓶颈,但是目前已经有比较好的方法。
对于一般的数据处理,速度方面data.table的表现很出色。
其实对于百万级的数据,dplyr的表现已经完全够用了。这是我目前的工作状态就是这样。
对于机器学习建模,可以使用H2O包,这个包在很多平台都可以使用。因为R是开源并且活跃,新的解决方法才会被使用到这个平台上。
我测试过H2O的建模效率,百万级的数据Deeplearning也是只要几分钟的时间,效率非常惊人。
R对于从统计到编程的人,比较容易上手;Python比较适合程序员转向数据分析。
我目前发现的R最大的问题,不在于内存,而是在于相比较Python,R在图像处理建模等方面就比较麻烦了,至少目前还没有出现比较好的解决方案。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群