全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2915 1
2015-12-03
用r语言也有点时间了,一直大家都在说要少显式使用for循环,原因很简单:执行速度慢,但是为什么会执行速度慢一直都不知道,有人知道底层的一些原因吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-12-4 02:33:30
所谓的用for循环慢是指和用已经vectorized的内置函数(或其他用c或cpp写的函数)相比。base R里的大部分函数以及有些包里的函数(比如dplyr,data.table等)是C或C++写的,并且已经vectorized了,也就是说你可以直接扔给这个函数一个vector,这个函数会作用于vector内的每个元素,而不需要你去写for循环显式地将函数应用在每个vector元素上。虽然最终在这些c/c++代码内vectorize的方式也是for循环,但是c++的for循环和R的for循环,效率孰高孰低一目了然了吧。如果能够使用vectorized的函数的话,那绝对是应该避免用for循环的。
另一方面,避免for循环还可以指运用apply系列函数。apply系列函数只是帮你把for循环给隐藏起来了,实质性能上和for循环是一样的。用apply函数其实只是“更加R”的一种for循环写法。当然这种写法的好处是能帮你培养vectorize的思维,不过当发生用apply写起来很费劲的时候就还是老老实实用for好了,性能上没有损失的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群