假设根据emp1(data.frame)生成emp2(data.frame),现已有emp1(包含字符串、时间类型),且创建仅有一行全为0的emp2,
使用while循环,根据emp1中符合条件的行不断生成emp2的行,最终得到完整的emp2。
但当数据量过大时,如emp1超过百万行,数据处理速度会非常的慢,数小时才能完成循环。有什么方法可以使速度更快?
之前考虑使用parallel包中的parLapply函数来进行多线程处理,但好像不支持data.frame类型的输入,当输入parLapply(cl,emp1,function_name)后,会出现Error in checkForRemoteErrors(val) : 2 nodes produced errors; first error: 参数长度为零
的错误。