[SparkR]求助：如何用sparkR循环操作dataframe

2149

收藏 2016-09-14

如下是个透视后的spark data frame，period_x列中的值代表这个阶段个产品的销售数量

我想要计算每个产品在五个阶段的销售数量和频率，计算频率的公式是这个产品这一阶段和上两阶段不能有NaN，例如，产品1在第四阶段的频率2，因为第六行的产品1在period_3的销售数量是NaN，所以产品1在第四阶段的频率就是第一行和第三行。

最终通过用sparkR得出以下结果：

PS：

如果有大牛能贴出如何实现或者大致代码，可以私下联系我，我会发个小红包表示感激。如果觉得问题没有描述清楚也可以私下联系我。感谢！

微信：13795308585

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享