同时另一方面,只要数据量低于刚才提到的限度,R又提供了最好的展现方案,因为“展现方案是专用而非泛用”的。最著名的ggplot2,基于百度echarts产品的recharts(by taiyun on Github),还有Yihui Xie的作品knitr(markdown语法动态将数据挖掘结果,图片,视频生成html),要比Python现有的可视化包(甚至是GUI包)更友好,易于操作,更适合小数据集快速展现。如果你恰好是SAS用户,还是不要说自己懂数据展现会比较好。
我的理解是,R的产出类似html+js+CSS一样,适合轻量分析,轻量展现,更适合个人用户。
非结构化大数据处理:
你的算法已经走到了“万事俱备,只差跑全量” 这样一个对手中的数据很了解的地步了。Wiki 对Revolution Analytics的介绍讲:R didn't natively handle datasets larger than main memory。非结构化大数据应用的场景只能是: