在统计分析阶段,有三层含义:
1.hissight;
2.insight;
3.forsight;
可以对应楼主说的三个方面。
在数据挖掘阶段,有三个不同:
1.超大数据;
2.超多维度;
3.realtime;
在遇到超大数据和超大维度时,整个数据结构和数据处理方式可能会发生根本性的变化,这就好比一个人如果离目的地如果只有5公里,你可以走着去,超过100公里,你只能骑自行车,如果要去美国,那只能做飞机。这也是哲学上所说的从量变到质变的过程。你可以想象当你在Google上搜索一个字的时候,Google公司的那些能人是如何在不到1秒的时间内提供给你几千万个搜索结果。
但是不管哪个阶段,你脱离不了变量。在那些书斋里的教授看来,变量都是冷冰冰的;但是在企业里面,变量是活生生的,你必须知道每一个变量的业务含义。所以,你肯定不能闭着眼睛去运行proc genmod.....^_^.