1、既然大数据的基础是样本总体,那么就是假设了虚假或者异常值可以被忽略。
很想请教是否样本总体总是表现为正确的形态,即:我们如何确保大多数人一定不会选希特勒上台?
这不是大数据的问题,这是民主的问题。如果希特勒上台是大家选择的,那大数据体现了民意。
2、共产主义原理的一个基本实践前提就是信息处理的无成本和无时间间隔。
问题是:每一个人如何能在有限的时间内处理如此多的信息,而且我们还假设了,这些信息所基于的大数据是能够及时被正确计算和处理的。
这是技术(IT技术、通信技术……)成本问题。摩尔定律一定程度上让大家看到了这种希望。但不可能完全解决,这有是哲学问题——需求不断增长,技术总是落后,成本也居高不下,但这些会反作用于技术、成本。
3、每一个单元都享用并参与处理数据是大数据的基本性质,除开这个基本属性,就完全无所谓大数据。
那么,如何确保处理和享用之间不出现逻辑矛盾?
逻辑是人的思维。大数据是利用机器模拟人的思维,有什么样的人就有什么样的思维。这人的问题,不是数据的问题。
肤浅的理解,请LZ不吝批判。