在终极的分析中,一切知识都是历史;
在抽象的意义下,一切科学都是数学;
在理性的基础上,所有的判断都是统计学;
不知是哪位哲人说了这段话,我深以为然且被他深邃的思考折服。
百度是怎么定义统计学的呢?如下:统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
这段话的意思简洁的表达为:统计学分为数理统计学和应用统计学,其中应用统计学分为描述统计和推断统计;数理统计是应用统计背后的理论支持者,好比数理统计是发明火药的中国人,而火炮、枪支的发明者则是将之发挥更大作用的应用统计。其实,从实践运用来看,描述统计和推断统计是相辅相成,逐渐混为一体的,比如探索性数据分析时,也需要不确定性很强的数学模型去描述数据结构。当然,这是所有学科发展成熟的共性,交叉以及融合,比如物理学探索物质、宇宙的起源和尽头和哲学家思考我从哪里来到又哪里去有很大的共性。这也难怪爱因斯坦等人想要发现物理宇宙公式了。
统计学的发展也是十分迅速的,从耳濡目染的政府统计-GDP、消费品物价指数CPI等到生物医学的临床药品研究和基因组结构和变异规律等,统计学的触角无处不在。因此,可以说统计学是一门技术性很强的基础学科,是其他学科进行数理分析的必备工具。哪里有数据,哪里就需要统计学。
统计学成为一门学科还是三四百年前的事情,然而其思想却早已深入人心,被我们不被察觉的使用。比如每个人心中对某个人好坏的印象判断;怎么去充分认识某个人呢?我们会去观察这个人(命名为甲)的行为、言语,大多数人不会因为甲做了一件好事或者坏事而决定甲的好坏,而会进行一个相对长时间的观察,这可以理解为扩大样本容量,在统计学中的背后理论就是大数定律,即无序的有序,当随机实验次数n趋向无穷时,实验结果所得算术平均数越接近真值。大数定律很强大,可以说是所有统计理论之母,这也是大自然规律设计的巧妙,上帝告诉人类,真理是存在的,只是你们永远无法达到,但是如果你们可以勤奋一点努力一点,还是可以嗅到一点真理的味道,得到一点点好处的。
那么我们经验世界里的知识都是在大数定律中的得来的,并且大数定律是所有知识的试金石,正确与否,得我大数定律说了算,多么不可一世我们却又不得不臣服。当然也许有人会说,纯粹的逻辑性思考应该可以逃离这一魔咒。比如说最简单的1+1=2,不需要被试验吧。无可否认,数学中演绎推理并不需要被现实经验知识所证明,但是任何完美的的理论都会存在bug,因果逻辑也是这样,比如说各种无法被解决的各种悖论。
统计学另外一个很基础的思想就是小概率事件不会在一次试验中发生。还是拿甲是好人坏人这个例子。假设我们心中已经对甲已经有了甲是好人的判断并作为备择假设,甲是坏人为零假设,as time goes ,某一次我们发现甲竟然偷东西了!这个时候我们心里就开始琢磨了,甲为什么会偷东西呢?他明明是个好人啊,怎么会偷东西呢?这张事情居然发生了!不不不,他一定有原因的,此时此刻我们很不愿意去相信甲是坏人;而且事实上,甲也不大可能是坏人,毕竟他只做了那么一件坏事,我们忍心去否认他么?我国统计学的研究水平还是比较落后的,和美利坚大概差了十年的水平,希望更多的人认识统计学,投入到统计学学科中来!