描述性问题旨在总结数据集中的特征。你不解释结果。例如:一天供应的新鲜水果和蔬菜的数量。
探索性问题是您试图找到变量之间关系模式的问题,即您的目标是产生一个假设。在这个阶段,您不检验假设。你只是在产生一个假设。更一般地说,您可以说您提出了一个假设,该假设可以在总体中的新样本中成立。
推理问题以问题的形式重申提出的假设,该问题将通过分析数据来回答。您正在验证假设,即观察到的模式是否超出手头的数据。大多数统计问题都是推理问题。
预测性问题是您预测特定实例的结果的问题。
因果问题:与预测和推理问题不同,因果问题与总体中的平均值有关,即改变一个测量中的平均值将如何影响另一个测量。因果问题适用于随机试验和统计实验中的数据,在这些实验中,您试图通过设计对照实验并一次更改一个因素来了解观察到的效果背后的原因。
一个机械问题询问观察背后的机制是什么,即一个测量值的变化如何总是并且完全导致另一个测量值的确定性行为。机械问题通常适用于工程情况。
对数据科学的影响
六个问题框架提高了人们对提出哪个问题的认识,旨在减少讨论和媒体中的混乱。然而,它们也有助于提供一个单一的框架来将统计问题与数据科学联系起来。
重新回答六个问题:
描述性和探索性技术通常被一起考虑
预测和推理问题也可以结合起来
所以我们可以考虑四个问题:
探索性
推理的
因果关系
机械的
为什么这个框架很重要?
那是因为它提供了以前可能没有遇到过的问题。下面是三个例子
通常,数据科学的起点是“大数据”。大多数数据科学家不习惯处理小数据。当您没有大量数据时,您需要考虑更多的统计驱动方法,看看统计和数据科学大数据和推理之间的区别......
因果问题的重要性,即我在相关性中讨论的相关性与因果性并不等于因果关系,而是您如何确定……
最后——为什么一些传统工程师不信任数据科学中详细阐述的机械问题
结论
这六个问题提供了严谨和简单的分析。我还发现这些问题提供了一整套将统计数据与数据科学联系起来的问题。它们帮助您超越常规思考,即超越您遇到的问题来考虑所有可能的问题。
编辑推荐
1、
2022年300个以上最佳免费数据科学课程
2、
大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、
机器学习模型方法总结
4、
历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、
机器学习如何应用于商业场景?三个真实的商业项目
6、
数据工作者的自我修养 | 哪些技能是必不可少的?
7、
《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、
文本挖掘常用的107个语料库
9、
一图读懂“东数西算”工程
10、
零基础转行数据分析,看这篇文章就够了
DA内容精选