全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
5083 0
2022-04-19
五十年前,“数据分析”和“统计分析”之间的界限非常清晰。但随着数据分析的发展,这些界限变得模糊。这两个术语之间的差异现在是一个灰色地带,但仍然存在一些显着差异。

什么是“数据分析”?
数据科学家和统计学家通常以不同的方式定义“数据分析”。


对于数据科学家来说,数据分析是筛选大量数据:检查、清理、建模,并以非技术方式将其呈现给非数据科学家。绝大多数数据分析是在计算机上执行的。
如果您是统计学家,您通常会以样本(即一部分人口)的形式获得有限数量的信息,而不是“大量数据”;使用严格的统计技术对该样本进行数据分析。
数据科学家和统计学家都使用数据来推断消费者群体、一般人群或目标市场。但是,他们会以完全不同的方式处理数据分析问题。

数据分析师 将拥有一个数据科学工具箱(例如 Python 和 R 等编程语言,或使用 Hadoop 和 Apache Spark 等框架的经验),他们可以使用它来调查数据并进行推断。
另一方面,统计 分析师 通常会使用基于数学的技术,如假设检验、概率 和各种统计定理来进行推断。尽管统计学家的大部分数据分析都可以在 R 等统计程序的帮助下进行,但分析更有条理,并且一次只针对了解样本的一个特定方面(例如,平均值、标准差或置信区间) .

您可以在数据科学中执行许多数据分析步骤,而只需很少的统计基础:数据准备、转换数据。

什么是统计分析?
一般来说,统计分析是一门使用统计数据揭示数据模式和趋势的科学。 注意这里的关键词是“统计”。为了执行任何统计分析,您必须使用统计数据。从历史上看,只有统计学家对数据使用统计技术。在磁带安装和 Cobol 编程的大型机时代,数据科学甚至都不是一回事。但随着数据科学的发展,它与许多曾经被认为是统计学家专属领域的领域融合在一起:数据可视化、优化、高维分析等等。


数据分析与统计分析
有很大的灰色地带: 数据分析是统计分析的一部分,统计分析是数据分析的一部分。任何称职的数据分析师都会很好地掌握统计工具,并且一些统计学家将对 R 等编程语言有一定的经验。

如果你对分界线的位置或分离发生的位置感到困惑,那么关键问题确实是,

数据科学和统计这两个领域真的是独立的实体吗?

以“老派”的方式思考统计学(即白发苍苍的统计学家在活页夹中潦草地写公式,筛选表格并进行很少人理解的晦涩假设检验)与数据科学(性感,处于技术革命的最前沿),然后你可以说是的,它们是完全分开的。但是,如果您认为现代统计学更多地是关于“……更广泛的数据科学理念(例如,通过更多地关注教育、研究和交流中的计算)” (Carmichael & Marron,2018 年),那么答案是可能没有。

编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了

DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群