全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
6452 1
2020-08-17
数据分析与统计分析之间的区别
五十年前,“数据分析”和“统计分析”之间的界线非常清晰。但是随着数据分析的发展,这些界限变得模糊了。现在,两个术语之间的差异很大程度是灰色区域,但是仍然存在一些显着差异。
什么是“数据分析”?
数据科学家和统计学家通常以不同的方式定义“数据分析”。
对于数据科学家而言,数据分析正在筛选大量数据:检查,清理,建模并将其以非技术方式呈现给非数据科学家。这种数据分析的绝大多数是在计算机上执行的。
如果您是统计学家,则通常会以样本的形式(即人口的一部分)来获取有限数量的信息,而不是“大量数据”。使用严格的统计技术对此样本进行数据分析。
数据科学家和统计人员都使用数据来推断消费者群体,总人口或目标市场。但是,他们将以不同的方式处理数据分析问题。
一个数据分析 将有一个数据科学工具箱(如编程语言如Python和R,或与Hadoop等和Apache星火框架方面的经验),使他们能够调查数据并进行推论。
另一方面,统计  分析师  通常会使用基于数学的技术(例如假设检验,概率  和各种统计定理)进行推断。尽管可以使用R之类的统计程序来执行大部分统计学家的数据分析,但分析的方法更加有条理,旨在一次了解样本的一个特定方面(例如,均值,标准差或置信区间) 。
数据的  生命周期  是数据科学中数据工作流程的关键:
您只需很少的统计基础就可以执行数据科学中的许多数据分析步骤:数据准备,转换数据。
什么是统计分析?
一般而言,统计分析是使用统计数据揭示数据模式和趋势的科学。 注意这里的关键词是“统计”。为了完全执行任何统计分析,您必须使用统计信息。从历史上看,只有统计学家对数据使用统计技术。在磁带安装和Cobol编程的大型机时代,数据科学甚至都不是一回事。但是随着数据科学的发展,它与曾经被认为是统计学家专有领域的许多领域融合在一起:数据可视化,优化,高维分析等等。
数据分析与统计分析
灰色区域很大: 数据分析是统计分析的一部分,而统计分析是数据分析的一部分。 任何称职的数据分析人员都将掌握统计工具,一些统计学家将具有使用R之类的编程语言的经验。
如果您对生产线的位置或分离的位置感到困惑,那么真正的关键问题是,
数据科学和统计学这两个领域真的是分开的实体吗?
在“老派”思维方式下,对统计数据(即白发统计学家在活页夹中随意写公式,在表格中进行筛选并进行鲜为人知的模糊假设检验)与数据科学(性感,在技术革命的前沿)进行了思考,然后您可能会说是的,它们是完全分开的。但是,如果您认为现代统计学更多地是关于  “…… 关于更大数据科学的更广泛的想法(例如,将更多的精力放在教育,研究和交流方面的计算)” (Carmichael&Marron,2018),那么答案可能不是。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-8-18 13:38:24
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群