全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
1584 2
2017-03-26

数据分析师为什么需要编程语言_数据分析师

今天我们就来说下数据分析师为什么需要编程语言,不过这个需不需要还是要看数据分析师所在的企业是否要用到编程。毕竟一些中小企业用Excel就差不多了。

对于数据分析,如果只是给定准备好的数据集,做简单的描述性统计、简单绘图,那么不太需要掌握任何编程语言。问题是,现实中收集到的数据是多样的、基础的,很少能直接满足模型对数据规格的要求以及模型成立的假设,那么就需要在分析前变换、合并、分类、整理数据,此时可能需要从数据库用SQL跨表查询,数据整理好后利用模型做统计推断或者机器学习等等,形成样本内或样本外的预测,可能还要用可视化的方式呈现结果。

这整个过程中,各个环节都可能涉及到大量的参数需要调节,各种细节都需要控制,还有很多主观的选择。这样的过程如果用软件窗口去实现,窗口中的选项将非常复杂,整个过程需要在多个数据及上重复执行也很麻烦。用编程语言可以精确地描述整个过程,控制大部分细节,并且可以批量的重复实现。

数据分析和探索的过程是一个不断尝试想法、验证假设的过程,这就需要临时产生、执行新的代码,脚本语言如Python和R天生就是对这样的互动操作有很好的支持。如果这种过程都用C++或Java这些需要编译(二进制或bytecode)——执行的语言来完成,那么过程将比较痛苦。

因此对于专业的数据分析,掌握数据库的应用、数据分析的编程语言是很有必要的。题目中提到的编程语言一些是通用编程语言(如C++、Java)可以广泛地用于开发各种项目,而R作为脚本语言凭借其良好的互动性和丰富的扩展包资源可以方便地解决大部分数据处理、变换、统计分析、可视化的问题,并可以重现所有的细节。数据分析者最好通用语言和脚本语言各至少掌握一种,这样在处理许多项目时就能合理地发挥不同语言的优势,提高整体的生产力。对于数据分析,如果只是给定准备好的数据集,做简单的描述性统计、简单绘图,那么不太需要掌握任何编程语言。问题是,现实中收集到的数据是多样的、基础的,很少能直接满足模型对数据规格的要求以及模型成立的假设,那么就需要在分析前变换、合并、分类、整理数据,此时可能需要从数据库用SQL跨表查询,数据整理好后利用模型做统计推断或者机器学习等等,形成样本内或样本外的预测,可能还要用可视化的方式呈现结果。

这整个过程中,各个环节都可能涉及到大量的参数需要调节,各种细节都需要控制,还有很多主观的选择。这样的过程如果用软件窗口去实现,窗口中的选项将非常复杂,整个过程需要在多个数据及上重复执行也很麻烦。用编程语言可以精确地描述整个过程,控制大部分细节,并且可以批量的重复实现。

数据分析和探索的过程是一个不断尝试想法、验证假设的过程,这就需要临时产生、执行新的代码,脚本语言如Python和R天生就是对这样的互动操作有很好的支持。如果这种过程都用C++或Java这些需要编译(二进制或bytecode)——执行的语言来完成,那么过程将比较痛苦。

因此对于专业的数据分析,掌握数据库的应用、数据分析的编程语言是很有必要的。题目中提到的编程语言一些是通用编程语言(如C++、Java)可以广泛地用于开发各种项目,而R作为脚本语言凭借其良好的互动性和丰富的扩展包资源可以方便地解决大部分数据处理、变换、统计分析、可视化的问题,并可以重现所有的细节。数据分析者最好通用语言和脚本语言各至少掌握一种,这样在处理许多项目时就能合理地发挥不同语言的优势,提高整体的生产力。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-3-26 19:00:29
感谢楼主分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-27 07:40:31
简单分析一般的spss等就可以应付,但是复杂的就不行了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群