全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1762 8
2020-12-04

谈及数据分析工具就不得不谈到R,R作为开源软件,有许多统计学家和职业学者为其开发了丰富的工具包,其中也包含了一些最时髦的统计方法。但是,许多人对R望而生却,觉得R是靠代码进行数据分析,“难度很大”。

R有这么难吗?假如我们不是要进行R工具包开发,我们需要学向量、矩阵运算吗?为什么有好些R培训上来就是高数?普通使用者需要吗?有没有更简单的方法让没接触过R的人也可能无障碍且正确的使用R进行一部分统计分析?

我和很多人都讨论过这些问题,个人觉得,对于普通使用者而言,R可以很简单。培训方是完全可以降低个体的学习成本和使用成本的,但他们从来不这么干。为什么?

为了说明这件事,我开发了一个用于MVN包(用于多元正态性检验的R包)的Excel工具,该工具可在同名公众号左下角的菜单中进入下载。(工具的制作并不难,核心是Excel的数据验证功能以及IF函数)

打开这个Excel工具后,顶部有使用说明。

                              

1.png

接着,我们进入操作区。操作区的黄色部分为必选项,而蓝色部分则是可选项。如果只想进行多元正态性检验,蓝色部分可以不进行更改。此处,我们选择数据集Q2,并使用hz方法进行多元正态性检验。

2.png

完成操作后,在最下方的语法区将显示对应的R语法。我们只需将“最终语法”内容复制到R中即可(即粉色区域)。

3.png

此处,我使用RStudio进行演示。

4.png

运行后,软件输出结果

5.png

这个工具并不是将写好的语法进行整理,对应R包中所拥有的功能和所包含的选择已经全部整理完毕,使用者只需像使用对话框软件那样在下拉菜单中进行选择即可。

6.png

换言之,R包的语法被制作成了拥有对话框的窗口,可类比SPSS。

7.png

我个人觉得,这是令SPSS看了沉默、Stata看了流泪的思路,因为这完全打破了使用代码的软件和使用对话框的软件之间的界限。

以SPSS为例,这可以理解为使用者在SPSS中进行所有设定后,点击下方的“粘贴”按钮

8.png

从而生成代码进行分析

9.png

估计连SAS看了都会直呼不可战胜。

假如你没有这种感觉,那可能因为你已经度过了学习R最痛苦的那段时间,并不是站在“初学者”/“新手”的立场上考虑这个问题。

换位思考一下,如果对应的每个R包都有这样类似的工具,或者对于每个特定的分析都整理了这样的Excel(可以包含多个R包),那么完全没有R基础的人不是也可以使用R进行分析并且不会出现错误么?使用成本不是大大减少?而且无需反复查看R手册,甚至减少了一部分英语不好的使用者的学习成本。

当然,有部分人可能会反驳说,在R的使用过程中,写出相应功能函数,会有提示帮助,所以这个Excel没有用

10.png

那么,对于这部分人,我觉得他们说的很有道理。但是,他们只基于自身考虑,而且往往是电脑操作水平比较高、学习能力比较强或者已经有一定R使用经验的人。我希望他们可以更多的从0基础人员的角度进行考虑,而不是使用“这么简单,这你都学不会”的借口将人与人之间的差异拉大。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-12-5 14:00:37
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-12-5 22:39:27
11000个包,楼主都准备弄出来吗
R是非常个性化的,无论适用场景,还是具体解决方案,楼主这样搞,R就不是R了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-12-5 22:43:32
再说了,R也没有多难,用的好需要基本的统计训练、应用专业基础和具体的R实现摸索,搞个傻瓜式的R不是没人想过尝试过,但都是吃力不讨好的事。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-12-6 10:40:38
邱宗满 发表于 2020-12-4 23:30
谈及数据分析工具就不得不谈到R,R作为开源软件,有许多统计学家和职业学者为其开发了丰富的工具包,其中也 ...
这样搞工作量也很大的,有这点时间说不定R也学会了吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-12-6 18:40:51
llb_321 发表于 2020-12-5 22:39
11000个包,楼主都准备弄出来吗
R是非常个性化的,无论适用场景,还是具体解决方案,楼主这样搞,R就不是R ...
11000个包,不可能都用吧,一个学科内,一般人,就用到几个?
后一句话说的是实话,吃力不讨好,主要是花功夫了,不能从中获利的问题。
至于基本的统计训练,这个东西和软件无关,每个软件的使用都需要统计训练。
做这个只是说明一个问题,对于某个软件,在软件操作上的成本和学习成本可以降得很低,但没人做,难道重点不是这个?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群