全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
4870 0
2020-11-06
GraphPad Prism 9 前几天已经上线了,新增不少功能,统计分析能力有不少提高。大家已经在用的可以开始升级了。

Prism 9 新功能概览:
  • 新增主成分分析(PCA)
  • 新增主成分回归分析(PCR)
  • 多元变量数据绘制气泡图(Bubble plot)
  • t检验生成评估图(Estimation plot)
  • 多元t检验选项(配对,非参数等)
  • 从多元线性回归和多元逻辑回归中做插值
  • 提升数据表列数上限
  • 对多变量数据表的大量改进
  • 自动向图形中增加多重比较结果(自动星标)
  • 对所有分析做了改进




Prism 9 核心功能介绍:

01 更高维度的数据
Prism 9对多变量数据表进行了许多重大改进。使用标准结构可以分析更大的数据集,并执行新的和改进的分析,主要改进如下:
  • 提高了数据列的上限 - 在每个数据表中最多输入1024列数据
  • 自动识别变量类型 - 将多变量数据表中的变量识别为连续值,分类值或标签值。
  • 数据表可输入文本信息 - 直接以文本形式输入数据。无需将变量编码“0”和“1”,只需直接在数据表中输入例如“Male”和“Female”。
  • 自动变量编码 - 输入你的数据,让Prism负责其余的工作。Prism会自动将分类文本变量编码为数值型哑变量。





通常,在研究中,我们会发现自己拥有实验中不同变量的大量信息。举一个简单的例子,想象一下在给个体服用旨在降低血压的实验药物或安慰剂后,我们测量他们的血压。除了记录的血压测量值之外,您还可能记录了有关每个受试者的年龄、身高、体重、性别、种族以及许多其他可作为潜在变量的大量信息。

许多统计方法可以来分析这类“多变量”数据,例如多元线性回归和多元逻辑回归。使用这些“多变量”分析,意味着您可以探索感兴趣的结果而不会浪费任何可能有用的信息。为了便于处理这种增加的数据信息密度,Prism提供了多变量数据表以将数据容纳在标准数据结构中,该数据结构几乎已在其他统计软件或代码包中普遍使用(例如R,SPSS和MATLAB)。在这种数据结构格式中,每一列代表一个不同的变量,而每一行代表一个不同的受试者(每个受试者的每个变量的测量值将放入该受试者所在行的相应列中)。

02 主成分分析(PCA)
Prism Hero-03.png

有时,收集的变量数量远远超过可供研究的受试者数量。看一下基因表达的研究,将受试者分为两组:治疗组和对照组,然后测量成百上千种不同基因的表达水平。可能只是变量太多而无法使模型适配数据。但是,简单的去掉一些变量不去分析,可能会导致丢失有价值的信息。选择一些要从分析中排除的变量只会丢掉可能有用的信息!PCA就是这样一种“降低维度”的技术,可以用它来减少所需变量的数量,但同时从数据中消除尽可能少的信息。


其它PCA功能:
  • 通过平行分析(以及Kaiser方法,总方差阈值方法等)来选择成分。
  • 生成碎石图(Scree Plots)、分数图(Score Plots)和双标图(Biplots)。
  • 自动准备PCA的结果,以进一步用于多元线性回归(PCR - 主成分回归)。



03 向图表添加新的维度

GDP Bubble Portfolio By Continent.png
可以从原始数据 – 对符号位置(X和Y坐标)、大小及填充颜色等编码的变量,直接创建气泡图。请注意,可以使用分类(分组)变量或连续变量来定义符号颜色和大小。

在此图上,有100多个国家/地区显示为单个圆圈。每个圆圈的X坐标代表该国的GDP(PPP),而Y坐标代表出生时的平均预期寿命。每个符号的大小与其所代表的国家的人口成比例(两个最大的符号分别代表中国和印度)。最后,每个符号的颜色代表该国家所在的大洲。在这个例子里的变量(颜色)是分类变量,但气泡图中的颜色也可以像下面这样由连续变量定义:
Prism9产品介绍.png

此图中,符号的X坐标、Y坐标和大小的定义与上例相同。但是,现在该符号的颜色是连续的,其代表该国家每1000个人的出生率。Prism现在还具有内置的半透明配色方案,以便可以更清晰地看到重叠的符号。

04 自动将多个比较结果添加到图形中
文章配图-04.gif
对多个成对比较执行相应的分析后,点击一个按钮就可以将这些结果自动添加到图形中。要自定义这些线和星号,只需再次点击工具栏的按钮即可。如果对数据或分析进行了调整,图形上显示的结果将自动更新。但是请记住,P值只是你研究成果的一方面。别忘了还要报告效应估计值(effect estimation,例如, 95%置信区间的均值差异)。

05 使用估计图更好地可视化T检验结果
Prism9产品介绍02.png
添加P值以证明均值差异的95%CI与P值之间的关系。如果95%CI包括零,则P值 将 小于0.05。观察95%CI比单独使用P值更具参考价值。

执行t检验时,Prism现在会自动创建分析结果的估计图(Estimation Plots )。在此图上,两组的原始数据都将绘制在左侧的Y轴上。在右边的Y轴上,将绘制组均值差异及其95%置信区间。该图比只使用P值会提供更多的信息,因为它不仅显示了95%CI是否包括零,还显示了95%CI的范围(如果95%CI包括零,则P值将大于0.05,如果95%CI不包含零,则P值将小于0.05)。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群