5. 分析自动化与扩展 分析自动化与扩展的功能主要是指用编程的方式来自动调用JMP进行数据的整理和分析工作,并通过提高JMP与其他数据分析软件的兼容性来快速提高JMP的适应能力和分析能力。它是专门为JMP高级用户准备的。JMP11在这方面的亮点也是层出不穷,包括:构建界面更友好的JSL(JMP脚本语言)编程环境、优化应用程序的实用功能、支持直接读取Teradata数据库、完善Excel导入向导、与Matlab无缝集成和导入海量外部数据前可事先抽样等。 我们从中精选两项内容来说明一下:完善Excel导入向导和与Matlab无缝集成。 Excel是我们接触频率最高的数据分析软件。常常看到这样的情形:需要用JMP分析的数据分布在多个Excel工作簿里,其中又有不同的嵌套层次和分组的行或列,因此在开始分析前往往需要进行大量处理。现在,凭借完善后的JMP11 Excel导入向导,数据导入的难题迎刃而解,无需进行长时间的清理和格式修改,只需简单几步,即可获得JMP标准格式的分析表格。如果文件发生变更或更新,还可自动生成JSL用于刷新数据。 
和大众化的Excel相反,Matlab的主要用户是专业的信号处理工程师和计算金融分析师,在某些特定的领域积累了丰富的行业经验和现成的Matlab分析代码,同时他们也喜欢交互性强、可视化效果好的JMP分析界面(如JMP独有的预测刻画器)。现在,像这样的用户不必再纠结如何取舍工具软件的问题了。因为JMP11可以与Matlab无缝集成。使用JMP11中的JSL功能,JMP可以直接与Matlab结合,启动 Matlab连接、向Matlab发送数据、提交代码以及将数据输出或送回JMP。更有意义的是,哪怕对Matlab及其编程知识一无所知的人,也可以借助同行现有的Matlab模型,进一步拓展分析能力,大幅提高工作效率。 
6. 专业统计分析 对于从事数据挖掘与建模预测、统计科研与教育的专业统计分析人士来说,以上介绍的内容可能还不过瘾。其实,JMP11对于统计高端用户也推出了很多颇具帮助价值的新功能,其中包括全新或改进过的稳健模型Robust Modeling、广义回归 Generalized Regression (仅限JMP Pro)、混合模型Mixed Models (仅限JMP Pro)、偏最小二乘Partial Least Squares等。
举两个例子来说,广义回归的适应场景是:如果你有大量关联性较强或者比观测数据更多的预测变量,使用逐步回归或其他标准方法将无法得到令人满意的结果。这一类模型经常会过度拟合,并且很难推广到新数据。JMP Pro 11中的广义回归能够面对杂乱的大型数据集创建预测模型,这是JMP数据挖掘工具箱中的一项重要新功能,可用于对大量预测变量进行变量选择或创建数据挖掘模型。它能够帮助你以非常自然的方式处理说明变量中的多重共线性,通过对估计参数的较大波动施加惩罚来避免过度拟合。除标准的正态或二项分布外,JMP Pro 11中的广义回归还支持泊松分布、零膨胀泊松分布、负二项分布、零膨胀负二项分布等其他分布形式。 
混合模型则适应于:当化工生产或制药行业的药物试验、交叉设计过程中需要对多个对象进行多次测量时,以及其他会同时涉及时间和空间的数据时,就可以在实验数据分析中运用混合模型。JMP Pro11中全新的混合模型特质,能够混合固定效应和随机效应模型对数据进行拟合。用户可以在直观的拖放界面中指定固定、随机和重复效应,关联多组变量,设定受试对象和连续型效应。另外,用户还可以根据实际需要计算更多种关联结构的协方差参数。 
|