全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6039 0
2016-02-26
SPSS Modeler使用介绍

使用源节点能够导入以多种格式存储的数据,这些格式包括平面文件、IBM® SPSS®Statistics(.sav)、SAS、Microsoft Excel 和 ODBC兼容关系数据库。也可以使用用户输入节点生成综合数据。
这里主要用到数据库组件,选择数据库,拖到窗口,然后双击,设置数据源和表名称。如某些字段不需要引入,可以在“过滤”中指定;可以在“注解”中指定名称,如果一个流中有多个数据源,则需要指定名称,这样在执行脚本时可以分别指定。
可以设置数据表的方式或者通过SQL语句。首先要配置ODBC驱动,在配置前,要SPSS自带的驱动程序。
如果对于取自两个数据源的时侯,有用到数据库函数,就可以用SQL语句;在SQL语句中可以用参数等。
记录选项
记录操作节点用于在记录级别上对数据进行更改。这些操作在数据挖掘的数据理解和数据准备阶段非常重要,因为通过这些操作可以根据您的特定业务需要裁剪数据。
这里主要介绍“选择”、“汇总”和“合并”。
选择:选择节点可基于特定条件从数据流中选择或丢弃记录子集。
汇总:用汇总和合计的输出记录替代一列输入记录。
合并:合并节点获取多个输入记录并创建包含某些或全部输入字段的单个输出记录。这对于合并来源不同的数据非常有用,例如内部客户数据和已购买人群统计数据。
字段选项
字段操作节点用于在字段级别上对数据进行更改。
这里主要介绍“类型”、“过滤”、“导出”。
类型:类型节点指定字段元数据和属性。例如,您可以指定每个字段的测量级别(连续、名义、有序或标志)、设置用于处理缺失值和系统空值的选项、设置用于建模的字段的角色、指定字段和值标签,以及为字段指定值。
过滤:过滤节点用于在源节点之间过滤(丢弃)字段,对字段进行重命名和映射。
导出:导出节点将修改数据值或根据一个或多个现有字段创建新字段。它可创建的字段类型包括公式、标志、名义、状态、计数和条件。
输出
输出节点提供了用于获取数据和模型的相关信息的方法, 还提供了以各种格式导出数据以与其他软件工具相互作用的机制。
表:表节点可以创建能够列出数据中的值的表。该表中包含了流中的所有字段和所有值,从而可以方便检查数据值或以易于读取的格式进行导出。
导出
导出节点提供一种将各种格式的数据导出到与其他软件工具连接的接口的机制。
数据库:数据库导出节点将数据写到与 ODBC 兼容的相关数据源。要写到 ODBC数据源,数据源必须存在且您必须拥有对数据源的写权限。
平面文件:平面文件导出节点将数据输出到已分隔的文本文件。这对导出可由其他分析或电子表格软件读取的数据非常有用。
建模
IBM SPSSModeler提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。
建模方法划分为三种类别:分类、关联和细分;
   对于各建模方法,需要了解不同建模方法适用的业务场景、建模使用输入数据要求等。

流示例
参数

流的参数在菜单中“工具”-“流属性”-“参数”中指定,如下图所示:
调度监控
调度

流开发完成后,可以在客户端中运行,也可以通过命令运行。以调度方式运行时,主要用到命令运行方式。
运行命令如下:
clemb -directory "d:\spss_test" -stream start.str -streamtest_yscbl.str -stream end.str -P:databasenode.username=ods_mx-P:databasenode.password=ods_mx-P:databaseexportnode.username=ods_mx-P:databaseexportnode.password=ods_mx-hostname 192.0.0.1 -port 1521 -username ods_mx-password sods_mx -PJHBH=201201 -PPGSQ=201208 -log"d:\spss_test\report.log" –execute
监控
1.  调度情况监控表设计如下:(要考虑计划编号、指标编号、流名称的字段属型,要保持一致)
2.   实现方式
通过start.str和end.str流来记录每个指标流运行的开始和结束时间。其中start.str和end.str的传递的参数为评估计划编号、评估属期始、评估属期止、指标代码、指标流名称等信息,其中日志中主键用到数据库中主键生成函数。
3.   参数定义
参数包括:评估计划编号、评估属期始、评估属期止、指标代码、指标流名称;在spss中统一命名,命名如下:


参数名
中文名
备注
JHBH
评估计划编号

PGSQS
评估属期始

PGSQZ
评估属期止

ZBBH
指标编号

ZBMC
指标名称


张文彤老师SPSS Modeler 数据挖掘实战案例培训2016年劳动节开课!
https://bbs.pinggu.org/thread-4444711-1-1.html



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群