选择节点和测试流

2024

收藏 2010-02-25

老师
您好！
请问
1、在Clementine中如何用选择节点将数据随机平分为二个部分，一部分作为训练集运用c5.0模型节点建模，一部分作为测试集呢？
2、怎么建立测试模型？是将测试集连接训练得到的模型，再将此模型连接一个分析节点吗？

谢谢！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

ruiqwy

2010-2-26 14:23:36

您好！
1.前期整理好数据后，选择partition节点连接入数据流，在里面可以设置训练集、测试集及验证集，若要平分在测试集及训练集栏位内填上50%。
另外可以设置标签及数值；上面设置是对数据表中增加标志字段（区分测试集和训练集）的数值进行选择，第一个表示使用1、2、3这样的数值来表示，第二个是使用“1_training“等来表示，第三个是使用”training“等来表示，可以通过第二个图中的value来观察。此外下面还有设置随机种子的选项。
ps：在分割完不同集合后，可以右击partition节点，选择cache中enable，这样随机分割完的数据就可以暂时存在缓存中，这样不同时候进行不同建模的时候就不会因为样本不同而使结构受影响！（第一次执行后会在节点的右上方出现绿色的文件件的标签）
2.如果训练好模型后，把所得的模型节点从右上方拖到数据流的测试集后，建立连接后，再加个分析节点或一些结果的节点就可以了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

blue_tw

2010-2-26 16:24:30

非常感谢老师！！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

blue_tw

2010-2-26 16:30:14

再问一下
选择partition节点，在测试集及训练集栏位内填上50%后
，是再用两个select节点，分别选择包含“分区 ="1_训练"”和丢弃“分区 ="1_训练"”，从而得到训练集和测试集，然后进连接模型节点的吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ruiqwy

2010-2-27 00:00:02

嗯！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

blue_tw

2010-2-27 10:57:45

谢谢老师！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群