全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
4911 2
2010-03-22
本人初来乍到,刚开始研究weka,对于weka的许多内容都不是太明白,请各位指教。

children = YES
|   income <= 30099.3
|   |   car = YES: NO (50.0/15.0)
|   |   car = NO
|   |   |   married = YES
|   |   |   |   income <= 13106.6: NO (9.0/2.0)
|   |   |   |   income > 13106.6
|   |   |   |   |   mortgage = YES: YES (12.0/3.0)
|   |   |   |   |   mortgage = NO
|   |   |   |   |   |   income <= 18923: YES (9.0/3.0)
|   |   |   |   |   |   income > 18923: NO (10.0/3.0)
|   |   |   married = NO: NO (22.0/6.0)
|   income > 30099.3: YES (59.0/7.0)
children = NO
|   married = YES
|   |   mortgage = YES
|   |   |   region = INNER_CITY
|   |   |   |   income <= 39547.8: YES (12.0/3.0)
|   |   |   |   income > 39547.8: NO (4.0)
|   |   |   region = RURAL: NO (3.0/1.0)
|   |   |   region = TOWN: NO (9.0/2.0)
|   |   |   region = SUBURBAN: NO (4.0/1.0)
|   |   mortgage = NO: NO (57.0/9.0)
|   married = NO
|   |   mortgage = YES
|   |   |   age <= 39
|   |   |   |   age <= 28: NO (4.0)
|   |   |   |   age > 28: YES (5.0/1.0)
|   |   |   age > 39: NO (11.0)
|   |   mortgage = NO: YES (20.0/1.0)

关于红色的括号内的数字是什么意思,从哪里得来的?
== Detailed Accuracy By Class ===
               TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
                 0.536     0.185      0.712     0.536     0.612      0.683    YES
                 0.815     0.464      0.673     0.815     0.737      0.683    NO
Weighted Avg.    0.687     0.336      0.691     0.687     0.68       0.683

以上这些是什么意思?


                      Class
Attribute              soft   hard   none
                     (0.22) (0.19) (0.59)
==========================================
age
  young                  3.0    3.0    5.0
  pre-presbyopic         3.0    2.0    6.0
  presbyopic             2.0    2.0    7.0
  [total]                8.0    7.0   18.0
spectacle-prescrip
  myope                  3.0    4.0    8.0
  hypermetrope           4.0    2.0    9.0
  [total]                7.0    6.0   17.0
astigmatism
  no                     6.0    1.0    8.0
  yes                    1.0    5.0    9.0
  [total]                7.0    6.0   17.0
tear-prod-rate
  reduced                1.0    1.0   13.0
  normal                 6.0    5.0    4.0
  [total]                7.0    6.0   17.0
这些数据  和百分比值(红色)是什么意思?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-5-19 07:06:45
红括号里面,左边是bad的数目,右边是good数目。
         TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
                 0.536     0.185      0.712     0.536     0.612      0.683    YES
                 0.815     0.464      0.673     0.815     0.737      0.683    NO
Weighted Avg.    0.687     0.336      0.691     0.687     0.68       0.683
上面的第一行 TP rate 是判断是good(or Yes),结果也是good的概率。 第二行TP是判断是Bad(or NO)结果也是bad的概率。 ROC是一个判断预测准确性的图形,图形面积接近1就是100%判断正确。其他参数参考weka的书 。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-19 08:28:13
Thanks you a lot.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群