昨日阅读2小时,累计153.5 h
2.5 学习多类
前面有家用汽车例子,属于家用汽车类的正例和属于其他所有汽车类别的负例。
这是一个两类(two-class)问题。
通常情况下,我们有K个类,记为Ci, i=1, 2, ---, K,
且每个输入实例严格地属于其中一个类。训练集形如
x = ﹛x t, r t ﹜ t =1 to N
其中r 是K维的。且 r t i = { 1 xt 属于Ci ; 0 如果x t 属于Cj, j 不等于i
在用于分类的机器学习中,我们希望学习将一个类与所有其他类分开的边界。
这样可以把K-类的分类问题看作是K个两类问题。
因此在K-类的分类问题中,我们要学习K个假设 (此处有公式)
整体经验误差对所有类在所有实例上的预测取和。(此处有公式)
理想情况下,对于给定的X,只有其中一个假设为1,且我们能够选定一个类。但,若没有,或者有两个或更多的 hi(x)=1时,就无法选定一个类,这是不确定的(doubt)情况且分类器要拒绝这种情况。
在学习家用汽车的例子中,只用了一个假设,且只对正例样本建模。任何未包括其中的实例都不是家用汽车。
作为另一种选择,有时我们可能更倾向于构建两个假设,I个对正例,一个对负例。