全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1665 3
2011-04-26
大家好,请教两个SVM的问题:
1、使用SVM的过程中有对样本数据验证是否可以线性分类吗? 因为在线性不可分的时候,才需要核函数来映射内积。看过几个例子好像没有判断。
2、关于线性分类的间隔最大优化问题。以二维平面上的样本点为例,在已知样本点的情况下,两类样本点的间隔已经是固定的吧。简单的比如一类在第一象限,二类在第二象限。那么他们的间隔就是相距最近的点之间的距离了。  那么已经确定了,最大化优化的余地在哪里呢?

请教一下各位高手,可能问的比较弱,但确实想不明白,呵呵。
非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-4-28 15:04:14
1、线性不可分的话,通过引入核空间的理论,将低维输入空间的数据通过非线性映射函数映射到高维属性空间,从而把分类问题转化到高维属性空间进行,大多数输入空间线性不可分问题在属性空间可以转化为线性可分问题。
2、第二问题应该是关于多分类的问题吧
我也在做SVM  我们可以一起交流 QQ:281254701
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-4-29 12:07:52
谢谢cdq3636 的回复。

就是如何知道需要解决的分类问题是线性可分的、还是不可分的? 也就是是否需要引入核函数来解决?
第二个问题,二分类也有。我说的那个例子,就是两类的样本点。一类在一象限,一类在二象限。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-9 16:54:08
关于第一个问题你无法确定数据集是否线性可分,也许映射到某个特征空间就线性可分了,这点现在是svm的难点之一;
关于第二个问题,我的解释是,样本一旦给出则最大间隔就已经客观存在了,问题是你不知道分类超平面所在,因此最大化间隔的目的是在有限次迭代中找到这个最大间隔分类超平面,你举的简单例子根本不用任何机器学习的方法就能解决,不能以点去覆盖面的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群