全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5230 8
2016-01-31
最近在用SVM做多分类时碰到一个问题,恳请大神指点一二:
数据是16维的,分5类,每类的样本数据数量为14,72,100,45,55. 用tune.svm做
grid search发现无论如何调整gamma和cost,best performance总在50%上下徘徊。
试过各种kernel及加入call.weights都没有大的改进。
这种情况下,还有没有别的办法?还是说本样本数据不适合SVM?
万分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-1-31 22:07:30
数据规范化了吗?我记得林智仁教授他们写了一篇文章,专门讲如何使用svm的,规范化训练集和测试集的数据,会对结果又很大的影响。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-31 22:07:38
补一下源程序:
说明:s5为数据集,分类字段为Phase

library(e1071)
load("test.rda")
x <- subset(s5, select = -Phase)
y <- s5$Phase
model1 <- tune.svm(x, y, P0.weights = 6, gamma = 2^(-4:0), cost = 2^(0:4))
print(model1)
Parameter tuning of ‘svm’:

- sampling method: 10-fold cross validation

- best parameters:
gamma cost
   0.5    8

- best performance: 0.5023399
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-31 22:17:35
bbslover 发表于 2016-1-31 22:07
数据规范化了吗?我记得林智仁教授他们写了一篇文章,专门讲如何使用svm的,规范化训练集和测试集的数据,会 ...
我试一下找找这篇文章,这位朋友如果能记得文章的名字就更好了,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-31 22:28:21
A Practical Guide to Support Vector Classification
http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-31 22:31:37
bbslover 发表于 2016-1-31 22:28
A Practical Guide to Support Vector Classification
http://www.csie.ntu.edu.tw/~cjlin/papers/guide/g ...
万分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群