楚韵荆风 发表于 2013-5-16 19:33 
强烈的支持这种活动。我也想请教一下王教授:
曾经有幸听过您在我们学校做的报告。
最近拜读了您写的几篇 ...
(1)据我个人有限的知识,大多数文章认为超高维指的是变量个数呈指数阶增长,而非多项式阶,即p=O(exp(n^c)),这里c>0,也就是通常的NP问题,而在理论的证明中却限制c满足:0<c<1, 然而,有文献称log(p)/n 趋于0(即0<c<1的情形)只属于高维情形,而非超高维,在理论上如何真正做到c>1或者c>>1的情形?
c是否大于1,根本不重要。这也就是一个理论上的说法,说:您看啊,我可以让变量个数很高很高哦。在真实的数据中,鬼才知道c=??. 所以,千万别钻牛角尖,dont' take it too serious.
(2)对于p>>n,通常是对变量先进行筛选(screening) 然后在进行估计,现在是否能够办到对于超高维数据同时进行筛选和估计?
理论上总是可以的,值得去努力一把。但是,和先Screening再Selection相比,改进的意义多大?
(3) 就目前您所了解的研究现状而言,您能否介绍一下处理超高维数据已经出现了哪些方法(除了SIS, Forward regression)
这方面除了很多新的工作。可以看看:jianqing fan and runze li 的主页,很多工作。
(4) 有文章提到,通常在模拟中表现得非常好的方法却在预测上并没有表现出优势,请问这主要是哪些原因造成的?这是否可以说明模型的sparsity assumption在实际数据中并不能很好的被满足。
because: every model is wrong:-)