vincenhe 发表于 2013-5-3 05:49 
张老师您好,学生也对数据挖掘与MCMC十分有兴趣。
1. 很多数据挖掘的方法,由于它算法本身隐藏性,很多应 ...
1、非参数的方法对分布的假设相比于参数模型来说更少,但参数估计的收敛速度更慢,在实际应用中非参数方法的估计/预测效果未必比参数模型好。“简单的MSE”,你是指没有模型而用数据均值估计所有数据点所得到的MSE吗?通常情况下,有模型都会更好一些。除了用testing set之外,还可使用cross validation等方法。
2、时间序列方面的数据我分析得比较少,我觉得ARIMA模型对很多时间序列的分析就不错,贝叶斯时间序列模型中dynamic linear model(M. West and J. Harrison的书《Bayesian Forecasting and Dynamic Models》)很好。
3、研究者们不停地在尝试改进MCMC算法的效率。Jun Liu教授写的《Monte Carlo Strategies in Scientific Computing》中就有很多可以改进效率的方法。近年来Variational Bayes另辟路径,不使用MCMC,而使用近似的方法对贝叶斯模型进行推断,时间上花费更少,但估计有偏。