全部版块 我的主页
论坛 经济学人 二区 高级会员区 学者专栏
14315 25
2013-07-18
钟威Wei Zhong (William),Assistant Professor.
The Wang Yanan Institute for Studies in Economics (WISE) Department of Statistics, School of Economics(SOE)Xiamen University

Education
Ph.D. in Statistics, Department of Statistics, Pennsylvania State University, State College, PA, 2012
Advisor: Professor Runze Li
B.S. in Statistics, School of Mathematical Sciences, Beijing Normal University(BNU), Beijing, China, 2008

Research Interests
> High/Ultra-high dimensional data analysis: large p small n problems
> Econometrics and Financial Econometrics
> Nonparametric and semiparametric models
> Large covariance matrix estimation
> Applications of statistics in business analytics, information science, finance etc.


问答汇总:
Q1:坛友tony2008:
请问国内的高频交易发展前景如何,如何做好统计套利,寻找 Alpha?
A1:
你好!我还没有涉及到这个方面的研究,但是就我所知现在国际上国内对于量化投资这一方面的研究和实证都是很热门的。我的同事 WISE的陈海强教授对这方面有研究,所以我觉得前景应该还是很好的。统计套利这一块,我知道一本书《统计套利》 安德鲁•波尔(Andrew Pole)等,你可以买来看看,也许有帮助。但是,我认为所有的量化分析、统计套利都不可能是稳赚不赔的,否则大家都去做统计去了!

Q2:坛友sen1898114:
请教钟老师:用三点平滑处理后的数据做出预测值以后,如何还原?
A2:
不好意思,我没有太明白你的问题,你是说做spline regression样条回归分析吗?非参数回归?
可以建议一本入门很好的书,康奈尔大学David Ruppert教授的《Semiparametric Regression》


Q3:坛友zhoubuer2008:
那俺弱弱的问一个问题吧:对于变量数较多,样本数目极少的情况,如何对变量进行降维处理。例如:变量数有29个,而样本数目只有14组,传统的主成分分析和因子分析完全无能为力,怎么破?

A3:
这个问题问的很好,也是过去20多年统计界很热门的研究方向: high dimensional data analysis, penalized regression and regularization methods. 具体的话,如果变量个数大于样本量的时候,一般最小二乘就不能用了饿,如果做回归分析,可以用加惩罚项的回归分析,例如 LASSO (Tibshirani 1996), SCAD (Fan and Li, 2001)。最近几年,有很多关于超高维数据的分析研究,就是变量个数远远大于样本量,这样的方法可以采用 independence screening的方法先做一次,可以看看Fan and Lv (2008), Li, Zhong and Zhu(2012)等。最后建议你看看这个综述的文章,Fan, J., Lv, J., and Qi, L. (2011)
Sparse high-dimensional models in economics.
Annual Review of Economics, 3, 291-317
链接:http://orfe.princeton.edu/~jqfan/publications-general.html


Q4:坛友swei007:
我想问一下,对于多维数据的处理,降维除了用主成分,因子分析,神经网络之外还有什么其他的方法比较常用的。
A4:
针对高维数据分析,主要现在有两大类方法:降维(dimension reduction),这一类就是有点像PCA,主成分分析一样,找一些变量的线性组合作为一个新的变量,可以参看 Dennis Cook, Bing Li, Xiangrong Yin等统计牛人文章;另一个方法做的人更多了,就是 变量选择(variable selection),可以首先看看 这个综述的文章,Fan, J., Lv, J., and Qi, L. (2011)
Sparse high-dimensional models in economics.
Annual Review of Economics, 3, 291-317
连接:http://orfe.princeton.edu/~jqfan/publications-general.html
其次推荐你看看 The Elements of Statistical Learning:
Data Mining, Inference, and Prediction.
Second Edition by Trevor Hastie, Robert Tibshirani, Jerome Friedman


Q5:坛友dnq:
请问钟老师,面板数据的固定效应分析,如果数据为非平稳的,估计结果,可能会出现什么问题?期限较短如5年的面板数据是否需要进行平稳性检验,其固定效应分析是否是可靠的。
A5:
不好意思,我自己现在做面板数据做的很少,所以不能回答你的问题。
建议看看 萧政老师的 面板数据分析 一书
<Analysis of Panel Data> CHENG HSIAO


Q6:坛友孙泽茂:
老师:一个表的数据量很大,要对它进行多维分析,这个怎么处理比较好,不会有性能问题 将大表按一定的规则分成小表处理是不是好,还有其他更好更优的处理方法吗?谢谢!
A6:
这个表是指什么表?如果你是想做描述性的分析,例如列联表,你当然可以分类处理,变成小的表格;但是如果你的表是指 数据矩阵,指的是很多变量,需要作回归分析,那么就是高维数据分析的问题,你可以参见我之前的回复,看看这方面的回答。

Q7:坛友穷小子6:
老师,你好,我本科是非211的山西财经,今年二战人大国经调剂到吉林财经的西经,导师学术一流,建议走学术,但是,本硕都非211,毕业后的前景实在堪忧,学历查三代是很恐怖的事情,我应该放弃吉林财经,转考南京大学或其他学校吗?真诚希望您可以给个建议!
A7:
关于学历查三代的问题,我也有所听闻,其实在美国也有类似的现象。你是准备去吉林财大读硕士吗?我的个人建议,仅供参考:看看你的未来职业规划是什么,如果是硕士毕业去业界就业,那么我觉得上吉林财大可以的,毕竟找工作还和自己的其他素质很大关系;如果你想走学术道路呢,我是希望你读越好的学校越好,读了硕士,能出国读一个博士更好,如果不行,国内博士期间去国外访问1-2年,也可以毕业去国外做个博士后,这个对未来在高校就业有帮助。祝你成功。
坛友穷小子6:
是的,老师,我已经收到了吉林财大的硕士录取通知书,西经的学术带头人-丁堡骏老师,不知道您听过没有,有学姐说丁老师学术很强,可以帮助有学术潜质继续深造的同学去清北读博士,据我知,他是研究经济转型方面的。就目前,我也不确定硕士毕业是走实业还是学术,如果学术的话,如果是清北的博士,本硕非211,也很难进好点的高校,您说是吧?感谢老师繁忙之余解答!
A:
我部分同意你的说法。如果是清北的博士,找工作的时候是有帮助;但是其他好的高校的好老师,还有中科院的博士,也是具有相当竞争力的。其次,现在的就业趋势还是希望博士有海外的经历,所以建议你去国外访问,联合培养,或者博士后,如果有机会的。PS:个人建议,不代表WISE的意见。

Q8:坛友扶夏:
国内量化交易常常把程序化交易和高频交易对等起来 想请教下老师 国外量化交易是什么情况呢 高频交易中模型的建立和低频是否一样呢
A8:
正如我之前的回复,不好意思,我自己对量化投资不是很了解。如果真的很感兴趣的话,可以问问我的同事WISE陈海强教授,也可以了解下国内量化投资的会议。就我所知,高频交易数据分析还是很重要的,国内国外有很重视。

Q9:坛友xixi221zmw:
请教,对于统计软件的选择,能给些建议吗?谢谢
A9:
好问题,如果做Research 建议用R,但是如果高端一些的话,会C++也很有帮助;也有些研究人员用matlab,R的好处就是很多free statistical packages,很多现成的functions,matlab的好处就是处理矩阵会更好;当然现在还有并行运算的出现,可以提高R的运算能力;业界的话,美国大公司一般都是用SAS,现在也有人用R了,我知道国内的公司研发部门也有用SAS和R的,比如Baidu

Q10:坛友紫雨abc:
请教钟老师:1、怎样针对一类实际问题确定寻找低维构造的准则?2、如何判断所找到的低维构造能否真实?谢谢~
A10:
1. 我没有太明白你说的低维构造的准则是指什么?是不是就是subset selection回归中的AIC,BIC这些准则吗?一般来说如果是做variable selection,就是penalized regression的,大家用BIC的多些,因为它有consistency的性质,见Wang,Li and Tsai 2007 的文章;后来还有各种IC系列,什么EBIC等等,都可以看看;
2. 我觉得很难说什么是一个真实的模型,模型都是假设出来,只要有用就好了。如果你要做预测,你可以通过把你的data分为 training 和 testing data,然后做一下cross validation,这样可以看看你的模型是不是有比较好的预测。


Q11:坛友紫雨abc:
请教钟老师:似然方式在半参数情况,能不能达到简单参数情况的优良性质?怎样才能达到?
A11:
我不是特别了解这个问题,不好意思。我知道有人用empirical likelihood去估计半参数回归,建议你可以搜一搜相关的文章;我个人倾向于把非参数部分用样条展开去估计,这样就可以变成参数回归了,这个可以看看 David Ruppert的 《 Semiparametric Regression 》这本书,希望有所帮助。

Q12:坛友1018760572:
我想问下您是怎么看待人的性格养成这个问题的
A12:
这是一个和其他人不一样的问题,呵呵。 我觉得呀,天生+后天吧。后天更重要的,主要是生活环境和经历的事情吧。比如,父母的性格就对孩子的性格影响很大。

附件: 您需要登录才可以下载或查看附件。没有帐号?我要注册
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-18 16:30:23
老师,你长的真帅,很遗憾没修你的课!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-19 07:04:52
学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-19 09:03:16
学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-19 09:17:11
学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-19 09:54:01
看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群