可以参考http://www.docin.com/p-500572197.html其中提到的非参数bootstrapping 举例,对 小数据 建模还是很管用的。
比如我们有10年的数据,想推算200年一遇的损失。如果单纯用10年的数据,参数风险会是非常大的。这个时候,我们可以利用bootstrapping,把数据重新抽样出来一些,这样,就可以得到200年一遇损失这个变量的自己的分布了。从而根据这个分布,再对200年一遇的损失做统计推断。
同样的问题存在于再保险合同的重大保险风险ERD测试中,很多人用仅仅短短的10年不到的数据去推导 ERD ,由于ERD 类似于 TVaR 对尾部参数的敏感性很高,所以,如果单纯用10年数据去计算 ERD 1% 就会有很大的参数风险。因此,还是推荐使用 bootstrapping技术,把损失模型的参数不确定性做出来,然后再用含有参数不确定性的损失模型去计算ERD。
否则,就像我们用10年的数据去推导100年一遇的地震风险一样,只看到一个汶川地震和玉树地震,谁敢保证100年一遇的地震风险没有被低估呢?
用“小数据”去做“大尾部”,毕竟和用“小数据”去估计“均值”是两个概念,其中的参数风险,一定要被关注。
文章摘自:精算部落