全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1055 3
2016-02-19
知道了样本取值情况(大数据),可以估计其均值,方差,峰度,偏度没问题,现在需要考虑的是,我用一个常数c去代替整个数据取值情况,如何考虑误差,如何计算,是直接去考虑该值对均值的偏离吗???如何计算误差和相关概率,具体分布是不知道的,只知道样本取值情况???请高手帮忙解答下
  有人提议去估计分布,参数均值这些,问题是分布无法估计啊,不是正态分布这些,如何考虑这个问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-20 00:36:06
用常数c显然是不行的,需要用一个随机变量,然后估计总体分布。至于分布如何估计,推荐lz看一下wiki条目:Cornish-Fisher expansion
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-20 17:03:53
foozhencheng 发表于 2016-2-20 00:36
用常数c显然是不行的,需要用一个随机变量,然后估计总体分布。至于分布如何估计,推荐lz看一下wiki条目:C ...
楼上朋友,没搞明白,这个问题是样本集,我们一般用均值做他的代表,现在用一常数c做代表了,如何计算中间的误差,概率等等,样本分布是不知道的,我检验,一般不是正态分布或者其他分布,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-21 17:42:26
benlandak 发表于 2016-2-20 17:03
楼上朋友,没搞明白,这个问题是样本集,我们一般用均值做他的代表,现在用一常数c做代表了,如何计算中间 ...
用常数c的话不大好估计误差,但是如果用均值的话是可以的。通过bootstrap方法,不断地对sample做resample,每次resample的结果都计算其平均值,这样就可以得到sample mean的一个集合,以这个集合的经验分布为sample mean的分布,就可以计算sample mean的均值和方差,进而估计用sample mean代替sample的误差。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群