全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅
5271 4
2012-12-02
悬赏 300 个论坛币 未解决
本人最近自己实现一个logistic回归的算法.logistic回归算法求解还是搞定了.但是对于如何求参数的误差始终找到头绪和资料.由于本人是学计算机的,数学基础并不是很好.线性回归的书,如:Logistic回归模型——方法与应用 ;例解回归分析; 都看了一下,都没找到好的方法.由于需要实现功能而不是仅仅用spss来实现,所以需要知道原理


如有大牛能解决这个问题,感激不尽.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-2 21:10:20
我不是专业学统计的。但是,我想可能贝叶斯(bayesian)方法可以提供帮助。

贝叶斯可以用来估计任何模型(当然可包括LOGISTIC回归)的参数的置信区间,就是可以根据数据算出(有时是估算)模型参数的分布情况(所谓"posterior distribution",中文常翻成:后验分布),从而根据其后验分布算出(有时是估算)该参数的置信区间(其实这方法可以把该参数的期望,标准差,各个分位点都能算或估算出来)。之所以说有时是估算,因为后验分布很多情况下不是常见的分布(比如正态)。

这样,是否就相当于求出了各参数的“误差”了(其实不仅仅是某种衡量误差统计量,而可以是整个分布了)。

GOOGLE一下,在论坛中搜索,都能找到贝叶斯数据分析方法的有关资料。当然,要了解这方法,还需要花点时间看书的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-2 23:42:45
TaskShare 发表于 2012-12-2 21:10
我不是专业学统计的。但是,我想可能贝叶斯(bayesian)方法可以提供帮助。

贝叶斯可以用来估计任何模型( ...
感谢回复.本人也是非统计专业的,我先按照你提供的思路看看.如果确实可行,感激不尽.不过为什么要分析每个参数的误差呢?这样可以算出每个参数的置信度,这样有些参数就和估计不相关,可以去掉.
例如:  时间x1,性别x2,年龄x3三个参数来预估点击情况,最后得出的情况是   a0+a1*x1+a2*x2+a3*x3
这时算出a2其实是统计不显著的,那么性别这个属性就可以去掉.
如果利用spss工具可以实现,但是如果要在实际中应用,可能需要自动处理很多个公式,这种就需要自己来实现这个算法了.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-3 23:37:13
killalllsd 发表于 2012-12-2 23:42
感谢回复.本人也是非统计专业的,我先按照你提供的思路看看.如果确实可行,感激不尽.不过为什么要分析每个参 ...
供你参考:可以用WINBUGS软件(GOOGLE找到后可以免费下载)来做Bayesian数据分析。你告诉它模型和数据,它会自动算后验分布,不用你一步一步推导。我用过该软件,还不错(当然,使用不当也会运行出错)。

同意你对误差的看法。我觉得如果用Bayesian分析,其结果中,如果某个参数的估计置信区间是跨过0的(例如置信区间是(-0.5, 1)),可能就是表明那个参数不显著(即不能排除可能是0)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-4-25 21:59:50
楼主解决了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群