全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1753 3
2014-07-08
我现在的自变量是估计值,不是准确值。
如,

商家 销售额销售人员 服务次数(次/每月)
A $10,000 1 1,000
B $50,000 1 3,000
C $30,000 4 2,000
D $500,000 3 2,500


以上数据中的销售人员可能由于统计误差原因等等,比如说,商家A可能有2名销售人员,但是数据库统计时,只统计了1名。商家D可能有5名销售人员,但是数据中只有3名。

同样,服务次数也是估计值,比如商家A的每月的服务次数可能是1,104次,但是预估成了1,000次。

请问,这样的数据应该怎么处理从而进行比较理想的回归分析?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-8 14:42:27
回归分析的目的是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-9 08:52:18
如果不是准确值,而且知道统计误差出现在什么地方,应该尽量避免这些出现误差的统计结果出现,而用误差出现之前的结果进行替代;当然,样本进行计量分析时,统计误差是不可避免的,只要你能证明这个统计误差足够小也可以使用。像你举例的这几种可能,如果是从统计数据中得到的第一手资料就是这样的话,不妨假设这份统计数据是真实有效的,进行尽量分析之后再讨论可能存在的误差以及规避的方法。其实很多论文的数据一样有问题,没有真正完全无误差的数据存在,就看你自己怎么取舍了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-11 22:34:31
yangyuzhou 发表于 2014-7-9 08:52
如果不是准确值,而且知道统计误差出现在什么地方,应该尽量避免这些出现误差的统计结果出现,而用误差出现 ...
thx for replying. Cannot type Chinese right now.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群