自变量是估计值，应该怎么处理？

LouDeng

1898

收藏 2014-07-08

我现在的自变量是估计值，不是准确值。
如，

商家	销售额	销售人员	服务次数（次/每月）
A	$10,000	1	1,000
B	$50,000	1	3,000
C	$30,000	4	2,000
D	$500,000	3	2,500

以上数据中的销售人员可能由于统计误差原因等等，比如说，商家A可能有2名销售人员，但是数据库统计时，只统计了1名。商家D可能有5名销售人员，但是数据中只有3名。

同样，服务次数也是估计值，比如商家A的每月的服务次数可能是1,104次，但是预估成了1,000次。

请问，这样的数据应该怎么处理从而进行比较理想的回归分析？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

EchoEstelle

2014-7-8 14:42:27

回归分析的目的是什么？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

yangyuzhou

2014-7-9 08:52:18

如果不是准确值，而且知道统计误差出现在什么地方，应该尽量避免这些出现误差的统计结果出现，而用误差出现之前的结果进行替代；当然，样本进行计量分析时，统计误差是不可避免的，只要你能证明这个统计误差足够小也可以使用。像你举例的这几种可能，如果是从统计数据中得到的第一手资料就是这样的话，不妨假设这份统计数据是真实有效的，进行尽量分析之后再讨论可能存在的误差以及规避的方法。其实很多论文的数据一样有问题，没有真正完全无误差的数据存在，就看你自己怎么取舍了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

LouDeng

2014-7-11 22:34:31

yangyuzhou 发表于 2014-7-9 08:52
如果不是准确值，而且知道统计误差出现在什么地方，应该尽量避免这些出现误差的统计结果出现，而用误差出现 ...

thx for replying. Cannot type Chinese right now.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群