全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
2644 1
2010-08-10
一个小小的小问题:我的样本是我国上市公司,各个行业都有。我从Wind数据库下了行业代码,但都是字母表示的,stata不认,加Dummy的时候咋办呢?
还有,stata中如果某个样本点个别变量数据缺失,用-999替换后,能不能保证stata不把样本点删去呢?另外-999会不会影响系数估计呢?

另外,一个问题想和您讨论,俺们学校滴统计大牛讲课时曾曰:“区分样本总体和子样本是一个易错的地方。”老师举了一个例子:比如研究预开航城市哪些真正适合建机场时,商务部给了100多个预开航城市的名单,这个时候你研究的问题是预开航城市的确定问题,所以这100多个城市就是你的样本总体,总体不是全国的全部城市。

我就在想,那只要我说我研究某某问题岂不是就可以随便自己确定样本总体了么?比如,我研究中小企业,那全部中小企业就是我的样本总体,我研究制造业中的中小企业,那制造业中的中小企业就是我的样本总体??这样太。。。。。

我之所以有这个问题,是因为在Bootstrapping时,您说Bootstrapping一定要random sample,因为我取样时是从中小企业中挑的,那么按我们老师的说法我是randomsample,若认为全部上市公司是样本总体,那我绝对有偏抽样了,用不了Bootstrapping了。希望聆听您的意见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-8-11 21:18:45
viking1111 发表于 2010-8-10 21:56
一个小小的小问题:我的样本是我国上市公司,各个行业都有。我从Wind数据库下了行业代码,但都是字母表示的,stata不认,加Dummy的时候咋办呢?
A: 这些内容在 Stata 初级视频数据处理部分都有详细的讲解。
你可以采用 encode 命令把 wind 数据库中的字符型行业分类变量转换为数值型,stata会自动生成数字-文字对应表。

还有,stata中如果某个样本点个别变量数据缺失,用-999替换后,能不能保证stata不把样本点删去呢?另外-999会不会影响系数估计呢?
A: 对于缺失的观察值,stata 会自动以 . 来表示,它们不会参与统计分析和回归分析。然而,如果你强制性地把这些缺失值修改为 -999,它们会参与回归分析,进而影响系数估计值。
采用 mvdecode 命令可以一次性把 -999 替换为 . 。

另外,一个问题想和您讨论,俺们学校滴统计大牛讲课时曾曰:“区分样本总体和子样本是一个易错的地方。”老师举了一个例子:比如研究预开航城市哪些真正适合建机场时,商务部给了100多个预开航城市的名单,这个时候你研究的问题是预开航城市的确定问题,所以这100多个城市就是你的样本总体,总体不是全国的全部城市。
A: 我同意这个观点。

我就在想,那只要我说我研究某某问题岂不是就可以随便自己确定样本总体了么?比如,我研究中小企业,那全部中小企业就是我的样本总体,我研究制造业中的中小企业,那制造业中的中小企业就是我的样本总体??这样太。。。。。
A: 所谓的母体,与你对研究对象的界定有关系。你的老师说的其实就是这个意思。

我之所以有这个问题,是因为在Bootstrapping时,您说Bootstrapping一定要random sample,因为我取样时是从中小企业中挑的,那么按我们老师的说法我是randomsample,若认为全部上市公司是样本总体,那我绝对有偏抽样了,用不了Bootstrapping了。希望聆听您的意见
A: 在研究中小企业特征时,你关注的是中小企业分布特征,此时可以把这些企业视为母体,这并不影响你使用bs.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群