我想请教你两个问题哈,感谢你的解答:
第一,我发现数据的代码好多是X2553309X、21859362X等形式,当我通过real()函数把字符形式转化成数字形式之后,这些带字母形式的代码全部变成了缺失值,这时候我应该怎么办呢?
第二,我发现每一个省份的代码都不规则,好像每一个省份的公司代码都是从小到大排列的,但还夹杂着一些带字母的代码,不像我们从CSMAR等下载的数据代码是从小到大排列的,这时候我要进行回归之前,会tsset id year一下,那么这个时候是不是所有的公司都不在按照省份的顺序排列,而是完全按照全国所有的公司的代码从小到大排列啊,这样的话,那些带字母的代码没法识别大小啊,这些代码该怎么办呢?