钟山隐者 发表于 2021-4-7 23:00 
楼主,我已经购买了你的数据,但是我有疑问。会计师事务所是否国际四大以及国内十大的数据好像有错误,我只 ...
您好,我也查看了这几个变量,从原始数据来看确实是这样的,当然国泰安的数据也可能存在错误,数据处理在代码的1.4这部分,是严格遵循原始数据的。当然,还有一种替代的方法就是利用正则表达式或者subinstr函数,把事务所含有四大或者十大的缩写的提取出来并赋值为1,其他的取0。我查了一下,国际四大的相对好处理一些,因为四家很稳定;国内十大每年可能有变动,需要搜集一下名单,然后分年度进行处理~