有一变量,本为数值型,但其中包含了几个记录为非数值型,如+,|,因此,转入stata中,整个变量被定义为字符型。如果数据量非常大,通过肉眼基本上无法完全识别哪些记录中含有非数值的记录,即可能还含有其它比较奇怪的记录,如#¥等,如何通过程序来查找?最终将该变量其变成数值型变量?
您上次在问题中建议逐一识别,但如果数据量非常巨大,逐一检查的效率是很低的,有没有相关的程序来处理。
我还发现有些记录为空格,但我不确定其为几个空格,如何将其统一改成"."缺省值?
stata对记录为空格与"."的处理方式有何差别?
谢谢。