今天在清洗数据的时候,发现清洗后的数据框每行的数据类型是
[size=13.3333px]"data.frame",每列的数据是[size=13.3333px]"character",这种格式就不能用于计算。我首先检查每列的数据有没有多打一个小数点,因为遇见好几次纯数字的数据类型是字符串都是多打了一个小数点。[size=13.3333px]
[size=13.3333px]1.检查数据格式:
把数据生成csv文件,检查后发现数据果然有问题,这次是逗号(呜呜╥﹏╥,每次清洗数据都有小惊喜)
(果然最强的数据处理工具还是excel表格吧)
那我们再检查一下每列的数据类型:
结果还是没变,每列都是字符串。
2.转换数据格式:
使用apply函数对列进行操作,将所有列转换成数值型。
该函数第一个元素是数据,第二个元素代表列(如果是对行操作就是数字1),第三个元素代表进行何种操作,它的意思就是对每列进行数据类型转换,转换成数值型。这一步会把列名消去,只需要用rownames()修改列名就好。