全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3190 4
2014-12-24
悬赏 50 个论坛币 未解决
向各位高手请教:

想要用R语言来检查大量数据的质量,具体想检查的项目为:
  • 每个文件数据的字段总数(因为有很多个数据文件,每个文件字段数会有不同);
  • 各字段的数据量(有多少条数据);
  • 数据的完整性:多少个字段有数据缺失(空值)、数据缺失的比例;

十分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-24 16:48:50
如果要查看多少行数据,可以用nrows;查找缺失值可以用is.na,完整数据集是complete.cases
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-25 09:21:34
李会超 发表于 2014-12-24 16:48
如果要查看多少行数据,可以用nrows;查找缺失值可以用is.na,完整数据集是complete.cases
能再说的详细点吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-25 09:30:31
zwj1012 发表于 2014-12-25 09:21
能再说的详细点吗
如果你一点R基础都没有的话,我觉得多说无益,如果有点R基础的话,上面那些话就够了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-25 09:45:17
李会超 发表于 2014-12-25 09:30
如果你一点R基础都没有的话,我觉得多说无益,如果有点R基础的话,上面那些话就够了
谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群