全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4692 6
2018-02-10
曾经有一个笑话:
在数据科学中,有80%的时间花在准备数据,20%的时间花在抱怨要准备数据。
这也说明数据探索的重要性,近期,看到国外网站上介绍一个DataExplorer包,转载并推荐一下:
复制代码
注意:如果用的是Microsoft的open R,该包的版本不是最新的。
复制代码
# 连续变量的histogram
001.png 002.png 003.png
复制代码
004.png 005.png 007.png
复制代码
结果我就省略了......
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-10 12:15:49
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-10 22:35:10
cheetahfly 发表于 2018-2-10 10:18
曾经有一个笑话:
在数据科学中,有80%的时间花在准备数据,20%的时间花在抱怨要准备数据。
这也说明数据 ...
好的好的好的好的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-11 18:53:04
不错,谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-4 14:22:39
哈,这个包是真的好用! 推荐做数据分析和数据相关工作的都了解一下.  在我的日常工作中,有很多数据清理特征选择的问题,我就基于这个也写了一个自动化EDA的方法, 可以实现HIVE,MYSQL和local csv读取数据, 输出全表加各个字段(Continuous, discrete features) 的EDA report, 对做数据清理以及特征选择上有很大帮助(至少省去了一下繁琐重复的步骤). 如果有兴趣也可以找交流一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-5 15:13:19
很实用的一个包,谢谢楼主推荐
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群