全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2526 4
2020-09-14
我这有一份数据类型为,日期时间:2018/1/1  00:00:00--2020/9/1  14:00:00,每天每间隔一小时就有一组数据,然后自变量有污水排放量(吨)、氨氮值、总氮、总磷、PH值。数据量有两万多个,我一画出折线图就一团黑,量太大了,都看不出趋势是什么样子,哪个时间段的值比较异常之类的。而且不太会图怎么画。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-9-16 20:03:54
24*30*32,大约23000个样本,这么多数据挤在屏幕上,平均每个象素的宽度里有20个数据点,点之间再连成线,当然会黑乎乎的一大片。
所以,一种办法是把数据分割开来,一段段地显示,另一种办法是横向滚动显示。
第二种办法,github上有个包,Streagraph,我没用过,大概可以实现,你找找看吧。
第一种方法,将原始数据按年、月分组,然后利用ggplot2的facet_grid(year~month)分面显示,这样每个月的分面图中可以画出720个数据点,通常你的数据应该是稳定的,异常值会很明显。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-9-16 20:22:31
我试了个12000个样本的,每个分面图100个数据点,横向是月份,纵向是年度
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-9-17 22:24:27
复制代码

示例数据的动态图如下:
example.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-9-18 19:19:41
复制代码

可以试试保存到矢量图,宽度、高度设多少,自己尝试调整下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群