全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1462 4
2022-05-20
悬赏 5 个论坛币 未解决
求教各位大神!
我有两列数据,第一列是年代,第二列是微量元素含量的变化
但这个数据年代不是等间距的

想请教,如何把数据转换为0-100,每5年一个间隔的数据呢?用线性插值的方法。

数据如图:

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-20 16:52:12
图片好像没显示出来,重新上传!
附件列表
微信图片_20220520165147.png

原图尺寸 13.1 KB

微信图片_20220520165147.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-21 08:20:01
数据是随机波动的,插值结果的准确性根本无法评估,那么插值结果也没有统计意义。除非数据量大,可以从中发现某种周期性模式。
就用原始数据吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-21 11:54:50
llb_321 发表于 2022-5-21 08:20
数据是随机波动的,插值结果的准确性根本无法评估,那么插值结果也没有统计意义。除非数据量大,可以从中发 ...
我只是举了一个数据的例子,数据量还是很大的。
我是做古环境的,是几万年来的数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-22 17:12:33
syhlxhx1 发表于 2022-5-21 11:54
我只是举了一个数据的例子,数据量还是很大的。
我是做古环境的,是几万年来的数据。
1. 插值的代码实现,没有技术障碍,可以利用tidyr包的full_seq()生成完整的时间序列,并与原缺失的时间序列合并,再用dplyr包的fill()简单填充,或采用均值或分位点填充。但是这种方式生成的数据,属于人造的,尤其是缺失值太多的话。
2. 换个思路,既然数据量很大,不如用原始数据,按固定时间间隔分组,再取各间隔的均值作为分析的基础,也就是做些平滑处理。当然也可以用这个均值作为上一种处理的插值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群