全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1603 2
2022-05-12
求教呀~~~

图1 是在线酒店的功能属性的一些变量, 为了跟图2的每年的收益、入住率等变量cbind在一起,我需要先将图1转化成按年分的形式(现在是一个酒店id号只对应一个观测值)。我的计划是按照host_since来分,host_since<=2019为2019年的,host_since<=2020为2020年的, host_since<=2021为2021年的,分好之后再跟图2 的数据集根据id和year两个变量,合并在一起,这可以怎么操作呢?



截图20220512120550.png
截图20220512120616.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-12 14:05:34
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
3、划分年度后,需要统计哪个变量作为年度数据。
明确后:
1、变量host_since可能需要转为POSIXct时间格式,即可计算;
2、可以考虑cut()函数,也可以用group_by()函数分组;
3、分组、统计,可以参考之前的代码;
4、统计后,可以用left_join()函数,与另一个数据集建立连接。
具体可以参考:《R数据科学》中文版第3章、第9章。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-12 14:56:12
llb_321 发表于 2022-5-12 14:05
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
谢谢呀,我大概清楚这个思路了,我找这本书来看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群