经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
求教关于数据清理的问题
楼主
18174715760
1675
2
收藏
2022-05-12
求教呀~~~
图1 是在线酒店的功能属性的一些变量, 为了跟图2的每年的收益、入住率等变量cbind在一起,我需要先将图1转化成按年分的形式(现在是一个酒店id号只对应一个观测值)。我的计划是按照host_since来分,host_since<=2019为2019年的,host_since<=2020为2020年的, host_since<=2021为2021年的,分好之后再跟图2 的数据集根据id和year两个变量,合并在一起,这可以怎么操作呢?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
llb_321
2022-5-12 14:05:34
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
3、划分年度后,需要统计哪个变量作为年度数据。
明确后:
1、变量host_since可能需要转为POSIXct时间格式,即可计算;
2、可以考虑cut()函数,也可以用group_by()函数分组;
3、分组、统计,可以参考之前的代码;
4、统计后,可以用left_join()函数,与另一个数据集建立连接。
具体可以参考:《R数据科学》中文版第3章、第9章。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
18174715760
2022-5-12 14:56:12
llb_321 发表于 2022-5-12 14:05
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
谢谢呀,我大概清楚这个思路了,我找这本书来看看
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
求教有关sas数据清理的问题
数据清理
关于使用SAS进行数据清理的书籍
SAS书籍
数据清理及SAS实现
求助,数据清理做法
求助:采用R进行数据清理的相关书籍
求sas大神帮忙解决数据清理问题
面向信息检索需要的网络数据清理研究
栏目导航
R语言论坛
经管文库(原现金交易版)
经管高考
CFA、CVA、FRM等金融考证论坛
站务与外事
求助成功区
热门文章
在概率与代码之间:Agent Skills 是 AI 的枷 ...
法兰西数学精品译丛09-概率与位势(第Ⅰ卷) ...
表格结构数据特征与CDA数据分析师:精准适配 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
问卷填写,每份50个论坛币
新宏观丨豆包,传统经济学与商学对全球性债 ...
硅光芯片代工爆发式增长,重构全球半导体产 ...
新宏观丨豆包,谁是传统经济学的最大反对派
失去的三十年:平成日本经济史(【日】野口 ...
中国力量席卷全球- 绿色赋能地产先行 掀起全 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群