经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
求教关于数据清理的问题
楼主
18174715760
1603
2
收藏
2022-05-12
求教呀~~~
图1 是在线酒店的功能属性的一些变量, 为了跟图2的每年的收益、入住率等变量cbind在一起,我需要先将图1转化成按年分的形式(现在是一个酒店id号只对应一个观测值)。我的计划是按照host_since来分,host_since<=2019为2019年的,host_since<=2020为2020年的, host_since<=2021为2021年的,分好之后再跟图2 的数据集根据id和year两个变量,合并在一起,这可以怎么操作呢?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
llb_321
2022-5-12 14:05:34
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
3、划分年度后,需要统计哪个变量作为年度数据。
明确后:
1、变量host_since可能需要转为POSIXct时间格式,即可计算;
2、可以考虑cut()函数,也可以用group_by()函数分组;
3、分组、统计,可以参考之前的代码;
4、统计后,可以用left_join()函数,与另一个数据集建立连接。
具体可以参考:《R数据科学》中文版第3章、第9章。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
18174715760
2022-5-12 14:56:12
llb_321 发表于 2022-5-12 14:05
考虑:
1、您的三个划分标准,有重叠;
2、需要分组吧,比如用host_id;
谢谢呀,我大概清楚这个思路了,我找这本书来看看
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
求教有关sas数据清理的问题
数据清理
关于使用SAS进行数据清理的书籍
SAS书籍
数据清理及SAS实现
求助,数据清理做法
求助:采用R进行数据清理的相关书籍
求sas大神帮忙解决数据清理问题
面向信息检索需要的网络数据清理研究
栏目导航
R语言论坛
经管文库(原现金交易版)
爱问频道
商学院
学道会
经管高考
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
文本分析:从经管顶刊“加分项”到学术发表 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
哈耶克作品集 6本 含通往奴役之路、自由宪章 ...
博观研究院2025年中国跨境进口保健品市场分 ...
南大CSSCI(2025-2026)来源期刊目录及扩展版
货币--是如何产生成长发展的和人类的四大工 ...
【详细整理,24重磅!】1990-2024上市公司市场 ...
量子科技行业深度报告-量子革命:量子科技的 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群