经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
如何用R把大量的学生数据转换为序列模式挖掘的格式?
楼主
leejy324
1803
3
收藏
2017-03-14
悬赏
20
个论坛币
已解决
大家好。我现在手上有3万多个学生做题的数据如下图:
Learning events中的四个字母意义分别是: L 系统提示,C 答对,W 答错,E 学生寻求帮助。 夹在两个下划线中间的数字代表学生做题所花费的时间。其余数字都是学生的目前得分。
问题: 如何把上面的数据转换成如下格式呢??
因为我想转换成这种格式做sequencial pattern mining. 请问一下该怎么做呢?我是数据挖掘的新手,非常感谢大家的帮助!
最佳答案
cheetahfly
查看完整内容
library(tidyverse) library(stringr) data %>% mutate(s = str_extract_all(Learning_events, pattern = "[LCWE]")) %>% select(-Learning_events) %>% unnest(s) %>% group_by(Student_ID) %>% mutate(Time = row_number(), value = 1L) %>% spread(key = s, value = value, fill = 0) %>% select(Student_ID, Time, Item, L, W, E, C)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
cheetahfly
2017-3-14 03:31:27
library(tidyverse)
library(stringr)
data %>%
mutate(s = str_extract_all(Learning_events, pattern = "[LCWE]")) %>%
select(-Learning_events) %>%
unnest(s) %>%
group_by(Student_ID) %>%
mutate(Time = row_number(), value = 1L) %>%
spread(key = s, value = value, fill = 0) %>%
select(Student_ID, Time, Item, L, W, E, C)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
leejy324
2017-3-14 03:42:09
图挂了。我用文字打出来:
原始数据如下。
Student ID Item Learning events
1 alge209 0L_3_0C_47_1C_59_3
2 alge209 0L_3_0C_18_1C_22_3C_17_5
3 alge209 0L_9_0C_81_1W_107_0E_3_0C_67_1C_59_3
4 alge208 0L_667_0E_24_0C_459_1C_190_3C_164_5
我想转换成如下这样:
StudentID Time Item L W E C
1 1 alge209 1 0 0 0
1 2 alge209 0 0 0 1
1 3 alge209 0 0 0 1
2 1 alge209 1 0 0 0
2 2 alge209 0 0 0 1
2 3 alge209 0 0 0 1
2 4 alge209 0 0 0 1
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
chuanyinworkday
2017-3-14 04:27:42
http://nianjian.******/tags.php?/%E7%A6%8F%E5%BB%BA%E7%9C%81%E7%AC%AC%E4%BA%8C%E6%AC%A1%E5%85%A8%E5%9B%BD%E5%86%9C%E4%B8%9A%E6%99%AE%E6%9F%A5%E8%B5%84%E6%96%99%E6%B1%87%E7%BC%96/1/13489435936/
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
序列模式挖掘算法简介
数据转换
请教如何用R语言做序列模式挖掘?
请教:如何用R做序列模式?
序列模式程序
序列模式算法问题请教与讨论
数据转换求助!!
请教连老师数据转换问题
R中如何整理面板数据?
求教如何用R语言把CPI的同比环比数据转换为定基数据呢?
栏目导航
R语言论坛
行业分析报告
真实世界经济学(含财经时事)
经管文库(原现金交易版)
休闲灌水
金融学(理论版)
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
文本分析:从经管顶刊“加分项”到学术发表 ...
【AI Agent可靠性】 智能体Agent记忆系统: ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
哈耶克作品集 6本 含通往奴役之路、自由宪章 ...
25秋投资学回忆
博观研究院2025年中国跨境进口保健品市场分 ...
南大CSSCI(2025-2026)来源期刊目录及扩展版
PromptCoT-2.0-SFT-4.8M 监督微调提示 SFT ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群