经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
如何快速入门R语言数据挖掘
楼主
浮世若离丶
14787
78
收藏
2017-09-27
“虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法,凸优化… 感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,
数据挖掘
系统的学习过程是怎么样的,应该看那些书(中文最好)?“
——以上是一位咨询的学员像我们提出的疑问。和这位同学相似,很多同学在入门数据挖掘领域遭到了极大的阻力,也丧失了继续学习的兴趣。那么,
正确入门数据挖掘领域的姿势是什么呢?
这是一个不太好回答的问题,管中窥豹,建议大家看一下以下的一些见解。
一、在学习数据挖掘之前你需要明了的几点:
1. 数据挖掘目前在中国的尚未流行开,犹如屠龙之技;
2. 据挖掘本身融合了统计学、数据库、
机器学习
、模式识别、知识发现等学科,并不是新的技术。
3. 数据挖掘之所以能够应用不是因为算法,算法是以前就有的。数据挖掘应用的原因是大数据和云计算。比如阿法狗的后台有上千台计算机同时运行
神经网络
算法;
4. 数据初期的准备工作,也称Data Warehousing。通常占整个数据挖掘项目工作量的70%左右。在前期你需要做大量的数据清洗和字段扩充的工作。数据挖掘和报告展现只占30%左右;
5. 数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)
二、目前国内的数据挖掘人员工作领域大致可分为三类。
1)
数据分析
师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告;
2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析;
3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。
三、你自己的定位与学习。
基于以上一点的介绍,你大概可以明确你需要努力的方向。如果你不是致力于科研方向,那么你需要掌握如下的技能:
1.需要理解
主流机器学习算法的原理和应用。
按照需要解决的问题,主要分为三大类,见下图:
2.
需要熟悉至少一门编程语言
。如R,Python,SPSS Modeler,SAS,WEKA等。
关于软件,有三个原则:只要能达到目标的软件就是好软件;你研究的领域啥软件好用就用啥软件;不要妄想用一个软件解决所有问题。
3.需要理解数据库基本原理,能够熟练操作至少一种数据库,如Mysql,OracelDB2等。
4.
熟悉数据挖掘常见的运用场景。
如客户生命周期管理、客户画像和客户分群、客户价值预测模型构建、推荐系统设计等。这些需要依托于不同行业。下图位CRM管理运用场景示例:
5. 经典图书推荐
《数据挖掘:概念与技术》、《数据挖掘导论》、《机器学习实战》、《数据库系统概论》、《R语言实战》
当然,如果你能够接触到真实的数据挖掘项目和实战,你的提升将会非常快。CDA数据分析研究院开设的R语言数据挖掘课程,将世界客户关系管理方面的领导者美库尔公司(Merkle Inc)在专业管理咨询方面的几十年的经验积累与CDA数据分析研究院的教学理念与方法相结合,归纳了在商业智能系统设计、客户画像、精准营销、生命周期价值管理等主题的课程,结合R语言进行项目实操。感兴趣的小伙伴们快来学习吧!
【课程信息】
北京&远程:
10月14-15,21-22,28-29日(三周周末)+ 三周线上,共六周
授课安排:现场班5900元,远程班4400元
(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3) 学习期限:现场与视频结合,长期学习加练习答疑。
【报名流程】
1. 在线填写报名信息
(北京&远程)
2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图
【课程大纲】
第一阶段:[线上选修]数据分析统计基础理论 -(一周)
第二阶段:数据挖掘前沿与R语言
第三阶段:回归建模分析方法
第四阶段:决策树与神经网络建模
第五阶段:分类器与组合模型
第六阶段:客户与市场分析方法
第七阶段:推荐算法提升客户价值
第八阶段:[线上选修]Mysql数据库基础知识 -(一周)
第九阶段:[线上选修]Tableau数据可视化 -(一周)
【课程讲师】
常国珍
CDA数据分析师讲师/北京大学商学博士。曾就职于亚信科技商业运营咨询部、方正国际金融事业部、德勤管理咨询信息技术系统咨询部,多家金融信息部门和金融高科技公司数据分析顾问。主要从事征信数据集与信用风险建模、客户价值提升等项目。擅长将基于个体行为分析的微观经济学研究范式与量化模型向结合的客户终身价值建模。
瞿辉
美库尔公司分析经理/中国科学技术大学统计学硕士毕业。多年数据分析和挖掘的工作经历,精通SAS和R,对各种机器学习算法和统计模型都有深入研究,负责过保险、医药、零售以及电商等多个行业的数据分析项目,在客户画像、用户分群、精确营销、销售预测、营销组合优化等领域有丰富经验。
【课程优惠】
1.全日制学生及CDA LEVEL Ⅰ老学员8折优惠;
2.三人及以上报名9折优惠,五人及以上8折优惠;
3.CDA LEVEL Ⅰ等级资格证书持有者立省1000元;
4.同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。
联系我们
电话:010-68411404
手机:18511302788(王老师)
邮箱:
wangzhenda@pinggu.org
—— Join Learn!
免费试听(汽车金融信用违约案例):
https://www.cda.cn/gkk/19.html
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
浮世若离丶
2017-9-27 10:21:12
R在统计分析和可视化方面是当之无愧的霸主,微软开发的MRO版本极大地提高了R的内存运行效率。看好R的发展前景。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
Still..
2017-9-27 10:22:05
常老师的课讲得很好,支持!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
壹手曹刀
2017-9-27 10:24:08
课程大纲很系统,涵盖了数据库、统计、数据挖掘和可视化。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
人脉引爆点
2017-9-27 13:57:32
数据挖掘技术更适合业务人员学习,相比技术人员学习业务来的更高效。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
地板
fuganggang
2017-9-27 14:18:32
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
点击查看更多内容…
7楼
Crsky7
2017-9-27 15:28:50
R语言非常难入门
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
8楼
kugua132
2017-9-27 15:40:20
自学R语言,非统计学专业,觉得确实很吃力啊!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
9楼
浮世若离丶
2017-9-27 15:48:15
Crsky7 发表于 2017-9-27 15:28
R语言非常难入门
R语言的学习路线确实比较陡峭。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
10楼
cszcszcsz
2017-9-27 15:54:07
谢谢分享!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
11楼
fugangxx
2017-9-27 15:54:54
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
12楼
dyl17011
2017-9-27 15:56:09
感觉很不错
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
13楼
jasminejrx
2017-9-27 15:59:00
想学不知道怎么入手
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
14楼
fuganggangxx
2017-9-27 16:00:23
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
15楼
殺先生
2017-9-27 16:05:17
快速入门
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
16楼
wocaishiliuking
2017-9-27 17:05:39
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
17楼
deng203
2017-9-27 20:09:17
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
18楼
Charlie·T
2017-9-27 20:35:20
谢谢分享!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
19楼
huhuhuhu
2017-9-27 21:45:13
支持一下
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
20楼
rossrachel
2017-9-27 21:48:09
支持一下
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
21楼
gaojianwqjk
2017-9-27 21:53:44
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
22楼
wang3203278
2017-9-27 22:57:51
谢谢分享!一定报名
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
23楼
xbz
2017-9-27 22:58:27
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
24楼
tt_abc
2017-9-27 23:37:09
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
25楼
nndbc
2017-9-27 23:38:02
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
26楼
gxnnhgm66
2017-9-27 23:52:35
课程大纲很系统,涵盖了数据库、统计、数据挖掘和可视化。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
27楼
cloudoversea
2017-9-28 04:43:01
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
28楼
xujingjun
2017-9-28 07:47:04
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
29楼
whyyyhk
2017-9-28 07:47:43
常老师的课讲得很好,支持!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
30楼
20115326
2017-9-28 08:38:19
谢谢分享。很有启发
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
首页
上一页
下一页
跳至第
页
栏目导航
R语言论坛
经管文库(原现金交易版)
休闲灌水
论文版
经管在职研
学术道德监督
热门文章
展望2026:学术智能体即将崛起?
CDA数据分析脱产就业班于2025年12月08日开班 ...
AI4S回归白盒符号主义,清华等联合发布SR-L ...
CDA Level III 认证考试大纲重磅更新并启用 ...
初等数学论丛+第8辑
项目介绍 MATLAB实现基于遗传算法(GA)进行 ...
项目介绍 MATLAB实现基于DTW-GPR 动态时间规 ...
新鲜出炉的行业会计核算手册
数字消费蓝皮书(2025年) 20251229
python语法合集背记手册
推荐文章
12月武汉站|Deepseek辅助论文写作与数据分 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群