全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2010-11-12 21:06:11
我没学过这个。。。。
表示我不会。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-12 21:15:39
嘿嘿 ,不错不错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-12 21:47:30
~ 10# 梦幻世子 恩,不错~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-12 22:58:33
很好,顶一下!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-12 23:18:35
没学过啊,怎么个高法,前来学习。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-12 23:27:14
活动好,支持下!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-15 18:43:40
非常好的活动,支持!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-16 10:24:28
O(∩_∩)O~,很好的学习方式,见识到高手了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-16 21:48:40
期待结果!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-16 22:22:51
活动挺好,支持一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 01:12:30
没有学过这个,有点可惜了,还有点看不懂题目。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 08:33:34
挺好的活动,就是对内容不太了解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 14:38:00
支持一下!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 15:47:14
想学习一下!?!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 16:26:00
数据挖掘?!长学问了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 17:46:07
这两个题目有意思,已经在公司做了动员,大家都参与,当做游戏和讨论,呵呵
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 19:10:26
感谢!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-18 07:27:28
有创意,支持!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-18 09:24:50
没学过  不过还是支持一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-20 16:12:36
对于这个问题吗!不发表意见。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-22 10:48:24
1# 冬天里的阳光00
这个活动让人提升对统计问题的兴趣,希望向得到前三名的高手好好学习一番。。。小弟大力支持本活动!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-22 13:37:53
悲剧,没学过数据挖掘
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-22 16:16:50
我的天啊。我只能看不能做。不是我的能力所及的!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-23 02:17:56
刚刚学经济学,还不太会用词,只是心里明白
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-25 11:26:47
1. 我用的是关联规则与决策树相结合的方法进行分析。假定“sachin首发”、“Girish进攻”和“Girish防御”可由我方决定,结合“地点”“时间”“对手中锋”的限定条件,挖掘出与赢得比赛关联度最高的项;以此来制定下场比赛的策略,结论如下:
(1)如果比赛地点在大学同时时间是九点,鉴于之前策略的输球概率为100%,因此可考虑采用a.对手为高大中锋时,sachin不首发,Girish进攻为中锋,Girish防御前锋的策略;b.对手为矮小中锋时,sachin不首发,Girish进攻为中锋,Girish防御中锋的策略。
(2)其他条件下,当对手为高大中锋时,采用sachin首发,Girish进攻为中锋,Girish防御前锋的策略;当对手为矮小中锋时,采用sachin首发,Girish进攻为中锋,Girish防御中锋的策略。
2. 采用统计和关联规则的方法进行解决,即分析“电视节目中有重要体育赛事的前一小时”与“肯德基炸鸡的销售量上涨20%”之间是否存在关联。需要统计一段时间内(1)各连锁店肯德基炸鸡的实时销售数据;(2)电视节目中有重要体育赛事的时间;
对数据进行分析,可设定一阈值c,如c=70%。考察“电视节目中有重要体育赛事的前一小时”和“这一事件段内肯德基炸鸡的销售量同比上涨20%”同时发生的次数与“电视节目中有重要体育赛事”的次数之比;如果比值大于c,可认为“电视节目中有重要体育赛事的前一小时”与“肯德基炸鸡的销售量上涨20%”存在关联,反之则“每次电视节目有重要的体育赛事时,赛前一小时肯德基炸鸡的销售量就会上涨20%”的结论不成立。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-25 16:48:56
仔细看了前面几位的作业,很有意义,每个人的思路和算法都不同,受益了!
另外,我个人认为这就是基本的统计学的分析作业,跟数据挖掘好像没有什么关系吧。
第一题,我想的是逻辑回归方法,一共7列数据,前六列是输入变量,后面一列(输赢)是目标变量,通过分析看不同输入变量对于输赢影响程度的方向和大小;
第二题,我想的是线性回归的方法,收集相关的数据;
不过,总的来说,前面的几位的答案都很不同的,思路不同,方法不同,我真的受益了,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-26 02:10:29
1.对于篮球比赛的策略问题,主要是采用决策树进行策略选择。
A.对列表中的数据进行处理,即:(按本题)讲数据的各属性的值转化为数值,
如时间有(7pm,9pm),即分别转化为(0,1),如此类推。
B.由于数据较少,本题把全部数据作为训练集合,归纳搞糟决策树,从而提取分
类规则;当然,如果数据足够多的话,可以按比例分出训练集合和检验集合,先
从训练集合提取出分类规则,然后再对检验集合的数据进行分类,从而检验出改
决策树的正确率。
C.篮球队队长可以通过上一步得出的分类规则对下一场比赛的决策进行分类,亦
可查看其得出的分类规则,进而确定下一场的比赛策略。

2.对于连锁餐馆顾客的消费行为是否与重要的体育赛事有关的问题,可采用关联
规则来对顾客的消费行为进行数据挖掘。
A.由于没有提供数据,我在此就以“每次电视节目有重要的体育赛事时,赛前一
小时肯德基炸鸡的销售量就会上涨20%。”为例,对数据进行简单的假设:入社电
视节目播放重要体育赛事的时间表和肯德基炸鸡的销售量表如下:


体育项目


播放时间












销售时间


炸鸡销售量













B. 根据Aprior算法思想,把上述数据集作为一个数据源,并定义支持度为10%,定
义可信度为25%,从而找出频繁项集,并挖掘出我们需要的关联规则。(其中,支
持度为电视节目有重要体育赛事前一个小时内,肯德基炸鸡的销售量上涨20%的概
率;可信度为以电视节目有重要体育赛事前一个小时内为前提,肯德基炸鸡的销售
量上涨20%的概率)
C. 还可以通过引入相关度分析等方法对算法进行改进,提高精确度。


完!
           谢谢收看,欢迎点评!
                                                       Heaven
                                                    2010.11.26                              
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-26 18:26:42
给出自己的一些看法。
题目1:
       首先,我认为题目给出的数据有些问题(这也是我一直没有回答问题的原因),这一问题是典型的分类问题,由于要给出使得学院队赢得比赛的策略,使用决策树方法提取决策规则显然很直观,也很快捷。下面阐述下我的思路。
       说题目有问题是这样的,根据分类中决策树的方法来看,使用比赛时间属性就把输赢全给分开了(7点的话肯定赢,9点肯定输,计算比赛时间属性的信息熵,可知这一属性的熵值为0,根据信息增益最大原则,第一个分割属性就是比赛时间,这样一来所有数据全部被拟合),因此如果设计策略的话,只能是比赛时间为7点即可。当然这是数据量较少造成的,如果对于大量的比赛数据,可以按照如下的方案进行操作:1)将数据属性转换为数值,如比赛地点在学院可以为1,大学可以为2,其它属性包括最后的类标号都一样。2)将数据输入matlab中,使用matlab中的 classregtree函数生成决策树,根据决策树,可以很直观地看出学院队要赢得比赛的决策规则。下边给出题目中数据的决策树及具体执行的matlab代码。
代码:

x=[1,7,1,1,2,1 1; 1,7,1,2,1,2,1;2,7,1,2,2,1,1;2,9,1,2,2,2,2;1,7,1,1,1,1,1;2,7,1,1,1,2,1;2,9,1,1,2,2,2;1,7,1,1,1,2,1;1,7,1,1,2,2,1;;1,7,1,1,2,1,1]
%(这是数值化后的数据,除了时间属性,其它都用1和2来表示,怎么设置都可以,不会影响分类结果)
t = classregtree(x(:,1:6), x(:,7),'names',{'地点' '时间' 'sachin首发' 'Girish进攻'  'Girish防御' '对手中锋'});
view(t)
得到的决策树如下图:
Unnamed.jpg
这里只是给出一个例子,对大样本数据进行数据挖掘才有一定的实际意义。

题目2:
       由于没有具体的背景和具体数据,在这里以每次电视节目有重要的体育赛事时,赛前一小时肯德基炸鸡的销售量就会上涨超过20%。”为例进行说明,给出拟执行的方案。可以考虑使用关联分析,提取关联规则。
       首先需要进行数据的收集,在某一时间段内,按小时进行数据的收集,计算出有赛事和无赛事前一小时和前两小时的炸鸡销售量,通过这一数据,计算炸鸡销售量的上涨比例(在这里可以假定超过上涨20%即为满足题意),这一可以得到如下的信息表

时间


是否有赛事


上涨是否超过20%


某月某日某时




某月某日某时+1




某月某日某时+2




……


……


……


……


……


……


某月某日某时+n





        接下来,统计该时间段内有赛事的次数(N),有赛事情况下赛事前炸鸡销量上涨超过20%的次数(M)
然后计算有赛事情况下,赛事前一小时炸鸡销量超过20%的概率(N/M),给定阈值s,如果计算概率超过s,则认为两个事件关联,则可以说:在某一段时间内,电视上有重要体育赛事的情况下,赛前一小时炸鸡销量上涨超过20%以一定的置信度N/M成立。当然,这只是一种简单的情况,也可以考虑变量之间的负关联规则等等。


       由于题目给出的信息有限,只能提交一个分析思路,如果能给出具体的描述,分析才能较为具体。此外,看到前面有网友说用Crisp-DM模型,我想纠正一下,Crisp-DM从一定程度来看更是一种方法论,它给出了数据挖掘的一个跨行业标准,阐明了完成一个商务数据挖掘项目的整体流程,是在商务智能领域进行数据挖掘的一个指导,做真正的数据挖掘项目以Crisp-DM方法论为指导,可以说是事半功倍。

       在这里就写这么多吧,希望能看到更优秀更完美的分析解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-4 19:29:40
不错的活动支持学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-9 12:31:31
获奖了,高手老虎不出山,我就猴子称霸王了。但还是非常感谢啊!
我的获奖感言如下:

姓名:王洪涛
邮寄地址:北京朝外大街乙12号昆泰国际大厦25层2511室
邮编:100020
手机:13522254852
选三本书:
1、数据挖掘基础教程
2、数据挖掘:概念与技术(原书第2 版)
3、统计模型:理论和实践(原书第2版)

另外,有没有人大经济论坛的获奖证书啊,你们制作,我自己掏钱也可以啊,呵呵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群