世界杯的狂欢结束,狂欢之余,大家对世界杯的热情让比赛结果具有了商业价值,更促使了机构们热衷对比赛的预测。比起上届的章鱼保罗,机构们的预测背靠大数据资源和技术,预测起来都更有底气。但是他们的预测是不是真的算得上大数据?它们具体又是怎么操作的呢?
| 预测机构 |
预测模型
|
预测准确率
|
百度
|
考虑了团队实力、主场优势、最近表现、世界杯整体表现和博彩公司的赔率等五个因素。
|
针对本届世界杯的16场淘汰赛的预测,准确度达到了100%。而今年频频爆冷的小组赛阶段,百度对比赛结果的预测准确率也达到了58.33%.但是100%的准确度也只是猜胜负,德国和巴西7:1的结果就和百度预测的,德国将会以微弱的优势赢下巴西(51%对49%),二者相去甚远。
|
微软
|
除了以往比赛历史外,考虑了更多的因素:地理位置、草坪、天气、大量预测的参考(群体智慧),还使用大量的公开数据——博彩市场、民意调查、社交媒体以及其它在线数据,通过欧洲赔率市场最有名的指数Betfair(必发指数)来构建预测模型,并通过微软的个人语音助手Cortana和必用搜索引擎发布。
|
预测结果是:巴西将夺冠,夺冠率达到22.5%,远远高于其他对手,如今似乎没人拿出来打脸了。
|
谷歌
|
分析了职业足球联盟、世界杯小组赛中队员们的表现,引入了由BigQuery工程师乔丹提加尼开发的实力排行榜系统,来推测他们将会在本届世界杯有什么样的表现。此外,还考虑了观众热情程度的数据,来计算主队优势。
|
谷歌则预测了16进8和8进4的两轮比赛,而谷歌在12场预测中有11场正确,准确率为91.67%,预测八强赛时,对关键的德法大战预测错了。
|
高盛
|
对自1960年以来的正式国际14000场足球比赛数据的回归分析来构建预测模型,还通过泊松模型分析了每场小组赛的比分情况。
|
在小组赛预测的准确率为37.5%,并在世界杯开始前,预测东道主巴西最有可能斩获世界杯冠军,夺冠几率为48.5%,比任何参赛球队高3倍。甚至给出了最终决赛的结果,巴西将以3比1的比分,战胜最后的宿敌阿根廷
|
雅虎
|
针对每一次比赛,雅虎会利用名为泊松分布不同参数的概率论来估计每一支队伍可能的进球数量,
|
雅虎预测德国将打败葡萄牙,而西班牙将击败荷兰,而最后的冠军是巴西。可怜被雅虎提到的两只会获胜的队伍,西班牙和巴西都已耻辱性的比分被打败。
|
德国科隆体育学院
|
考虑因素不仅包括各队的世界排名、足彩赔率、市值、预选赛表现,还包括可能的伤病、战术、气候条件、主场优势因素等
|
预测结果:预测认为德国、巴西、哥伦比亚、阿根廷、比利时和荷兰6支队肯定能打入八强,西班牙即使杀出小组赛也会在八分之一决赛中被巴西淘汰。其后巴西、德国、阿根廷和荷兰半决赛,最终将由巴西和阿根廷争冠,巴西夺冠概率20.4%,阿根廷14.7%。现在看来,除了决赛,其他预测得都还挺准。
|
德意志银行
|
德银建立了量化分析模型,计算参数包含球队的世界排名、以往战绩、球员构成和赌球市场赔率。
|
得出的夺冠概率是巴西名列第一,紧随其后的是德国、西班牙、法国。但是,德银表示这样的预测太乏味也太传统,于是德银引入了一系列条件,最后得出了英格兰是冠军的结果。他们的理由是,上一次英格兰夺冠时,队中就有很多利物浦球员,和这次情况一致,因此他们确信英格兰队将在巴西夺冠。
|
注:根据文章《大数据预测世界杯,大力神打了谁的脸?》绘制、来源:虎嗅网
大数据预测世界杯看来还不成熟,不过从中可以看出,人们一直想找到如何能更准确认识世界的方法,从样本统计到大数据运算,大家都谈在概念,却鲜有人能将其与真正的商业、生活结合,产生有意义的结果。对于正在玩大数据概念的互联网公司而言,具体到怎样建立有效模型,提高计算结果的准确性,还在摸着石头过河。
热点话题推荐:德国队获胜的内在原因