华为云是如何准确预测世界杯40场比赛的?

人工智能
后台-插件-广告管理-内容页头部广告(手机)
华为云是如何准确预测世界杯40场比赛的?

世界杯是足球界的顶级赛事,吸引着全球范围内的关注,无关地域、肤色、宗教、贫富,每个人都享受自己心目中的世界杯。

在世界杯开赛前,不少的机构或研究人员都给出了自己的小组赛晋级预测或者冠军预测,有基于统计的方法,有基于民意调查的方法。

世界杯要想预测准离不开AI应用

华为云就利用机器学习服务(Machine Learning Service,简称MLS)做了世界杯预测“AI机器人”,成功预测了40场比赛结果,其中连续6场准确预测。(果然用数据说话就是6)

机器学习服务,实践门栏高,理解概念则容易得多。说白了,就是让计算机能够模仿人类解决问题的思路和方法,并利用机器自身的优势来替代人的工作,或者更好的配合人的工作。

比如说,现在大家都觉得自己的车越开越顺,开别人的车却不太习惯,很多时候并不是因为你更熟悉这辆车,而是车更熟悉你。原因是很多中高端车型都配了“高级行车电脑”,具备驾驶习惯的学习能力。你开的越久,它记录下来的数据就越多,它会越熟悉你的驾驶习惯,从而不断调整和优化发动机、变速箱的运行参数,更及时的配合你的驾驶动作。

对MLS有了初步认识,现在用简单四步教你搭建“AI预测帝”:

Step1. 寻找需要用到的数据集;

Step2. 选择或者定义需要的特征;

Step3. 选择合适的算法在训练数据当中寻找数据知识与规律;

Step4. 调整算法参数和特征选择,得到相对较好的模型。

看到这里相信不少家伙要大呼不懂,“提前离场了”。别急,你以为程序代码不是你的菜,其实预测结果跟烧一道菜没什么本质区别。现在跟我一起系好围巾,进入厨房,拿起菜刀......

数据选择

数据选择就像我们要请老铁或闺蜜们来家里吃饭,要提前准备好食材,鸡鱼肉蛋葱姜蒜,柴米油盐酱醋茶等等。所谓巧妇难为无米之炊,要进行预测,首先我们需要不一样的“食材”-数据。

在这里我们选择了8年来所有国家队的比赛结果,包括每场比赛的时间和进球。

而且为了更有说服力,华为云又增加了国际足联排名和Elo评分。

Tips

我们选馆子会看点评网站的综合评分,选电影会看“豆瓣”、“烂番茄”等国内外影评网站的电影打分,“Elo评分”就像这样一种综合评分的存在。不只是足球,越来越多的体育竞技比赛都引入了这一评分系统。

特征选择

具体到要做哪一道菜,则需要选择有限的几样食材和调料。要做番茄炒蛋,排骨鸡翅之类的就先放冰箱里凉快着对不对?同理我们根据不同的预测需要,对数据也会有所筛选,把不重要的信息剔除掉。

对于每场比赛的胜平负这种分类问题,特征数据就是:每场比赛两个球队的国际足联排名、Elo评分之间的差值。

接下来的净胜球预测就简单多了,那就是进球数-失球数。

算法选择

正像爆炒要用炒锅,炖煮要用炖锅,我们已经准备好了“食材”,接下来,需要选择“烹饪工具”-也就是最合适的算法。

  • 预测胜平负

还是回到胜平负的预测。对于这个“多分类”问题,我们搬出随机森林算法。(Random Forest)

华为云是如何准确预测世界杯40场比赛的?

随机森林会生成多个决策树,然后每个决策树对数据的类别进行投票,最终的类别结果是得票最多的类别。这里你可以简单的理解:很多人在一起争论番茄到底是水果还是蔬菜,每个人都有自己的判别标准,最终的结果是投票表决。

华为云是如何准确预测世界杯40场比赛的?

随机森林算法示意图

  • 预测净胜球

净胜球的预测要想越来越准确,涉及到另一个逼格蛮高的算法——梯度提升树(GBDT),再举一个不那么恰当的例子:就好比我们学做清蒸鲈鱼,我们忙忙叨叨,把20道工序都仔细的做完,我们要把每一步之间的误差做到最小,口味达到最好。

华为云是如何准确预测世界杯40场比赛的?

GBDT算法示意图

使用华为云MLS训练模型

在正式料理之前,还需要一个满足要求的厨房,华为云MLS提供了可视化的、托拉拽式的“现代厨房”-机器学习建模功能(工作流),可以快捷、方便的搭建一个机器学习流程,快速的得到模型

华为云是如何准确预测世界杯40场比赛的?

使用华为云MLS可视化搭建机器学习训练流程

通过多次训练,发现特征列当中<队伍即时国际足联排名>的影响因子很小,所以将此特征剔除,最终确立的随机森林的参数为:100棵树、深度30、分箱数200;最终确立的GBDT的参数为:迭代次数18。

在训练数据集上随机抽取30%作为测试集,胜平负预测的准确率为68%,净胜球的预测平均误差为0.58。这个结果在足球比赛的预测当中可接受。

模型训练完成之后,同样利用工作流来搭建一个预测流程。

华为云是如何准确预测世界杯40场比赛的?

预测工作流

世界杯模型实战与更新

好哥们牙口不行,菜就要煮久一点,好闺蜜是川妹子,够麻够辣才够味儿。一道合格美食,会根据客人的口味喜好来调整。世界杯预测模型也需要根据实际结果进行调整,才能提高预测率。

6月14日世界杯开赛,揭幕战为俄罗斯vs沙特,华为云MLS生成模型预测结果为:俄罗斯赢(2球),最终的结果为俄罗斯赢5球,这说明俄罗斯的主场优势是明显的。之前建模的过程当中消除了主客场的因素,但是作为东道主,俄罗斯就存在着主场优势,于是在初始的对于俄罗斯的Elo评分当中,加入了一个百分比的提升,经过测试,这个百分比被设置为10%。

在世界杯比赛日完毕之后,真实赛果会作为训练集去更新模型。最终华为云MLS在世界杯决赛圈各个阶段的表现为如图所示。

华为云是如何准确预测世界杯40场比赛的?

华为云MLS模型准确率

BTW,在16强对阵确认了以后,华为云MLS就准确的预测了冠军是法国,虽然预测的冠军之路和真实的冠军之路有些许不同。

足球的偶然性

足球比赛充满了不确定性和偶然性,比如受伤、乌龙球、黄油手等等,这些因素都直接影响着比赛的结果,而这些都是未知的,现在AI也无法对于未知和不确定做出准确的反应,AI可以预测的是足球赛场上的局面(射门比、控球率、传球次数、传球成功率等),这些局面因素在一定程度上可以反映比赛的最终结果,但是并不是确定的。

到此,我们用不那么“正经”的方式把如此高阶的问题做了一番揭秘。MLS的应用前景是非常广阔的。比如现在已经出现了“手把手”教一遍就会的工业机器人。不论多复杂的制造工序,只要技师手把手的教一遍机器人,拥有多种传感器和实时运算能力的机器人就能够像人一样精确控制机械臂,完成复杂的手工工序。

而文章开头提到的“个性化推荐”,在未来将不再局限于内容与商品的推荐,有了MLS的深度应用,婚介、求学、都可以为你提供更可靠的推荐,甚至职业规划、养老规划都可以更科学、更有效的实现。

一场足球比赛就像一个浓缩的人生,有分工、有努力、有拼搏、有放松、有开心、有突然、有无所适从,一场比赛结束前,悲喜未知。终场哨响,有人欢呼拥抱,有人埋脸痛哭。“球场小社会,社会大球场”,这个浓缩的、精致的、充满了不确定性的运动,正是我们爱它的理由。

点击“了解更多”

了解机器学习服务(MLS)

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。