足球和
机器学习
我敢肯定,在过去的几个月中,您可能已经听说过俄罗斯2018年FIFA足球世界杯。而且,如果您也是一个高手,我想您也已经意识到机器学习和
人工智能也是流行语。那么,有什么比在结合了这两个热门主题的项目中进行练习更好的准备世界杯的方法呢?为了做到这一点,我们将利用FIFA 2018视频游戏的数据集。我的目标是向您展示如何创建一个预测模型,该模型能够根据足球运动员的比赛统计数据预测足球运动员的表现(使用Jupyter Notebook中的Python)。
Fifa是世界上最著名的视频游戏之一。您可能至少玩过一次,对吧?尽管我不喜欢视频游戏,但是当我看到由Aman Srivastava收集的数据集时,我立即认为这对于练习任何机器学习项目的一些基础知识都非常有用。
国际足联18数据集从网站上刮下 sofifa.com 包含在FIFA 18的完整版在这每个球员的统计数据,超过70个属性 Github上项目,您可以访问构成数据集中的CSV文件和一些Jupyter的笔记本电脑用于收集数据的python代码。
话虽如此,现在让我们开始吧!
机器学习教程入门
我们介绍了与智能系统有关的大多数基本概念,以及机器学习技术如何在几乎您可以想象的任何领域中为多种系统添加智能功能。除其他外,我们了解到,机器学习项目的典型工作流程通常类似于下图所示:
机器学习教程
在这篇文章中,我们将通过整个阶段的简化视图,以及每个阶段的实际实现。主要目标是展示在任何机器学习项目中执行的大多数常见步骤。因此,如果您需要从头开始解决机器学习项目,则可以将其用作起点。
接下来,我们将:
应用一些预处理步骤以准备数据。
然后,我们将对数据进行描述性分析,以更好地了解它们的主要特征。
我们将继续练习如何使用scikit-learn训练不同的机器学习模型。它是最
流行的机器学习python库之一。我们还将使用数据集的一个子集进行培训。
然后,我们将使用看不见的数据来迭代和评估学习的模型。稍后,我们将对它们进行比较,直到找到
符合我们期望的良好模型。
一旦选择了候选模型,我们将使用它执行预测并创建一个使用
该预测模型的简单Web应用程序。
最后,我们将提供一个有趣的智能应用程序,如下所示。它将能够根据他们的比赛统计数据预测足球运动员的状态。听起来不错,是吗?好吧,让我们开始吧!
1.准备数据
通常,任何机器学习项目都具有称为数据准备,数据清理或预处理阶段的初始阶段。
它的主要目的是收集和准备学习算法将在训练阶段使用的数据。在我们实际的具体示例中,Aman Srivastava在从 sofifa.com网站抓取不同页面时已经解决了其中的重要部分。在他的Github项目中, 您可以使用python代码访问一些jupyter笔记本,这些代码用作数据预处理模块,这些模块被用于获取和生成我们项目的原始数据集。下面以示例为例,我们可以看到对原始数据(html格式)进行网络抓取的模块,以及如何将数据转换为Pandas数据框(Pandas 是著名的用于数据处理的Python库)。最后,它会生成带有结果的csv文件。在某种程度上,可以看到此数据准备步骤类似于旧的ETL(提取,转换,加载)数据库过程。
题库