网罗天下体育资讯

2022年卡塔尔世界杯注定是一场不平凡的大戏

  • 时间:2024-04-04 12:21:04|
  • 来源:nba录像吧

世界大赛连续34场不败的潘帕斯雄鹰队1-2不敌沙特阿拉伯队,世界排名第51位;

四届世界杯冠军德国队1-2不敌从未进入八强的日本队;

让无数强队闻风丧胆的南美天蓝队乌拉圭0-0战平被称为世界杯最弱球队的韩国队;

足球数据预测,大数据分析模型,泊松概率

由于卡塔尔在揭幕战中打破了“主办国必须赢得世界杯揭幕战”的铁律,这预示着2022年卡塔尔世界杯注定是一场非凡的戏剧,或许将迎来另一位新王。世界杯冠军。

欢乐的背后一定有悲伤。 这个时候,一定有无数的球迷为自己的球队庆幸,也一定有无数的球迷为他们的球队感到悲伤。 最终谁能捧起大力神杯足球赛事分析机构,星光熠熠的新人还是老吉扶风的老东家无人能猜,但我们或许可以从足球数据预测中一窥端倪。

构建世界杯足球数据预测模型

(如果想看预测就跳过这部分)

自从现代足球逐渐商业化以来,无数人创建了大数据分析模型来尝试预测足球比赛的结果。 然而,由于足球比赛的影响因素比吃喝要复杂得多,球队的阵容、球员的能力、球员的状态、球员的心理、球队的战术、球队的融合、球队的配合等等,每一个因素的变化都会影响到比赛的结果。整个身体,影响最终的结果。 预测的结果可能与现实有很大差异。

然而,大多数大数据分析模型背后的机制基本上都有泊松概率分布模型的影子:

足球数据预测,大数据分析模型,泊松概率

这种大数据分析模型看似复杂难懂,但实际上却有着简单而美丽的魔力,可以“准确”预测几乎所有事件的概率。 它的原理比较简单,几句话就能解释清楚:

我在工作时喝水的事实要么发生,要么不发生;

我知道我在一定时间内喝水,比如我平均每天早上喝两次水;

一定时间内发生喝水的概率是一样的,随时都可能喝水;

我这次喝水和下次喝水的事件是独立的,互不影响;

那么,这个事件就可以用泊松分布的公式来解释。 以足球预测为例,我们可以用“一支球队在一场比赛中进球”作为事件,用K表示我们期望球队进球多少个((事件发生多少次),用λ来表示一场比赛内平均发生的事件数量,我们可以用世界杯各队的场均进球数,最终得到一个概率图,然后得到一支球队进1球的概率,进 2 球的概率,以及进 N 球的概率:

足球数据预测,大数据分析模型,泊松概率

正是因为足球运动复杂多变,不能仅通过场均进球数来衡量比赛结果。 因此,我们使用球队的场均进球数、场均失球数、场均胜率、场均失球率、场均平均率。 我们等待数据来综合评估一支球队的实力。 当然,每个模型都有自己的算法。 我们将采用最简单的“攻击力”模型。

通过 BI 进行分析和解释

首先是解决数据问题。 幸运的是,所有国家队的数据都可以从网上下载,然后在excel中计算出每支球队进球的泊松概率:

足球数据预测,大数据分析模型,泊松概率

然后我们将数据导入专业的数据分析软件中进行进一步的数据清洗和处理。 第一步是对数据进行合并,根据世界杯小组赛的分组,合并不同的数据,形成“球队对球队”的数据格式,然后使用我们的“进攻力”模型导入数据功能来创建新增几个数据栏,代表球队的攻击力指数:

足球数据预测,大数据分析模型,泊松概率

具体过程这里不再赘述。 数据清理阶段之后,必须对数据进行可视化分析。 通过可视化的操作界面,可以轻松组合出我们想要的数据,比如价格比较、冠军比较、净胜球比较等。 等等,最后美化一下,就变成这样了:

足球数据预测,大数据分析模型,泊松概率

预测出线概率详解

最重要的是,我们根据“进攻力指数”估算出各队的进攻强度,然后用泊松概率计算出球队每场比赛最有可能得分。 这里我们用场均进球数来展示:

足球数据预测,大数据分析模型,泊松概率

表中卡塔尔等首次参加世界杯的国家缺乏历史数据参考足球赛事分析机构,只能根据亚洲成绩人为设定攻击力数值,从而人为高于实际实力。

我们可以以G组为例。 表中数据显示,喀麦隆对瑞士净胜球的概率为-0.57,而瑞士对喀麦隆净胜球的概率为0.71,即双方净胜球数为1.28个; 而实际结果,瑞士与喀麦隆的比分是1:0,与足球数据预测的几乎一致;

现在我们来看看为什么前三款游戏这么不受欢迎:

足球数据预测,阿根廷对沙特的净胜球大概是3.29,预测比分是3:0,但实际结果是1:2落败;

德国对阵日本的净胜球概率为2.48,比分预测为2:0,但实际结果是1:2落败;

乌拉圭对阵韩国的近似净胜球为1.06足球赛事分析机构,预测比分是1:0获胜,但实际结果确实是0:0战平韩国;

根据其他专业机构的预测数据,赛前沙特战胜阿根廷的胜率不到1%。 然而种种因素造就了本届世界杯的最大冷门,也让阿根廷人尝到了亚洲足球的苦果。

利用这个大数据分析模型继续推导,就可以对最终淘汰赛的最终结果进行建模。 这里不再继续推导,因为系统还需要优化。 不过经过计算,结果显示,巴西队夺得世界杯的概率最大。 概率与前几天广为流传的大数据机构的预测机构类似:

足球数据预测,大数据分析模型,泊松概率

此外,我还做了一些其他有趣的统计,比如球员价值统计:

足球数据预测,大数据分析模型,泊松概率

冠亚军人数对比:

足球数据预测,大数据分析模型,泊松概率

国家队平均年龄对比:

足球数据预测,大数据分析模型,泊松概率

加纳的平均年龄只有24岁,绝对的青春风暴; 而西班牙只有25岁。 这支斗牛士队正处于更新的关键时期。 加维将继续扛起伊比利亚足球的旗帜;

巴西、比利时、阿根廷、克罗地亚的平均年龄超过27岁。 队内不乏老将,如内马尔、德布劳内、莫德里奇、梅西、迪马利亚等足坛历史上的闪亮明星。 进入职业生涯的末期,世人最不愿意看到的就是英雄的逝世,但他们都会为了自己的毕生理想而战斗到最后一秒。

数据是冷的,但足球是热的。 数据预测不能代替和代表现实。 输赢并不是一切。 真正让我们着迷的是场上的22名球员、场下的教练和球迷共同努力追求目标。 理想主义不断敲开紧闭的大门,奋力揭开幸运女神冰冷的面纱,这就是足球和世界杯的魅力。

因为,当然,当我们热爱足球时,我们不会喜欢他的成功或失败。 我们喜欢的就是这样的气质,不是吗?

显然,在当前的信息时代,借助此类工具,企业可以加速整合企业数据分析的趋势。 市场广泛认可的软件其实有很多,选择时一定要根据实际情况。 一般情况下,建议选择市场上比较主流的产品,更容易达到好的效果。 目前,企业数据分析BI软件市场份额最大的公司是帆软BI软件。

足球数据预测,大数据分析模型,泊松概率