暂无图片
暂无图片
4
暂无图片
暂无图片
暂无图片

英超联盟借助 Oracle Cloud 整合英国足球比赛数据

甲骨文中国 2024-11-26
469

当一支足球队发起进攻时,球员们迅速开始移动。在他们控球的情况下,创造力会占据上风,可能性也会层出不穷,然而这些瞬间稍纵即逝。

同样,在英国,球场外的相关机构,包括媒体、博彩公司、球队和联赛组织以及他们的商业合作伙伴,都希望能够自由快速地探索隐藏在比赛日数据和其他形式数据中的可能性。不久前,这些由英超联赛及其他联赛和比赛产生的数据通常都存储在各种体育数据供应商的系统中,增加了中间环节和额外步骤,给创造性的数据探索带来了困难。

如今,在 Oracle 数据专家和 OCI 的支持下,英超联赛和英格兰足球联盟共同拥有的一家名为Football DataCo(FDC)的公司正在将所有比赛数据,即 32 年的数据(涵盖27个不同的英国联赛和淘汰赛,以及持续的比赛日数据)整合到一个 Oracle Autonomous Data Warehouse 中。这一举措帮助英超联赛更好地管理其拥有的大量数据。

作为世界上备受欢迎的足球联赛,仅英超联赛就产生了数 TB 的比赛日数据,这些数据由摄像机以每秒 25 次的速度捕捉,跟踪球场上发生的每个球员、跑动、传球、射门、扑救、拦截和其他动作。这些数据会应要求提供给媒体、联赛分析师和上述其他用户。

FDC 的产品和关系经理 Mark Bowden 说:“现在,我们可以随着比赛的进行自主更新数据,并允许用户通过英超联赛前端平台进行查询。英超联赛以及其他英国赛事相关的分析师及其合作伙伴将利用他们选择的几乎任何分析工具,对积累的数据进行创造性的分析。随着 Oracle Autonomous Data Warehouse 让人们通过生成式人工智能大型语言模型(LLM)与数据互动,可能性只会越来越大。GenAI 将真正改变我们访问数据的方式。通过与 GenAI 而不是 SQL 程序员进行交互,编辑和创意人员可以用他们自己的方法来用数据讲故事,这超出了数据专家的想象。我很乐意看到这点。”

用户可以通过简单提问在数据仓库中查询有关球员当前表现,如选定的中场球员在一场比赛中的跑动距离,以及他们在对方半场的触球次数。用户也可以提出一些有趣的历史问题,例如在英超联赛中,守门员打进制胜球的次数。用户还可以在数据仓库中查询复杂的战术问题:落后的球队在面对这个对手时是否踢得过于靠前?其他球队使用这种战术的效果如何?这种战术是否导致了许多反击进球?


数据宝库 

与 FDC 合作的 Oracle Technology Consulting 分析总监 Simon Wigley 表示:“仅英超联赛就集合了来自 250 支不同球队、345 个不同球场的 73,000 场不同比赛的数据。我们知道每场比赛的阵容和每个球员的位置,以及谁被换下场。这些数据包括约 2 万名球员和 13 万个进球,以及主教练和裁判的统计数据。尽管 VAR(视频助理裁判)审查在英超联赛和其他比赛中相对较新,但仍有 1,200 次此类判罚的数据。然而,与现代 AI 系统所创造的丰富比赛日数据相比,所有这些历史数据微不足道。”

以英超联赛为例。其合作伙伴不仅收集每一次传球、射门、跑动、拦截、角球等数据 ——数据仓库中现在有 3,900 万个此类动作,而且每个动作还包含许多属性。当有传球时,系统会记录下速度、谁传球、谁接球。角球会记录方向和主罚者。这样的例子不胜枚举。综合数据集中总共有 1.8 亿个属性。

专门从事体育分析的甲骨文数据科学云架构师 Brian Macdonald 说:“对于我来说,这是回答任何问题的原始资料。当我观看一场比赛时,我可能会看到一些东西,然后说'嘿,我觉得我以前从没见过这样的东西'。'然后我就可以做一些分析,问'以前发生过吗?如果发生过,那么它的发生频率是多少?一个问题很快就会引出另一个问题”。

MacDonald 表示他经常会访问连接到 Autonomous Data Warehouse的 Oracle Analytics Platform,然后进行过滤,并通过创建图表和表格开始可视化分析。他说:“我可能想建立某种预测模型,例如根据历史数据模拟正在进行的比赛的获胜概率。”


进入快车道

根据数据收集的工作方式,Oracle 平台每周都会将本地数据收集器中的 94,000 个不同有效数据载荷传输到数据仓库中。时间很重要:一周内会有数百场比赛,低级别联赛收集数据的详细程度各不相同。再加上英格兰足球的淘汰赛,赛程会不断变化。Wigley 表示:“系统不仅要知道需要哪些数据,还要知道何时需要这些数据。为了确保我们的代码和逻辑涵盖所有内容,我们做了大量的工作。”

该系统以不同的方式获取数据,用于不同的用途。其中一些有效数据载荷,包括阵容、比赛出勤率和其他标准比赛数据,会与球员追踪数据一起存储到数据存储器中,分析师可以将其汇总并用于生成赛后总结以及提供更深入的分析和预测。

该项目的下一步是通过 Wigley 所称的 “快车道 ”同时获取正在进行的匹配数据。这些数据将实时提供给分析人员。他说:“当英超联赛中发生什么事情时,数据仓库的用户就能立即将其纳入分析。”

Wigley 说,现在,英超联盟和其他用户可以访问所有这些比赛数据和历史数据,并根据自己的需要加以使用。例如,英超联盟可以直接从数据仓库中提取相关数据,将 GenAI 应用于其中,并根据球迷表示感兴趣的参数(如球队、球员或场上位置),用他们自己的语言为球迷创建个性化的比赛摘要。

FDC 的 Bowden 说:“对我们来说,这是一个真正的转变,让我们感觉自己有能力管理和使用大量不同的数据源。我对这一切的未来感到兴奋。”

文章来源:https://www.oracle.com/premier-league/uk-football-data-analysis/

*注:为免疑义,本文所用以下术语专指以下含义:

1. Oracle 专指 Oracle 境外公司而非甲骨文中国。

2. 相关 Cloud 或云术语均指代 Oracle 境外公司提供的云技术或其解决方案。

文章转载自甲骨文中国,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论