暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

KDD Cup 2022:亚马逊商品检索比赛总结

Coggle数据科学 2022-09-05
1849

比赛介绍

在这个挑战中,我们介绍了“购物查询数据集”,这是一个包含困难搜索查询的大型数据集,旨在促进查询和产品语义匹配领域的研究。

对于每个查询,数据集提供多达 40 个潜在相关结果的列表,以及指示产品与查询相关性的 ESCI 相关性判断(Exact、Substitute、Complement、Irrelevant)。每个查询-产品对都附有附加信息。该数据集是多语言的,因为它包含英语、日语和西班牙语的查询。

  • 提高搜索结果的相关性
  • 对搜索词进行分类

比赛目的

在开发在线购物应用程序时,需要极高的排名准确度。在移动和语音搜索应用程序中部署搜索时更是如此,其中少量不相关的项目可能会破坏用户体验。

我们将相关性分为四类(ESCI),用于衡量搜索中项目的相关性结果:

  • 精确(E):该商品与查询相关,并且满足所有查询规范(例如,水瓶与查询“塑料水瓶 24 盎司”的所有属性匹配,例如材质和尺寸)

  • 替代品 (S):该商品有些相关:它无法满足查询的某些方面,但该商品可以用作功能替代品(例如,“毛衣”查询的羊毛)

  • 补充(C):该项目不满足查询,但可以与确切的项目组合使用(例如,用于“跑鞋”查询的运动裤)

  • 不相关(I):该项目不相关,或者它未能满足查询的中心方面(例如,袜子用于“裤子”查询)

每个查询-产品对都附有附加信息。每个产品随附的信息在目录中都是公开的,包括标题、产品描述和其他与产品相关的要点。

该数据集是多语言的,因为它包含英语、日语和西班牙语的查询。有了这些数据,我们提出了三个不同的任务,包括:

  • 对结果列表进行排名。
  • 将查询对分类为 E、S、C 或 I
  • 识别给定查询的替代产品

比赛任务

Query-Product Ranking

给定用户指定的查询和匹配产品列表,此任务的目标是对产品进行排名,使相关产品排在不相关产品之上。这类似于标准的信息检索任务,但特别是在电子商务产品搜索的上下文中。

Multiclass Product Classification

给定一个查询和为此查询检索到的产品的结果列表,此任务的目标是将每个产品分类为查询的精确匹配、替代匹配、补充匹配或不相关匹配。

Product Substitute Identification

识别给定查询结果列表中替代产品的能力。

比赛数据集

我们提供了两个不同版本的数据集。一个用于任务 1,它在示例数量方面是减少版本,而用于任务 2 和 3 的版本更大。

训练数据集包含带有注释的 E/S/C/I 标签的查询-结果对列表。数据是多语言的,包括来自英语、日语和西班牙语的查询。

优胜方案

比赛任务比较相似,且队伍可以参加多个Task,优胜解决方案会有重叠:

- 方案汇总:https://amazonkddcup.github.io/
- 比赛总结:https://amazonkddcup.github.io/slides/KDDCup.pdf
- 答辩视频:https://www.bilibili.com/video/BV1ke4y1d7LU

Task 1


First place(网易)

Team www: Interactive Entertainment Group of Netease Inc., Guangzhou, China

Author: Qi Zhang, Zijian Yang, Yilun Huang, Zijian Cai, Kangxu Wang

- paper: https://amazonkddcup.github.io/papers/9517.pdf
- sildes: https://amazonkddcup.github.io/slides/9517.pdf
- posters: https://amazonkddcup.github.io/posters/9517.pdf
- video: https://youtu.be/j7Opry8BsUM

Second place (网易)

Team qinpersevere: Netease Games AI Lab, Hangzhou, China

Xiaolei Qin, Nan Liang, Hongbo Zhang, Wuhe Zou, and Weidong Zhang

- paper: https://amazonkddcup.github.io/papers/8408.pdf
- sildes: https://amazonkddcup.github.io/slides/8408.pdf
- posters: https://amazonkddcup.github.io/posters/8408.pdf
- video: https://youtu.be/x4E4XaJiBio

Third place (蚂蚁集团)

Team day-day-up: Ant Group, Hangzhou, Zhejiang, China

Jinzhen Lin, Lanqing Xue, Zhenzhe Ying, Changhua Meng, Weiqiang Wang, Haotian Wang, and Xiaofeng Wu.

- paper: https://amazonkddcup.github.io/papers/3782.pdf
- sildes: https://amazonkddcup.github.io/slides/3782.pdf
- video: https://youtu.be/Q-rxLkqVwsM

Task - 2

First place (蚂蚁集团)

Team day-day-up - Ant Group, Hangzhou, Zhejiang, China

Jinzhen Lin, Lanqing Xue, Zhenzhe Ying, Changhua Meng, Weiqiang Wang, Haotian Wang, and Xiaofeng Wu.

- paper: https://amazonkddcup.github.io/papers/3782.pdf
- sildes: https://amazonkddcup.github.io/slides/3782.pdf
- video: https://youtu.be/Q-rxLkqVwsM

Second place (Purdue & Tsinghua)

Team ETS-Lab - Purdue University & Tsinghua University

Fanyou Wu (Purdue University), Yang Liu (Tsinghua University), and Xiaobo Qu (Tsinghua University)

- paper: https://amazonkddcup.github.io/papers/8572.pdf
- code: https://github.com/wufanyou/KDD-Cup-2022-Amazon
- sides: https://amazonkddcup.github.io/slides/8572.pdf
- posters: https://amazonkddcup.github.io/posters/8572.pdf
- video: https://youtu.be/Ie9ZBKy-bpc

Third place ( 中国科学院北京石油化工研究所 & 浙江大学 & 蚂蚁集团 & 电子科技大学)

Team Uni: Chinese Academy of Sciences and Beijing Institute Of Petrochemical Technology & Zhejiang University & Ant Group

Ruiqing Yan (Chinese Academy of Sciences and Beijing Institute Of Petrochemical Technology), Peng Zhang (Zhejiang University), Linghan Zheng (Ant Group), Changyu Li (University of Electronic Science and Technology of China), and Rui Hu (Zhejiang University)

- paper: https://amazonkddcup.github.io/papers/1470.pdf
- sildes: https://amazonkddcup.github.io/slides/1470.pdf
- video: https://youtu.be/C8O3av_X35c

Task - 3

First place

Team day-day-up - Ant Group, Hangzhou, Zhejiang, China

Jinzhen Lin, Lanqing Xue, Zhenzhe Ying, Changhua Meng, Weiqiang Wang, Haotian Wang, and Xiaofeng Wu.

- paper: https://amazonkddcup.github.io/papers/3782.pdf
- sildes: https://amazonkddcup.github.io/slides/3782.pdf
- video: https://youtu.be/Q-rxLkqVwsM

Second place (Purdue & Tsinghua)

Team ETS-Lab - Purdue University & Tsinghua University

Yang Liu (Tsinghua University), Fanyou Wu (Purdue University), and Xiaobo Qu (Tsinghua University)

- paper: https://amazonkddcup.github.io/papers/8572.pdf
- code: https://github.com/wufanyou/KDD-Cup-2022-Amazon
- sides: https://amazonkddcup.github.io/slides/8572.pdf
- posters: https://amazonkddcup.github.io/posters/8572.pdf
- video: https://youtu.be/Ie9ZBKy-bpc

Third place ( 中国科学院北京石油化工研究所 & 浙江大学 & 蚂蚁集团 & 电子科技大学)

Team Uni: Chinese Academy of Sciences and Beijing Institute Of Petrochemical Technology & Zhejiang University & Ant Group

Ruiqing Yan (Chinese Academy of Sciences and Beijing Institute Of Petrochemical Technology), Peng Zhang (Zhejiang University), Linghan Zheng (Ant Group), Changyu Li (University of Electronic Science and Technology of China), and Rui Hu (Zhejiang University)

- paper: https://amazonkddcup.github.io/papers/1470.pdf
- sildes: https://amazonkddcup.github.io/slides/1470.pdf
- video: https://youtu.be/C8O3av_X35c

加小助手领取比赛数据集 + 论文PPT打包


 竞赛交流群 邀请函  #

△长按添加竞赛小助手
添加Coggle小助手微信
(ID : coggle666)


每天Kaggle算法竞赛、干货资讯汇总

与 24000+来自竞赛爱好者一起交流~


文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论