第三届腾讯开悟大赛正式启动联动高校破局AI研究瓶颈

时间：2024-11-07 17:37:45 来源：官方作者：一只小编辑OVO

来源：官方
作者：官方
编辑：一只小编辑OVO

8月18日，腾讯宣布第三届“腾讯开悟多智能体强化学习大赛”(下称“大赛”)正式启动。本届大赛由王者荣耀、腾讯AI Lab、腾讯新文创总部、腾讯云计算中心、腾讯高校合作、腾讯游戏学堂等共同发起，旨在促进产学研合作，推动人工智能研究的发展。

“开悟”是腾讯自主研发的AI开放研究平台。开悟具有首个高挑战MOBA模拟环境、自研AI框架及算法、高性能计算平台等，正逐步成为产学研结合的AI科研通用工具。同时，“开悟”平台依托于腾讯太极机器学习平台，可以实现更高效的资源调度，为使用者提供全栈打通的科研验证环境和辅助管理服务。

开悟大赛基于开悟平台而运行，为研究者开放王者荣耀游戏核心集群(Gamecore)及研究资源，并提供计算平台、评估工具以及其他研究支持服务，让参赛者得以测试并提升AI在MOBA游戏对战场景下的应用水平。

为了更好地支持开悟大赛，基于遨驰分布式云操作系统的新一代全球领先的异构加速引擎技术，腾讯云遨驰异构计算平台也为本届AI大赛提供了必不可少的资源及技术支持。

今年赛事延续往届邀请赛制，将参赛队伍数量扩大到37支，参赛队伍需要在指定的时间内，在给定的资源下训练出最优模型，并在王者荣耀1v1、3v3游戏测试环境中完成对局挑战。

此外，为进一步帮助更多研究者与爱好者降低研究门槛，开悟平台将于今年下半年启动分赛道“开悟成渝高校公开赛”的公开招募，成渝地区的高校学生均可报名，参与万元奖金角逐。

第二届开悟大赛决赛对局

大赛鼓励参赛团队对解决方案、模型结构设计、强化学习算法设计和训练方式持续探索，本届赛事还致力于推动研究智能体研究领域的热门课题“模型泛化性”——即模型在从未见过的数据面前，仍然保持一定适用性的能力。

以一个“识别猫图像”模型为例，如果其训练数据仅有狸花猫的图片，它很可能在“识别狸花猫图像”任务上取得很好的结果，但却无法识别其他品种的猫。提高模型的泛化性，有助于以更低的成本，训练出能够应对更复杂问题的智能体，例如智能体可以使用之前从未见过的工具完成任务。

当前业界主要关注在单智能体在相近任务上的表现，主要分为两个方向：1) 在不同但相似的任务中迁移;2) 在相同任务不同智能体之间迁移。如Meta World和RLBench提出在模拟环境中控制机械手臂完成多个不同的动作任务，例如开窗通风、开门、取球等。

本届开悟大赛将模型泛化性问题融入到赛题中，能提升参赛团队在强化学习基础学术水平，同时激励他们的创新性思维碰撞，寻找提升模型泛化性的全新思路。

2019年至今，开悟AI开放研究平台取得了多项成果：已成功主办两届“开悟多智能体强化学习大赛”、承办了成都大运会“世界大学生数智竞技邀请赛”AI赛道，并与国内多所顶级高校老师团队打造了创新课程合作项目等。

腾讯承办成都大运会数智竞技邀请赛

在赛事之外，开悟AI开放研究平台也在沉淀高校合作成果：北京大学、电子科技大学、清华大学、中国科学技术大学等4所高校教师团队，基于开悟平台打造的多智能体及强化学习创新专业课程已正式开课。系列课程有助于帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。截至今年，已有19所高校参与到了这个计划中。

据悉，中国科学科技大学参赛团队基于“开悟”赛事期间成果所产出的四篇游戏AI和强化学习相关论文，今年先后被IEEE学术会议及期刊收录。