8月18日,腾讯宣布第三届“腾讯开悟多智能体强化学习大赛”(下称“大赛”)正式启动。本届大赛由王者荣耀、腾讯AI Lab、腾讯新文创总部、腾讯云计算中心、腾讯高校合作、腾讯游戏学堂等共同发起,旨在促进产学研合作,推动人工智能研究的发展。
“开悟”是腾讯自主研发的AI开放研究平台。开悟具有首个高挑战MOBA模拟环境、自研AI框架及算法、高性能计算平台等,正逐步成为产学研结合的AI科研通用工具。同时,“开悟”平台依托于腾讯太极机器学习平台,可以实现更高效的资源调度,为使用者提供全栈打通的科研验证环境和辅助管理服务。
开悟大赛基于开悟平台而运行,为研究者开放王者荣耀游戏核心集群(Gamecore)及研究资源,并提供计算平台、评估工具以及其他研究支持服务,让参赛者得以测试并提升AI在MOBA游戏对战场景下的应用水平。
为了更好地支持开悟大赛,基于遨驰分布式云操作系统的新一代全球领先的异构加速引擎技术,腾讯云遨驰异构计算平台也为本届AI大赛提供了必不可少的资源及技术支持。
今年赛事延续往届邀请赛制,将参赛队伍数量扩大到37支,参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并在王者荣耀1v1、3v3游戏测试环境中完成对局挑战。
此外,为进一步帮助更多研究者与爱好者降低研究门槛,开悟平台将于今年下半年启动分赛道“开悟成渝高校公开赛”的公开招募,成渝地区的高校学生均可报名,参与万元奖金角逐。
第二届开悟大赛决赛对局
大赛鼓励参赛团队对解决方案、模型结构设计、强化学习算法设计和训练方式持续探索,本届赛事还致力于推动研究智能体研究领域的热门课题“模型泛化性”——即模型在从未见过的数据面前,仍然保持一定适用性的能力。
以一个“识别猫图像”模型为例,如果其训练数据仅有狸花猫的图片,它很可能在“识别狸花猫图像”任务上取得很好的结果,但却无法识别其他品种的猫。提高模型的泛化性,有助于以更低的成本,训练出能够应对更复杂问题的智能体,例如智能体可以使用之前从未见过的工具完成任务。
当前业界主要关注在单智能体在相近任务上的表现,主要分为两个方向:1) 在不同但相似的任务中迁移;2) 在相同任务不同智能体之间迁移。如Meta World和RLBench提出在模拟环境中控制机械手臂完成多个不同的动作任务,例如开窗通风、开门、取球等。
本届开悟大赛将模型泛化性问题融入到赛题中,能提升参赛团队在强化学习基础学术水平,同时激励他们的创新性思维碰撞,寻找提升模型泛化性的全新思路。
2019年至今,开悟AI开放研究平台取得了多项成果:已成功主办两届“开悟多智能体强化学习大赛”、承办了成都大运会“世界大学生数智竞技邀请赛”AI赛道,并与国内多所顶级高校老师团队打造了创新课程合作项目等。
腾讯承办成都大运会数智竞技邀请赛
在赛事之外,开悟AI开放研究平台也在沉淀高校合作成果:北京大学、电子科技大学、清华大学、中国科学技术大学等4所高校教师团队,基于开悟平台打造的多智能体及强化学习创新专业课程已正式开课。系列课程有助于帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。截至今年,已有19所高校参与到了这个计划中。
据悉,中国科学科技大学参赛团队基于“开悟”赛事期间成果所产出的四篇游戏AI和强化学习相关论文,今年先后被IEEE学术会议及期刊收录。
腾讯人工智能科教联盟
基于开悟平台,腾讯AI Lab和王者荣耀将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找AI技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。
手机浏览
微信公众号