植物百科网
当前位置: 首页 农业百科

ai 学习游戏(AI打破了跑步游戏QWOP的世界纪录)

时间:2023-07-15 作者: 小编 阅读量: 1 栏目名: 农业百科

为此他打算向AI提供一些人类高手的过关数据。在经历了自我训练,人类数据的双重作用下,它勉强学会了跑步,但速度还不够,最终的纪录是1分08秒,离世界纪录还有一段距离。这次Liao取消了额外条件,让AI纯粹在速度方面做优化,最终在学习了ACER的跑步数据并结合自己近40个小时的训练后,新AI跑出了47.34秒的成绩,这已经打破了人类玩家所保持的纪录。当然,速通榜单要求提交成绩的玩家为人类,所以这个纪录暂时无法被认可。

更高,更快,更智能。

多年前有款奇葩跑步模拟游戏《QWOP》,玩家只需越过障碍,以最快的速度跑完一百米即可。游戏名的四个字母也并非缩写或者什么奇怪的暗示语,而是对应了操控游戏的四个按键。

虽然它的操作看上去并不复杂,但在刚发布时,甚至一度被玩家评为“史上最难的跑步游戏”,原因则在于键盘上的Q、W、O、P四个按键控制的不是上下左右,而是人物的左右大腿和小腿,玩家需要交替控制不同关节来让游戏里的小人动起来。

将平时司空见惯的动作细化到肌肉层面,难度瞬间提升了数个档次。刚接触的玩家不要说跑,能移动个一两米已经是奇迹,还有许多玩家是靠膝盖一步步蹭到终点的,就像上面那样。

目前,《QWOP》百米跑的世界最高纪录为48秒34,是一位ID为gunmaneko的日本玩家创下的:

世界纪录排行榜

一个星期前,日本玩家保持了两个月的纪录被打破,只不过这次破纪录的并非人类,而是一位科学家花40个小时训练出来的AI。

在公布的视频中AI用47.34秒跑完了全程,超过世界纪录1秒

Wesley Liao是波士顿咨询中心的一名数据分析师,他一直很好奇在人工智能已经攻克了象棋、围棋乃至竞技游戏的今天,在面对一款规则完全不同的“沙雕”游戏时,究竟会如何应对。

因此他想到了《QWOP》这款操作难度极高的游戏。需要说明的是,Liao使用的训练方法当然不是将预设好的操作提前输入程序,而是像训练象棋围棋那样设定好奖惩机制,让AI像新手一样一步步掌握规则,最终摸索出最优方法。

在Liao给出的实验报告中,最开始这个名为“ACER”的AI和许多玩家一样,采用的是“蹭膝通关法”,即用膝盖一步步蹭到终点:

在掌握了基本的规则后,ACER并没有像人们预想的那样跑起来,而是学会了使用这种效率不高的前进技巧,而原因很简单:因为这是最稳妥的通关方式,人物摔倒的几率最小。

当发现ACER能够熟练过关后,Liao试图再教会它如何“跑”。为此他打算向AI提供一些人类高手的过关数据。这一点其实和DeepMind训练Alpha Go的情况类似——让AI模仿顶级棋手,然后再自己对弈。

只可惜Liao并不认识《QWOP》的游戏高手,只能先提供自己的试玩数据,而他目前的最好成绩仅有28米。

果不其然,在被“灌输”了水平不高的人类数据后,ACER刚开始时试图靠“跑”来完成游戏,只可惜它的动作重新回到了初学者水平:

这时的AI并不理解“迈腿”的意义是什么

后来,Liao终于找到了一位世界速通玩家来协助他完成实验。这位玩家向Liao提供了50场游戏数据,其中就包括一些人类玩家经常使用,但AI从没见过的高级技巧。

但就算这样,ACER也无法马上学会这些技巧,而且不能和之前自己掌握的经验相协调。在经历了自我训练,人类数据的双重作用下,它勉强学会了跑步,但速度还不够,最终的纪录是1分08秒,离世界纪录还有一段距离。

最终Liao突发奇想,重新创建了一个AI,只给它ACER的运行数据,同时调整奖惩制度,取消了一些特殊动作,比如“膝盖过度弯曲”的触发惩罚,原先设定这些机制是为了教会它如何像人类一样跑步,既然现在ACER的数据已经学会了,自然不需要这些额外的限制。

这次Liao取消了额外条件,让AI纯粹在速度方面做优化,最终在学习了ACER的跑步数据并结合自己近40个小时的训练后,新AI跑出了47.34秒的成绩,这已经打破了人类玩家所保持的纪录。

当然,速通榜单要求提交成绩的玩家为人类,所以这个纪录暂时无法被认可。但Liao做这项研究的目的显然不是为了破纪录这么简单,观察AI在不同游戏环境下的反应,观察它们如何学习,也许某一天这些经验又能反过来指导人类,这才是科学家们真正想看到的。

    推荐阅读
  • 突触名词解释(突触是什么意思)

    突触名词解释突触是指一个神经元的冲动传到另一个神经元或传到另一细胞间的相互接触的结构。突触是神经元之间在功能上发生联系的部位,也是信息传递的关键部位。在光学显微镜下,可以看到一个神经元的轴突末梢经过多次分支,最后每一小支的末端膨大呈杯状或球状,叫做突触小体。这些突触小体可以与多个神经元的细胞体或树突相接触,形成突触。从电子显微镜下观察,可以看到,这种突触是由突触前膜、突触间隙和突触后膜三部分构成。

  • 《守望先锋》对战局影响大招top一览 守望先锋对局战绩

    今天小编要为大家带来的是玩家“黑呦酱”分享的《守望先锋》对战局影响大招top一览,感兴趣的玩家赶紧一起来看看吧!守望先锋大招分为四类,控制类,自身BUFF类,辅助类以及伤害类,由于伤害类大部分使用大招时,本体无法进行有效杀伤,且控制类及自身BUFF类需要其他技能的配合,so,此间因素也要加入考量。

  • 运动后喝黑咖啡还能燃脂吗 运动时喝黑咖啡会加快燃脂吗?

    2、运动过程中身体脂肪会加速燃烧,从而具有一定减肥作用;而黑咖啡热量比较小,加上其中含有大量的咖啡因以及维生素、纤维素物质,适量喝可以促进人体肠胃蠕动,加速脂肪代谢分解,对减肥具有促进作用。

  • 斯威汽车质量怎么样(斯威质量好不好)

    2018年6月起,斯威“品质特工队”以四大火炉的重庆作为起点,途径海南、吐鲁番、格尔木三地,历时近一年进行了数十万公里极限环境适应性试验。极端干燥高温环境下,常见车内温度往往会狂飙到60℃以上,而在斯威G01的车厢里,却始终能够保持清新凉爽的状态。一整套严酷考验下来,斯威G01的性能表现完全得以充分认证。这样一算,斯威G01差不多完成了近百万公里的专业级严酷考验。

  • 春天兰花怎么养 春天兰花怎么养浇水

    白墨兰花哪个品种最好白墨兰花是墨兰的珍贵变异品种假鳞茎椭圆形,已有数百年栽培历史,流传至今,不下十数个品种,它叶色莹润、体态优雅、幽香静远、且抗病,白墨兰花比较好的品种一般分企剑和软剑两个品系。什么兰花开花最香兰花品种很多,按花香来排,在兰花界春兰居首,惠兰次之,随后便是建兰、墨兰和寒兰,春兰的花香味最正宗,持久性也极强。

  • 奔驰e300l前进挡总共有几个(你看了奔驰22款E300L升级这套原厂HUD抬头显示效果觉得怎么样)

    从行车安全的角度来考虑,加装一台HUD是非常有必要的。HUD的全称是HeadUpDisplay,中文翻译过来就是抬头显示器。今天星骏汇小陈通过以上的产品配件图了解,我们看到这台奔驰22款E300L升级HUD抬头显示所需要更换的配件有,抬显仪器,高配仪表盖板,高配仪表电脑,雨量传感器,空调管升级HUD抬头显示把仪表台上的那一块盖板换掉,换成高配的预留好显示器孔位的盖板,装上显示器,从而使仪表显示的内容投射到挡风玻璃上面。

  • 儿童葫芦丝表演(通城千人共奏葫芦丝)

    儿童葫芦丝表演香城都市报讯 10月27日,通城县隽水中学参加湖北省“黄鹤杯”美育节节目视频录制现场,七、八年级千名学生,同奏乐曲《龙的传人》。该校相关负责人介绍,本学期,每天下午预备铃响5分钟,七、八年级各班集体合奏葫芦丝。丝竹声声,已渐成校园一道靓丽的风景线。近年来,该校贯彻落实社会主义核心价值观,注重未成年人思想道德建设,坚持开设中华传统和特色民族特色教育课程,促进学生“德智体”全面发展。

  • 鸡娃时代孩子的成长之道(与其1岁就开始鸡娃)

    出生时大脑发育已经完成25%,1岁完成了50%,3岁完成了60%,6岁达到90%。现在小学虽然是零基础入学,取消了统一考试,但是它对学生的要求并没有降低。吃够了佛系养娃的亏,橙子家的老二断然不肯再佛系养了。北京卫视于2018年摄制的纪录片《起跑线》中,有一个7岁的北京女孩令人印象深刻。她的家庭,在北京三环内有一套房,一辆车。妈妈认为,孩子从小培养兴趣,靠的是父母的指引。

  • 环氧树脂的作用与用途(环氧树脂有什么作用与用途)

    环氧树脂的作用与用途具有优良的物理和电绝缘性能,强度高、收缩性低,耐腐蚀以及有高绝缘的优势,所以被称为万能胶。电器、电机绝缘封装件的浇注。从常压浇注、真空浇注已发展到自动压力凝胶成型。长时间接触胶水时,有人会有细微的皮肤过敏和细微瘙痒疼痛的情况,建议在运用时戴上防护手套,如果出现了这样的情况,需要用酒精擦洗,然后用清水冲洗干净。

  • 明月曾照江东寒剧情(明月曾照江东寒剧情介绍)

    明月曾照江东寒剧情剧情简介:美少女战清泓是武林副盟主战破敌之女,从小被父亲禁止涉及江湖事。十年一期的武林大会即将来临,战清泓瞒着家人偷跑下山,立志夺取武林盟主之位。战清泓与温宥也开始互生情愫,奈何最终被世俗礼法所阻碍。与此同时,江湖上风起云涌,战清泓发现自己自幼背诵的家训竟是人人趋之若鹜的第一神功《鹤羽剑法》。