“马里奥”乘风破浪:这个人工智能一口气通过了29级

2020-08-11 15:57 来源:IT之家

《马里奥》乘风破浪:这款人工智能一口气通过29个级别来源:大数据文摘微信公众号

马里奥系列游戏自诞生以来就风靡全球,伴随着无数人的童年。

人工智能出现后,许多技术咖啡馆开始尝试。你能用人工智能完成马里奥的通关梦想吗?

例如,一个疯狂的马里奥游戏爱好者,在GitHub上贡献了两种不同的方法,可以让马里奥轻松地在障碍间行走!去年6月,乌维潘在2016年的《老友记》上开玩笑说,马里奥的藏蛋是无法被发现的。“马里奥的灵魂不吃所有的蘑菇”~“你应该研究如何在顺利通关的同时获得所有的积分”~

尽管通关没有成功,但乌维潘在他的Github中将A3C分解成更小的部分,以照顾那些不熟悉强化学习的人,并用通俗语言解释了什么是A3C算法以及如何通过这种算法实现。

抽象细菌也借此机会帮助你回顾什么是演员-评论家算法。

让我们这样想。你的经纪人有两个角色,演员和评论家。演员就像一个顽皮的小男孩,大胆地探索他周围美好的世界,而评论家就像他的父亲,需要监督他。只要孩子做了好事,他的父亲就会表扬和鼓励他将来做同样的事情。当然,当一个孩子做错事时,他的父亲会警告他。一个孩子与世界互动越多,他采取的行动就越多,从他父亲那里得到的积极和消极的反馈也就越多。

孩子的目标是从父亲那里收集尽可能多的积极反馈,而父亲的目标是更好地评估儿子的行为。换句话说,演员和评论家之间是一种双赢的关系。

优优算法相当于这样一个事实:为了让孩子学得更快、更稳定,父亲不会告诉儿子他的行为有多好,但会给他一个例子,告诉他在哪些方面比其他行为做得更好。有时候一个例子胜过千言万语。

接下来要说的是让马里奥通过海关的关键!对于异步的演员-评论家优势算法,它就像为孩子们提供一个“学校”。有了“老师”和“同学”,孩子们可以学得更快、更全面。此外,在学校,孩子们可以合作完成一个项目。他们每个人都可以为同一个目标做不同的任务。这样不是更有效率吗?

同样,乌维潘把他使用的所有相关代码都放到了Github上,感兴趣的朋友可以去了解一下:

https://github.com/uvipen/Super-mario-bros-A3C-pytorch

读完这篇文章,学生们是否像抽象细菌一样好奇这个学生是谁,抽象细菌真的被发现了吗~

越南人,一个热爱自然语言处理和简历游戏的小专家

一个Github用户,是越南人。

https://www.gitmemory.com/uvipen

原来这个学生拥有计算机科学的硕士学位,主修人工智能和机器人学。他的主要研究兴趣是自然语言处理和计算机视觉。目前在德国柏林。

在他的个人项目中,一个名为“快速绘图”的项目赢得了684颗星,这是他众多项目中最受欢迎的一个。

这是他用Python开发的一个在线游戏。你可以直接在相机前画一些棒状图形,比如门、衣服、裤子和其他容易辨认的物体。系统可以首先识别出你正在画什么,然后从远处根据你画的轮廓识别出你正在画什么。

例如,小弟弟用手画了一条裙子: