中国商务网>资讯 > 科技 >

“马里奥”乘风破浪:这个人工智能一口气通过了29级

2020-08-11 15:57　来源：IT之家

《马里奥》乘风破浪：这款人工智能一口气通过29个级别来源：大数据文摘微信公众号

马里奥系列游戏自诞生以来就风靡全球，伴随着无数人的童年。

人工智能出现后，许多技术咖啡馆开始尝试。你能用人工智能完成马里奥的通关梦想吗？

例如，一个疯狂的马里奥游戏爱好者，在GitHub上贡献了两种不同的方法，可以让马里奥轻松地在障碍间行走！去年6月，乌维潘在2016年的《老友记》上开玩笑说，马里奥的藏蛋是无法被发现的。“马里奥的灵魂不吃所有的蘑菇”~“你应该研究如何在顺利通关的同时获得所有的积分”~

尽管通关没有成功，但乌维潘在他的Github中将A3C分解成更小的部分，以照顾那些不熟悉强化学习的人，并用通俗语言解释了什么是A3C算法以及如何通过这种算法实现。

抽象细菌也借此机会帮助你回顾什么是演员-评论家算法。

让我们这样想。你的经纪人有两个角色，演员和评论家。演员就像一个顽皮的小男孩，大胆地探索他周围美好的世界，而评论家就像他的父亲，需要监督他。只要孩子做了好事，他的父亲就会表扬和鼓励他将来做同样的事情。当然，当一个孩子做错事时，他的父亲会警告他。一个孩子与世界互动越多，他采取的行动就越多，从他父亲那里得到的积极和消极的反馈也就越多。

孩子的目标是从父亲那里收集尽可能多的积极反馈，而父亲的目标是更好地评估儿子的行为。换句话说，演员和评论家之间是一种双赢的关系。

优优算法相当于这样一个事实：为了让孩子学得更快、更稳定，父亲不会告诉儿子他的行为有多好，但会给他一个例子，告诉他在哪些方面比其他行为做得更好。有时候一个例子胜过千言万语。

接下来要说的是让马里奥通过海关的关键！对于异步的演员-评论家优势算法，它就像为孩子们提供一个“学校”。有了“老师”和“同学”，孩子们可以学得更快、更全面。此外，在学校，孩子们可以合作完成一个项目。他们每个人都可以为同一个目标做不同的任务。这样不是更有效率吗？

同样，乌维潘把他使用的所有相关代码都放到了Github上，感兴趣的朋友可以去了解一下：

https://github.com/uvipen/Super-mario-bros-A3C-pytorch

读完这篇文章，学生们是否像抽象细菌一样好奇这个学生是谁，抽象细菌真的被发现了吗~

越南人，一个热爱自然语言处理和简历游戏的小专家

一个Github用户，是越南人。

https://www.gitmemory.com/uvipen

原来这个学生拥有计算机科学的硕士学位，主修人工智能和机器人学。他的主要研究兴趣是自然语言处理和计算机视觉。目前在德国柏林。

在他的个人项目中，一个名为“快速绘图”的项目赢得了684颗星，这是他众多项目中最受欢迎的一个。

这是他用Python开发的一个在线游戏。你可以直接在相机前画一些棒状图形，比如门、衣服、裤子和其他容易辨认的物体。系统可以首先识别出你正在画什么，然后从远处根据你画的轮廓识别出你正在画什么。

例如，小弟弟用手画了一条裙子：

科技焦点...

图文推荐...

猜你喜欢...

科学家发现内分泌干扰物的“十大特征”

科学家找出内分泌干扰物“十大特征”|关键特征|内分泌|科学家

2019-11-13 10:02
“雪龙2号”驶向南极

“雪龙2”号首进南极|雪龙

2019-11-12 14:17