【译】深入的学习可以帮助机器人学习人类行走的方式

发表于2016-02-21

　　机器人达尔文，他行走的时候经常摇摇晃晃，有的时候他还会跌倒，但是不像大多数的机器人，他就像人类所做的一样，会对自己的错误做出回应—并且在前进中调整他的动作。

　　他这种婴儿学步的行为恰恰可以引领新一代自主机器人的潮流，他们可以自主的适应不断变化的环境和新的形势而不需要人类重新对他们进行编程。这些机器人可以执行危险任务，例如，组织救援行动或者清理灾区等。他们也可以成为看家护院的好帮手或者跨城镇寄送包裹。

　　“一个自主机器人能设定高层次的目标，并能够找出达到这个目标的方法，”伯克利市加利福尼亚大学的一位领导达尔文研究课程的博士后研究员Igor Mordatch 说道。”那将非常非常强大而且有力。“

机器人如何学习

　　达尔文的智慧来自于脑中两块能够深度学习网络的GPU加速。深度“学习“发生在有许多层的模拟神经网络中，他的运算法则则是模仿的人类大脑。这些神经网络学习就像我们人类一样，是靠针对反馈回来的信息来加强或减弱神经元之间的联系。

　　达尔文的学习是分两个阶段的：模拟中和现实世界中，Mordatch给达尔文创建了一个基础的外表的模拟模型（身高、腰身等等），同时也设定了一些基础的环境属性（例如，平坦或者不平的地面）。

　　他并没有教达尔文如何行走。

　　在模拟中，达尔文可以根据他所知道的内容计算出正确的下一步动作，例如在走向某个位置如何摆动他的胳膊，或者扭动躯干使自己站在一个更舒适的位置。

　　　没有被教过，深度学习机器人从躺在地板到站立起来。华盛顿大学图书馆的图片

飞翔式学习

　　在第二阶段中，达尔文需要在实际中运用他在第一阶段模拟中学到的站立、保持平衡并接近目的地。事情变得棘手了，当他开始甩开胳膊大步行走的时候他可能需要很即刻果断地决定他该如何保持平衡。如果他把踝关节弯曲地太狠他将会摔倒，然后还得回到原点重新开始。

　　“我们已经尽可能的让模拟的世界更精准，但是它也并不可能和真实世界一模一样，”Mordatch说，“这就是为什么我们需要飞翔式学习的原因。”

　　在这种复杂的学习中图形处理器是至关重要的。

　　“如果我们在CPU中给机器人训练，这将需要一周时间，但是如果我们在图形处理器中，3个小时就可以结束了，”Mordatch在使用TITAN X 图形处理器的时候这样说道。

深度学习与大脑

　　Mordatch工作于彼得阿布比尔实验室，他是加州大学伯克利分校的一名副教授。Mordatch在加州大学工作的基础上与Emo Todorov教授和Zoran Popović教授合作研究机器人。在他继续研究达尔文的同时，他也运用深度学习创建了一个模拟的人体模型，与斯坦福大学的教授们合作研究人类大脑如何控制运动的。

　　总有一天这方面的知识能够更好的帮助医生预防外科手术后对病人运动能力的影响。

分类：合作，深度学习

标签：深度学习，GPU

翻译自：< Deep Learning Helps Robot Learn to Walk the Way Humans Do

/http://blogs.nvidia.com/blog/2016/01/15/deep-learning-robot-walk>

原文作者未做权利声明，视为共享知识产权进入公共领域，自动获得授权

如社区发表内容存在侵权行为，您可以点击这里查看侵权投诉指引

标签：

游戏开发 GPU 神经网络 CPU

首页

出海助力

开发者社区

大奖赛

同行

合作案例

关于我们

【译】深入的学习可以帮助机器人学习人类行走的方式