当前位置:首页 >风度时尚 > 妆容

OpenAI 造出一款机械手臂,50 小时就能累积一百年的练习量

2018-09-04 09:40

由伊隆 · 马斯克(Elon Musk)兴办的非盈利性人工智能安排 OpenAI,今日向咱们展现了一项新的研究成果:让机械手能够像人手相同精准地操作物体。尽管这种仿真造型的手掌咱们现已见过很多了,但让 " 手指 " 能够和人类的真手相同灵敏可动,对机械结构来说可不是一件简略的事。

但你鄙人面的动图中也能看到,这套名为 Dactyl 的机械手体系能够依照指令要求,轻松完结滚动立方体的动作,并且这种杂乱精妙的指尖操作,也明显要比曩昔咱们所看到的机器人行走跳动杂乱得多。

Dactyl 自所以能够完结这么高效的运作,和 Open AI 运用的强化学习算法有联系。就像是刚出生的小孩相同,AI 或是机器人刚造出来后相同什么都不明白,假如你期望它能够彻底了解某项杂乱使命的流程,必定需求进行重复的操练。尤其是关于实在存在的物理机器人来说,研究人员往往要消耗很多的实际时刻对其进行辅导操练。

但 OpenAI 现在的做法,却是让机器人在虚拟环境中进行自我学习。他们还会在操练的进程中添加很多的随机事情,让 AI 在这个进程中自己领会出完结使命的窍门。

以这次的机械手掌为例,首要,他们会教训机械手臂依照指令,将六面立方体中的正确色彩翻转出来;然后便开端改动周围环境的灯火,以及立方体的色彩、分量和纹路等;乃至还会改动操练进程中的重力环境要素。

之所以会参加这些随机化的变量,也是为了让 AI 能更好的应对各种意外状况的发作:" 比如说不同的重力环境下,Dactyl 自己就会去领会这会对立方体操控形成哪些影响。否则在实际国际中,一旦咱们改动手臂的高度,立方体可能就会从手中滑落。"

这种虚拟环境的操练形式还有一个优点,那就是不会消耗实际国际的时刻。现在 Dactyl 现已堆集了大约 100 年的操练阅历,测验用很多种方法来操控立方体的滚动,但实际上这个进程只相当于咱们实际国际中的 50 个小时罢了。

在虚拟国际里完结操练后,AI 堆集的阅历就能够直接在实际国际中展现出来了。现在 Dactyl 现已能够接连完结 50 次的立方体旋转操作,且不会犯错。

值得一提的是,这种超高效的操练形式不仅能运用在物理机器人上,也相同能够用于其它的虚拟 AI 模型。在上一年 7 月份,OpenAI 开发的 Open AI Five 也相同在虚拟国际里阅历了上万个小时的学习,实际上仅仅花费了几天的时刻,然后它便在 Dota2 游戏中打败了工作选手 Dendi。

尽管仅仅一次 solo 对决而非 5v5,但仍旧让咱们看到了人工智能在电竞这种杂乱范畴的有效性,包含咱们所熟知的 " 围棋杀手 " AlphaGo,也是 DeepMind 公司运用深度强化学习操练出来的 AI 模型。

听说强化学习的创意最早来源于人类对天然界动物学习进程的长时间调查,之所以近几年内才开端测验,也是获益于神经网络技术的前进,以及 OpenAI 自身的规划优势。究竟想要完结这种超高效的强化学习流程,天然也得支付不小的运算本钱。

依照 OpenAI 给出的数据,Dactyl 的操练设备动用了约 6144 颗 CPU,以及 8 颗来自 Nvidia 的 V100 GPU,这种规划的根底硬件只要很少量的研究机构才能够运用。

不过也有机器人专家以为,OpenAI 这种程度的试验成果仍旧很限制,能否真实处理实际国际的人类难题仍然是一个未知数。

当前位置:首页 >风度时尚 > 妆容
此文章提到了
MORE
立方体相关阅读
机器人相关阅读
现实相关阅读
大家还在看
向你推荐
今日热词
资讯
  • 资讯
  • 妆品
  • 明星
  • 影视