【新知关键词:无监督学习】
据谷歌博客研究室网站日前报道,在上个月将波士顿动力公司出售给软银之后,谷歌并没有终结机器人探索之路,而是相继发表了数篇关于机器人学习的研究论文,试图开发机器人的无监督学习功能。
在这里,监督并非指是否有人看守,而是指一种标签状况。在机器学习中,程序员编写代码,设定动作,机械按照代码内容,完成任务,这属于监督学习。整个过程中的每一步骤都存在标签,机器人就像刚学写字的小学生,老师说如何做就如何做。但无监督学习则是不安插标签,机器人此时已晋级成为高中生,在老师的教导下学会了各种解题方法,考试中的未知题目,都能用学过的方法解题。
对人类来讲,无监督学习是本能,孩子只要经常看大人拿筷子吃饭,自然就学会握筷子的技巧。研究者希望机器学习也能如此,因此在第一篇论文《用于模仿学习的无监督感知激励》中,谷歌就用“开门”的简单动作构造出极小数据集,并在机器人身上启用深度视觉特征技术,使其无需培训就能懂得动作含义,并以无监督的学习方式习得激励函数。
而在第二篇论文《时间对比网络:从多视角观察中进行自我监督学习》中,谷歌则提出让机器人依靠观察向周围世界学习。比如完成姿态模拟任务时,研究者并不首先定义人体关节与机器人躯干之间的映射关系,而是让机器人进行“端到端”的模仿学习。在观察训练中,即便没有提供映射关系,机器人也可以自主发现对应方式,并模仿人的姿势。
在另一篇《“端到端”的语义掌握学习》论文中,谷歌还将人工标注的数据和机器人自动收集的数据相组合。首先让机器人自主抓取物体,获得数据集,随后对成功抓取的案例进行拍照和人工标注,将物体与指令联系到一起,从而让机器人习得语义,自主完成抓取任务。
在业界人士看来,谷歌出售波士顿动力公司本就是双赢行为,既是为谷歌在机器人领域重辟新路制造机会,又是为软银加速走向机器人领跑地位铺垫。如今,谷歌研究室已着手推进无监督学习的研究,有了深度视觉、语义理解等核心技术,未来机器人的学习能力将不亚于人类。