这家神秘公司欲造新型AI:通过人工遥控学习

 尊龙d88认定AG发财网     |      2024-02-03 05:58

  网易科技讯3月4日消息,据国外媒体报道,一家名为Kindred AI的神秘加拿大创业公司在利用人工虚拟现实“向导”来教导机器人执行新任务。它的最终目标是创造一种新型的人工智能技术。

  通过给机器人配对佩戴虚拟现实头盔和手握运动追踪控制器的人类“向导”,Kindred教导它们如何超快速地执行相对棘手的灵巧型任务。

  该技术让人们可以一瞥未来人类可以如何跟机器同步协作,展示如何通过利用人类的能力来强化自动化系统的功能。尽管业界普遍担忧机器人和人工智能将会抢走人类的工作岗位,但还有很多事情机器还是无法胜任。该公司上周向《麻省理工科技创业》(MIT Technology Review)展示了该项技术,称计划未来几个月推出一款面向零售商的产品。它的长期雄心甚至更为宏大。Kindred希望,该项人类辅助学习将会催生一种全新的、更加强大的人工智能技术。

  Kindred由加拿大本拿比的量子计算公司D-Wave出身的几位人员创立。它目前在测试一些常规的工业用机器手臂,这些机器手臂能够快速而可靠地抓取和放置难以握持的物品,比如小件的衣服。有时候,它们需要请求人工团队提供帮助,该团队会利用虚拟现实硬件来了解它们遇到的挑战,然后临时控制机器手臂。

  “向导能够看到机器人所看到的,听到它所听到的,感觉到它所感觉到的。当向导行动时,那些动作也会让机器人动起来。”Kindred联合创始人兼CEO、D-Wave联合创始人乔第·罗斯(Geordie Rose)表示,“这让我们能够给机器人展示如何像人类那样行动。人类在各种机器人控制上都不是最快速或者最擅长的,比如将物品放在特定的位置,但人类还是最擅长搞懂棘手或者意料之外的状况。”

  Kindred的系统使用数个机器学习算法,会尝试预测哪一种算法会带来最好的结果,比如最能帮助抓握物品。如果没有一个算法可带来高成功率,但系统就会请求人工帮助。最重要的是,这些算法会学习人类控制员的动作。为了实现这一点,该公司采用一种强化学习技术。该技术涉及通过试验和强化行为来实现特定的目标。

  罗斯称,该系统抓握小件衣服的速度达到人工单独操作的两倍,如机器人独立操作,则难以完成任务。一个人员还可以同时操作几个机器人。

  罗斯补充道,Kindred在探索各种人工参与的系统,从只是让人点击图片来给机器人展示抓握点的系统,到控制人形机器人的全身外骨骼。他说,向导通常是学习如何有效地控制远程的机器人系统。

  该技术的开发灵感来自于前D-Wave高级研究员、Kindred首席科学官苏珊娜·吉尔德特(Suzanne Gildert)。该公司低调运营了几年时间,但随着吉尔德特提交的专利申请细节浮出水面,它引起了关注。该专利描述的是一个结合不同遥控操作和机器学习技术的机制。的确,Kindred对于其技术的愿景似乎已经远远超过开发更擅长整理东西的机器人的范畴。

  “我们的想法是,如果你能够展开时间足够长的研究,如果你有某种AI系统在后台学习,那么你或许可以尝试很多不同的AI模型,看看哪些模型的训练效果更好。”吉尔德特说道,“我的想法是,如果你能够让人类通过机器人来进行演示操作,那机器人没有理由无法学习得像人类那样。”

  最引人注目的是,Kindred的专利甚至描述了让这类系统由诸如猴子的动物控制的可能性。吉尔德特表示,这只是个想法,公司目前还没有雇用猴子。然而,她透露,公司倒是有只机械猫,经过强化学习技术的训练,它能够在办公室里四处走动。

  Kindred还有个不同寻常之处:几位创始人都是物理学家,而不是机器人学家或者计算机科学家。不过罗斯指出,这带来了独特且有价值的视角。“对于计算机科学家来说,模拟和现实世界之间的界线有时候很模糊,”他说,“而我们则非常偏爱在真实机器人身上做我们在现实世界中会做的事情。”

  Kindred的解决方案似乎有着巨大的潜力。加州大学伯克利分校研究机器学习和机器人的教授肯·戈德伯格(Ken Goldberg)表示,人类技能将会大大加速机器人的学习速度。正研究将类似技术应用于机器人手术的戈德伯格补充道,让机器人学习人类是一个非常活跃的研究领域。“我认为它在机器人学领域是一大机会,”他说,“让人类来示范有很大的益处。”

  不过,通过人工遥控操作来学习的技术挑战不可谓不小。麻省理工学院研究遥控操作人形机器人的副教授Sangbae Kim指出,将人的控制映射到机器动作上,是件极其复杂的事情。“第一个挑战是,通过将刚性构件附加到人的皮肤上来追踪人的动作。这非常困难,因为我们是内骨骼动物。”他说,“更大的挑战在于,真正理解人在操作时的决策步骤的所有细节,要知道这些决策往往是下意识的决策。”

  但Kindred的几位创始人对此并不担心。“我们的目标是解构认知过程。”罗斯说,“所有的生物体都遵循特定的行为和行动模式。我们正尝试打造有跟人一样的行动机理的机器。”(乐邦)