喜剧俱乐部是我最喜欢的周末郊游。召集一些朋友,喝几杯,当我们大家听到一个笑话时,我们的目光相遇,并露出厚脸皮的笑容,这是一个神奇的时刻。
微笑可以把陌生人变成最亲密的朋友。它鞭策着 遇见可爱 好莱坞式的情节,修复破裂的关系,与模糊、温暖的欢乐感受有着千丝万缕的联系。
至少对于人们来说。对于机器人来说,他们尝试真诚的微笑常常会陷入恐怖谷——足够接近人类,但却会引起一丝不安。从逻辑上讲,你知道他们想做什么。但直觉告诉你有些事情不对劲。
可能是因为时机的原因。机器人经过训练可以模仿微笑的面部表情。但他们不知道什么时候该露出笑容。当人类交往时,我们会在没有任何有意识的计划的情况下真诚地微笑。机器人需要花时间分析人的面部表情才能重现笑容。对于人类来说,即使是几毫秒的延迟也会让人毛骨悚然——就像一部恐怖电影一样,有些东西让人感觉受到操纵和错误。
上周,哥伦比亚大学的一个团队 展示了一个算法 它教会机器人与人类操作员分享微笑。人工智能会分析轻微的面部变化,从而在操作员的表情发生之前约 800 毫秒进行预测——这段时间正好让机器人微笑回应。
该团队训练了一个名为 Emo 的软机器人人脸,以预测并匹配人类同伴的表情。 Emo 的硅胶脸呈蓝色,看起来就像 60 年代科幻小说中的外星人。但它很容易和它的人类伙伴一起以相同的“情感”波长微笑。
人形机器人在与人类交流时往往显得笨拙和生硬, 写 格拉斯哥大学的瑞秋·杰克博士没有参与这项研究。 ChatGPT 和其他大型语言算法已经可以使人工智能的语音听起来像人类,但非语言交流很难复制。
她写道,将社交技能(至少是面部表情)编程到物理机器人中是帮助“社交机器人加入人类社交世界”的第一步。
引擎盖下
从 机械手轴 给你送食物和饮料的机器人服务员, 自主机器人 越来越多地走进我们的生活。
在伦敦、纽约、慕尼黑和首尔,自治 机器人 快速穿过混乱的机场,为客户提供帮助——办理登机手续、寻找登机口或找回丢失的行李。在新加坡,几个 360 英尺高的 XNUMX 度视觉机器人 漫游机场 标记潜在的安全问题。疫情期间, 机器狗 强制保持社交距离。
但机器人可以做得更多。对于危险的工作,例如清理被摧毁的房屋或桥梁的残骸,他们可以率先开展救援工作,并提高急救人员的安全性。随着全球人口日益老龄化,它们可以帮助护士照顾老年人。
电流 类人机器人 卡通可爱。但机器人进入我们世界的主要因素是信任。随着科学家们制造出面孔越来越像人类的机器人,我们希望它们的表情符合我们的期望。这不仅仅是模仿面部表情。面对令人畏缩的笑话时,真诚地分享“是的,我知道”微笑,形成了一种纽带。
非语言交流——表情、手势、身体姿势——是我们用来表达自己的工具。与 ChatGPT 和其他 生成式人工智能,机器已经可以“通过视频和语言进行交流”, 说过 研究作者 Hod Lipson 博士 科学.
但当谈到现实世界时——一个眼神、一个眨眼和一个微笑就可以带来一切——这是“现在缺少的一个渠道,”利普森说。 “在错误的时间微笑可能会适得其反。 [即使晚了几毫秒],感觉就像你在迎合。”
笑一笑
为了让机器人进行非语言动作,团队专注于一个方面——共同微笑。之前的研究已经对机器人进行了预先编程来模仿微笑。但由于它们不是自发的,因此会造成轻微但明显的延迟,并使笑容看起来很假。
利普森说,“非语言交流中有很多东西”很难量化。 “我们拍照时需要说‘奶酪’的原因是因为按需微笑实际上非常困难。”
这项新研究的重点是时间。
该团队设计了一种算法,可以预测一个人的微笑,并让一个类似人类的电子动画脸同时微笑。名为 Emo 的机器人面部有 26 个齿轮(想想人造肌肉),包裹在有弹性的硅胶“皮肤”中。每个齿轮都通过磁铁连接到主要的机器人“骨架”上,以移动其眉毛、眼睛、嘴巴和脖子。 Emo 的眼睛内置摄像头,可以记录周围环境并控制眼球运动和眨眼动作。
Emo 本身可以追踪自己的面部表情。这项新研究的目标是帮助它解释他人的情绪。该团队使用了任何内向青少年都可能知道的技巧:他们要求 Emo 照镜子,学习如何控制其齿轮并形成完美的面部表情,例如微笑。机器人逐渐学会将其表情与运动命令相匹配,例如“抬起脸颊”。然后,该团队删除了任何可能使面部过度拉伸、损伤机器人硅皮肤的编程。
“事实证明……从机械角度来看,[制作]一张可以微笑的机器人脸是非常具有挑战性的。这比制造机械手更难,”利普森说。 “我们非常擅长发现虚假的微笑。所以我们对此非常敏感。”
为了抵消恐怖谷的影响,该团队训练 Emo 使用人类大笑、惊讶、皱眉、哭泣和其他表情的视频来预测面部动作。情绪是普遍存在的:当你微笑时,你的嘴角会弯成新月形。哭的时候眉头皱在一起。
人工智能逐帧分析每个场景的面部动作。通过测量眼睛、嘴巴和其他“面部标志”之间的距离,它发现了与特定情绪相对应的迹象——例如,嘴角上扬表明有一丝微笑,而嘴角向下则可能暗示着微笑。皱起眉头。
经过训练后,人工智能只需不到一秒的时间即可识别这些面部标志。当为 Emo 供电时,机器人面部可以在一秒钟内根据人类互动预测微笑,从而与参与者一起微笑。
需要明确的是,人工智能没有“感觉”。相反,它的行为就像人类在用看似真诚的微笑对有趣的站立式咯咯笑时的行为一样。
面部表情并不是我们与人互动时注意到的唯一线索。轻微的摇头、点头、扬眉或手势都会留下痕迹。无论文化如何,“嗯”、“啊”和“喜欢”或类似的词语都融入到日常互动中。现在,Emo 就像一个学会微笑的婴儿。它还不理解其他上下文。
“还有很多事情要做” 说过 利普森.我们只是触及了人工智能非语言交流的表面。但“如果你认为参与 ChatGPT 很有趣,那么只要等到这些事情变成现实,一切就都结束了。”