机器能做人类想让它们做的事。但它们能否感知人类所能感知的情绪?情感运算(Affective Computing)拓展出更多可能。

作者:Eva Wolfangel
 

“你看起来很累。”旁边有个声音说,“也许你该去睡会儿觉。25分钟后我们会经过一家餐馆。我等会儿叫醒你,你可以去买杯咖啡。”我没注意到灯光变得更加温暖,我的精神放松了许多。车内播放的音乐节奏与我脉搏跳动的频率一致:节拍逐渐放缓,为的是让我放松下来。我微笑着。“通常情况下得花费更多时间才能说服你放松下来。做个好梦。”我的汽车对我说道。然后它继续载着我驶向汉堡参加会议。

——马克·迈耶(Marco Maier)描述出一幅未来的画面。

 

人与机器:相互配合:机器能够为我们指示道路方向、提醒约会日期,或在我们长期瘫坐不动时督促我们去做做运动。机器可以开车、烹饪、画画、奏乐、像医生一样作出基本中肯的诊断,并且可以在问题出现之前识别它们。然而对机器来说,人类这种复杂多变、难以捉摸的生物像是一个谜。问题在于:这种神秘感还能维持多久?

人与人之间的互动依赖于多种多样的沟通方式:语言、文字、表情或手势。而与计算机之间的互动也是基于这些要素。无论是编程代码还是文字指令,都是为了让机器能够准确执行人类需要它们执行的任务。用户界面对滑动手势作出响应。基于语音的界面可以听取口令。这就需要人类十分清晰地表达要求和发出指令。然而一些并未说出口的话与那些表达出的话语一样包含着众多含义。未来,机器不仅能够变得更加智能,还将变得富有同理心。比如,它们仅从声音就能识别我们的情绪。

在长达两年的时间里,来自洛杉矶南加州大学(USC)的印度裔美国科学家施力卡特·纳拉亚那(Shrikanth Narayanan)和他的同事们一同录下了婚姻咨询中的上百场诊疗对话。这些对话中包含有关到访者婚姻状况的信息。研究团队根据音量大小、声调高低、不稳定或爆发型的症状表现分析出算法,并将算法与声音数据一同输入计算机。最终获得了以下成果:这个系统能以百分之八十的准确性预言一对伴侣在观察期结束后是否能继续在一起还是分手。这甚至比在场提供咨询的治疗师的判断还要准确。“我对这项技术未来的发展前景十分乐观。”纳拉亚那说道。如今,这些系统在识别人类情绪方面已经可以做到与人类很接近的程度,“我们的声音能够传达非常多有关我们心理状态与身份的信息。”
 

情感运算的目标不仅在于使机器能够正常运转,而是希望机器同样能够适应人类,并理解他们的情感。凭借越来越多语音助手的问世,信息学研究领域迎来了一次蓬勃发展。没有其他任何一种人类表达方式能像声音那样传达如此丰富的情绪。声音是人与机器实现信息交换的基础要素。

随着机器的自主性不断提升以及应用领域的不断扩大,人机之间的情感联系也在发生变化。作为“智能代理”,机器不会僵硬地遵循指令,指令仅能够给机器一个活动空间与优化目标。从基于人工智能(KI)的抽象业务流程优化系统到自动驾驶——机器能够独立作出影响日常生活的决策:例如在结束疲惫紧张的工作之后回到家里,发现灯光已被调节为柔和浪漫的亮度,屋内温度或音乐声量都恰到好处,洗澡水已经放好。

“情感人工智能技术能够识别单一变量最细微的变化,并由此推导出一个人的情绪状态。不仅语言,视觉和生理数据更能为此提供有价值的信息。”来自TAWNY公司的马克·迈耶博士如是说。TAWNY公司专注于研究情感运算,并已在日常生活中对这项技术进行了实践检验:在一个团队中究竟应该如何分配工作,以便一部分人不会负担过重且压力过大,而另一部分人不会因要求过低而感到无聊?智能系统可独立优化工作流程,衡量并考虑工作安排对安全、生产能力和员工舒适度的影响。具有共情能力的消费者终端能根据使用者的状态动态调整自己的功能性。在这项技术的支持下,专业运动员能够训练自己尽可能长时间沉浸于心流状态,保持高度专注。销售人员可以通过这项技术练习得体的举止与内在态度。

世界上大多数机器的情商为0。现在已经很清楚了:未来,机器不仅能够变得更加智能,还将变得富有同理心。


世界上大多数机器的情商为0。现在已经很清楚了:未来,机器不仅能够变得更加智能,还将变得富有同理心。


若想在沟通交流时不产生任何误会,就必须能够正确评估一个人的情绪。由此出现了第二种趋势:泛在计算(Pervasive computing)、“无处不在(durchdringend)”或“普适计算(Ubiqutous Computing)”——被包罗万象的计算机所包围。

美国乔治亚理工大学(Georgia Tech University)教授、同时也是谷歌眼镜的技术研发人员萨德·史塔纳(Thad Starner)是该领域的一位先驱。25年来,史塔纳始终像穿外套与裤子一样自然地穿戴着一台计算机——过去他需要在腰间挂一个盒子状的物体,还得携带一幅笨重的显示器眼镜,裤兜里揣着一个小型键盘,他可以在这个键盘上进行盲操作。“我就像个电子人一样。”史塔纳这样评价自己。他还清楚地记得自己如何在散步时写毕业论文,以及在办公室长沙发上躺着熟背书本内容的场景。学生们在思考,而他在走神。

早在十年前,史塔纳就已经将智能手机弃置在一旁:“这玩意太麻烦了。人们的双手总不能得闲。”取而代之,他至今始终偏爱内嵌计算机的眼镜。这种眼镜的体积变得越来越小,未来可能会小到无形。虽然目前还不能实现突破性成就,但史塔纳确信在不久的将来,这种结合了语音指令与情绪状态评估的智能系统能够识别用户当下的需求:无论是天气预报还是赴约路线导航——此外它们还可以识别用户是否处于压力之中、是否有个紧急约会或者只需转接几个重要来电。这种智能系统能够“感知”佩戴者正在做什么,并预测他接下来的计划,例如借助增强现实技术(Augmented Reality)在一台智能眼镜或直接在工作台上投影出下一步工作指示——它们能够在正确的时刻为用户提供关键性的灵感,以此悄无声息地为用户提供帮助。“无所不知的组织者。”来自德国格拉茨技术大学(TU Graz)的增强现实技术专家、著有《增强现实技术——原理与实践》(Augmented Reality – Principles and Practice)的迪特·史马什蒂格(Dieter Schmalstieg)如此评价这样的智能设备,“信息将成为现实世界的一部分。”
 

 

如今,现代化汽车作为“车轮上的仪器”早已在孜孜不倦地收集着各类数据。例如当驾驶员兴奋或暴怒时,传感器能通过皮肤电导率或脉搏频率报告驾驶员的情绪紧张程度——并作出适当的反应。位于斯图加特的弗劳恩霍夫劳动经济与组织研究所(IAO)为未来的自动化驾驶开发出了演示器和原型。它们遵循普适计算结果,通过分析驾驶员与乘客的眼球运动等判断他们此刻的精神状态。它们能够识别驾驶员是否疲惫或注意力不集中,然后打开车内蓝色灯光或轻微移动一下方向盘,以便驾驶员能再次集中注意力。

这些能够根据情绪作出调整的机器将改变我们的未来。“增加情感和社交信息可以实现人与技术之间的互动合作。”来自德国VDI/VDE创新与技术有限公司的坦娅·特尼·汉森-史外泽(Tanja Terney Hansen-Schweitzer)这样说道。至于感受如何,人们可以在德国联邦教育与研究部组织的,围绕“用于最佳人机交互的社交和情感敏感系统”这一资助重点课题的会议中自行体验:

一名坐在动感单车上的男子将脚踩上踏板,卖力地蹬着单车。但突然,他的脸变得扭曲起来。“ 你看起来好像感觉到了疼痛。”他的教练一边说着,一边用充满同情的目光看着他。“试着蹬慢点。”这名男子遵从了教练的建议。教练表示满意:“这次好多了。”

这个教练并不是一个人,而是投射在对面墙上大屏幕上的一个具象化的“人物化身”。他能奇迹般地感觉到他的学生正处于何种状态——这是德国奥格斯堡大学(Universität Augsburg)与乌尔姆大学医院(Ulmer Uniklinikum)合作的一个项目。


这个教练并不是一个人,而是投射在对面墙上大屏幕上的一个具象化的“人物化身”。


这种屏幕上的虚拟教练尤其适合帮助老年人在运动时确定合适的运动量。他能解读人们的面部表情,也可以分析例如粗声吸气与呼气的杂音。此外,该系统能够测量用户的皮肤电导率和脉搏频率,从而记录他们的受压和超负荷现象。不仅如此,虚拟教练还可根据对面用户的感受调整自己的表情与手势。

比约·舒勒(Björn Schuller)创立了一家创业公司,基于声音的情绪识别是其提供的服务项目之一:Audeering公司。“情感很重要,因为人们需要情感来生存下去。对人工智能而言,情感同样重要。”对舒勒来说,机器在理想状态下应当能够像人类之间彼此适应那样适应人类。作为研究基地,德国和美国均为这个专业领域提供了强大的推动力。
 

Audeering公司的客户中有些是市场调查公司,它们不仅需要收集客户对产品的评价,还需要根据客户的声音确定这个产品的受欢迎程度。此外,舒勒提到对网络上(例如Youtube视频网站)的声音数据进行分析将会是一个巨大的市场:在网络上,人们可以“实时跟踪关注观点的形成”。舒勒坚信:在不久的将来,情感敏感系统将能与人类展开对话——而不仅仅借助语音控制设备。苹果公司开发的语音助手Siri这样答复一则求婚指令:“谢谢你的好意。”然而在真正的谈话场景中,这场对话并不会就此结束,“要实现这一目标,必须能够对情绪进行感知。”舒勒说道,“由此,计算机可以完美地分析情绪,并知道我何时强势或虚弱,何时快乐或悲伤。”

“社交敏感型与合作型系统是未来的大势所趋。” 来自德国比勒菲尔德大学(Uni Bielefeld)的史蒂芬·库普(Stefan Kopp)教授说道,他同时还担任“社会认知系统”(Social Cognitive Systems)工作组组长。前提是;机器学会适应人类。当机器无法适应人类时会发生什么?对此可以参见德国人工智能研究所与社交弱势青少年一起进行的试验,内容是一名虚拟教练与青少年共同训练如何进行求职面试。试验期间,研究人员对情感识别系统进行了修正改造。因为在未经改造的第一次尝试中,试验结果十分糟糕——至少对于技术设备而言是毁灭性的。其中一名用户明显感觉虚拟教练带给自己太多压力与恐惧,始终让自己处于不愉快的情绪之中,并且无视自己的情感状态。这名少年毫不犹豫地将显示器与虚拟教练从窗户扔了出去。

 


伊娃·沃夫安格尔(Eva Wolfangel)是一名科学与报道记者,同时也是演说家和主持人。她报道有关改变人类生活的科学技术,并为许多著名刊物供稿,包括《德国时代周报》(Die Zeit)、《GEO视界》、《科技评论》(Technology Review)与《明镜周刊》(Der Spiegel)。