我正在研究情感计算。特别是,我正在研究情绪识别部分,即识别用户/主题所感受到的情绪的任务。例如,affectiva可用于此目的。我担心的不是这些模型的有效性,而是我们将如何处理它们。
怎么回应情绪?计算机能真正理解用户的情绪吗?
我正在研究情感计算。特别是,我正在研究情绪识别部分,即识别用户/主题所感受到的情绪的任务。例如,affectiva可用于此目的。我担心的不是这些模型的有效性,而是我们将如何处理它们。
怎么回应情绪?计算机能真正理解用户的情绪吗?
计算机能理解用户的情绪吗?
理解这个词是多维的,所以描述理解的程度——情感或其他——是一项棘手的任务。尽管如此,某些形式的人工智能情感理解是可能的。
一个有趣的简单案例
即使是速度敏感音乐键盘的嵌入式程序也能在原始水平上感知情感。使用键下压速度来驱动起音、音色和音量等音符参数,可以让完成用户的情绪通过软件传递到音乐的情感内容中,听众可以像使用非数字乐器一样体验自然。
更高级的情绪能力
在另一个极端是广泛的人类情感能力。一个例子是咨询专业人士典型听力技能下的一组复杂识别功能。
问题中提到了情感计算一词。辅导员可能会注意到被辅导者的影响、阅读语气、面部表情序列和肢体语言。由此,可以更清楚地了解被辅导者的内心情绪状态。这些识别和分析能力可以比对功能性 MRI 的精湛分析或血液中神经化学代谢物的检测更准确、更全面地确定受试者的内部情绪状态。
似乎没有任何理论原则可以限制计算机掌握辅导员技能的前端,即识别情绪以产生编码的情感序列。软件在多大程度上可以解释情感序列(结合并发的自然语言表达)并确定人类的情绪状况(和潜在的市场导向决策模式)还有待确定。
除了情感识别和解释的技能之外,还有其他情感能力。同情心在很大程度上是在没有以自我为中心的动机的情况下伦理与情感识别和解释的结果的逻辑整合。情感模仿的加入会产生同理心。
在自动机中开发这种能力比电子商务的肤浅和短视的动机更重要。可能有玩具、教育、娱乐和补救技术社会日益冷淡的应用。(这将在下面进一步讨论。)
识别、解释、将伦理领域的规则或元规则应用于这些解释以及模仿的功能很可能在数字系统的能力范围内。
艾萨克·阿西莫夫将心灵感应的可能性引入了人类思维和自动机的特征集。似乎心灵感应仅限于小说领域,但表情符号可以是情感成分的远程形式,例如微笑。这样一来,双方同意的技术辅助心灵感应实际上已经司空见惯。
随着越来越多的公众与数字系统的互动越来越多,文化中的隐私受到侵蚀,可能会开发和掌握较少自愿的心灵感应技术。
问题的更深层次
怀疑在于灵魂或人类其他一些自主和非确定性方面的存在。这些东西的存在以及它们的模拟是否可以用图灵机完成并实际部署到冯诺依曼架构或它们的集合中,尚未得到正式证明或否定证明。如果人中存在自主和非确定性的元素,那么,即使它们可以被模拟,我们也无法将它们实现为独立自主的。
挑战麻省理工学院创造的术语“肉机”的含义,人类能够通过法令进行意图的概念并没有被推翻,但纯粹的图灵机显然不能以这种方式进行意图。
这在问题的背景下很重要,因为计算机可能只能在意图被生活条件挫败时模拟挫败感。真正的挫败感可能是不可能的。
目前公开经历的进展
计算机科学进入人类情感领域的一个有趣切入点是 1990 年代耶鲁大学的 Roger Schank 提出的基于故事的记忆和推理模型。尽管亚马逊在其不断提高的以特定买家方式推荐电影的能力下使用的机器是亚马逊的公司机密,但人们一定会想知道。
电商是否可以针对书籍和电影开发用户画像,以了解故事情节或主角情感发展的弧线?它是否足以将用户查看和购买与其他产品相匹配?这就是亚马逊开始做的事情吗?如果没有不道德的亚马逊员工,我们只能猜测。当然,前沿电子商务中正在发生的事情已经超越了单词或短语匹配或跟踪对特定作者、编剧、导演、制片人和明星的兴趣。
如果 Roger Schank 的基于故事的记忆和推理已经渗透到电子商务中,那么对公众内部个人的情感分析也正在顺利进行,因为故事情节和主角的发展弧线都与高潮和高潮有关,所有这些都与情绪状态有关。如果不是这样,那么自从公共关系职能进入企业 IT 系统的角色以来,就一直在对公众群体进行情感分析。(我知道这种情况发生在几十年前。)
即使 Facebook、Google 和 Amazon 等公司试图以各种方式实时近似个人的情绪状态,但电影情节的主角弧匹配以及这种模式匹配和幼稚分类远不是一个好的辅导员或一个自我实现的朋友或家人可能会这样做。
公众接触到的计算机系统似乎还没有准确地理解购买者的情绪。这是一个即使是最先进的界面仍然很害羞的领域。此外,计算机界面本身仍然像 20 世纪后期一样枯燥。
如果不违反保密规定,专有实验室中可能存在哪些识别、比较、分析或模拟情绪的能力只是一种猜测。
温暖的接口
回到技术社会中控制论接口普遍冷漠的问题,计算机科学界有很多东西要学。一方面,实际技术人员的软技能往往有很多不足之处,因此可能需要从冷漠的开发团队到文化进步和热情的团队的文化转变。
此外,使用过各种 PaaS(个性化即服务)设备(如 Siri、Google 助手、Alexa、Cortana 和微软的 Office 助手 Clippy)的人可能会发现 Clippy 的回形针个性更受欢迎。也许 Clippy 并没有看到更高的接受度,因为电子表格中网格单元格的冰冷与动画角色的温暖尝试之间的差异太大,而且小家伙往往会妨碍界面的某些部分,这可能很烦人。(概念的整合很差。)
尽管如此,Clippy 的动画风格旨在与卡通人物建立一种心理联系,这非常棒。通过漫画和卡通媒体进行卡通人物设计和讲故事是一个创造性的技术领域,早在智能助手开始出现之前,它就已经掌握了计算机产生的温暖。
纵观智能助手的历史,人们不禁会想,系统越是试图成为人类,它看起来就越不人性化。人类对控制论界面中的情感内容的反应就像颜色匹配或合成乐器一样。如果一个人试图合成,合成必须是好的。如果它不能完全令人信服,那么在发明一些不假装是真实的东西时会有更多的真实性。现实生活中的物体(如海绵宝宝或公路跑者)的漫画可避免在模仿现实生活时暴露不可接受的误差范围。[1]
我们在这方面的敏感性非常敏锐,以至于如果一个在客户服务部门工作的真人表现得过于机械,以至于我们甚至对我们是否在与一个人交谈都有一点怀疑,这种印象是负面的,我们想要挂断电话并在公司网站上查找我们希望启动的功能。
目前尚不清楚人们是否会变得更像机器中的齿轮,或者使用模式是否会促使公司设计他们的用户界面及其背后的机制,以散发出热情好客或友善之类的东西。尽管 Jaques Ellul 的主张似乎是正确的,即技术长期以来一直在驱动人类,而不是相反,但人类思维的 DNA 本质可能会迫使人类保持卓越的人性。因此,控制论接口专业人士的进化可能会继续寻求温暖的意义和模拟。
对图灵测试的有问题、有争议和有些奇怪的追求可能会持续下去。
对情绪建模使用的担忧
情感识别、建模、分析和比较套件,显然是一个强大的工具集,是用于改善人类还是对其有害是一个问题,就像任何其他强大的工具集一样。大众心理学、核科学、统计学和遗传学具有共同的潜力,即大善或大恶。
在这个问题的背景下,广播或更有针对性的信息传播可以被定性为宣传,这不一定是危险的。宣传被用于妇女选举权和美国从欧洲独立的道路上。广播和有针对性的控制元素造成了很多地缘政治问题,这个话题超出了这个社交网络的范围,但相关且有些明显,因此无论如何都没有必要进一步提及。
个人分析也非常有用。在寻找信息或娱乐项目或个人表达以进行借阅、出租或购买时,这可以像旧图书馆主题索引杜威十进制卡与知识渊博的图书馆员的组合。
当然,剖析与统计相结合可以导致获得对大量人员的隐蔽控制的能力,而不仅仅是为了公司的利润最大化。一个适当自欺欺人的狂妄自大者或他们在某种秘密社会中的集合可以使用情绪建模和对大量国家或全球人口样本的全面用户分析来注入情绪驱动的信仰系统。这样的个人或团体理论上可以成功地将自由隐蔽和系统地升华为一种虚拟的专制独裁。
如何使用技术始终是一个问题。透明度和问责制是社会的必要特征。
就像在上面提到的其他科学技术领域一样,我们有足够的技能来实现这些系统成为我们社会问责机制中的智能和活跃元素。公司或政府部门是否正在将人类带入灭亡,这是可以在求职和初始工作期间判断的项目。
笔记
[1]
这也许是对图灵模仿游戏哲学最强烈的批评。卡通、漫画和科幻生物表明,人们似乎并不关心是否可以将智能生物与人类区分开来,并且没有证据表明人类智能是智能的唯一或最好的例子。
沿着同样的思路,英雄是智能行为的代表,体现了人类的某些方面,而这些方面实际上并不像这些主角那样自然地以纯粹的形式出现。然而,由于这种田园诗般的性格表达,演员被打上了明星的烙印和推销。可能人类并不真正喜欢人类的智慧,并不断地试图通过虚构来超越它,但结果只是导致了一些公众意识,这不过是人类学的幻想。
甚至 AI 也不是模仿游戏。这是一个超越游戏。因此,图灵测试的价值有限。
我是一名本科生研究学者——我和我的团队开发了一种算法来检测触摸屏上的人类情绪——我的指南的博士学者正在进一步改进和开发该算法。
从研究文学我可以说逆向是一项艰巨的任务——检测情感。使用轻量级解决方案更难检测人类情绪 - 即不使用笨重的有线硬件。- 这是小时的需要。
一旦完成 - 有大量的应用程序 - 专注于广告营销、增强用户体验、游戏开发等。