如何测量AI程序的情商?


9

AI程序可以具有情商(情商或情商)吗?

换句话说,可以测量AI程序的EQ吗?

如果说情商比智商更难衡量(至少在人类和人工智能程序都适用标准的情况下),为什么会这样呢?


您对人类知道什么“情商测试”?将它们应用于AI的障碍是什么?
NietzscheanAI

Answers:


6

您的问题的答案是“原则上是”-在最通用的形式下,情商测试只是图灵测试的一个特例(“您对……的感觉如何?”)。

要了解为什么可能难以实现有意义的EQ测试,请考虑以下两种可能的测试:

在一个极端的复杂性中,电影《银翼杀手》(Blade Runner)著名地展示了一项测试,该测试根据对充满情感的问题的回答来区分人类和机器人。

如果您尝试向现代聊天机器人询问这些问题(甚至更简单的问题),您可能会很快得出结论,您不是在与人交谈。

评估情商的问题在于,测试在情感上越复杂,为了将输入转化为有意义的表示,AI系统可能就必须越通用。

从上面的另一个极端来看,假设EQ测试是以一种非常结构化的方式来表达的,而结构化的输入是由人类提供的。在这种情况下,“ EQ测试”的成功并不是真正基于现实世界。

道格拉斯·霍夫施塔特(Douglas Hofstadter)在一篇题为“无法消灭的伊丽莎效应及其危险”的文章中给出了以下示例,其中ACME程序(不是霍夫施塔特主张)被“理解”类比。

在这里,计算机了解到一个名叫Sluggo的人将他的妻子Jane和他的好伙伴Buck带到了酒吧,在那里一切顺其自然,Jane怀孕了。她有孩子,但不想要它,因此,在丈夫的帮助下,她把孩子淹死在河里,从而“巧妙地解决了Bambi的“问题”。

该故事以以下形式呈现给ACME:

ql: (neglectful-husband (Sluggo))
q2: (lonely-and-sex-starved-wife (Jane-Doe))
q3: (macho-ladykiller (Buck-Stag))
q4: (poor-innocent-little-fetus (Bambi))
q5: (takes-out-to-local-bar (Sluggo Jane-Doe Buck-Stag))
...
q11: (neatly-solves-the-problem-of (Jane-Doe Bambi))
q12: (cause (ql0 q11))

假设要询问程序Jane Doe的行为是否道德。复杂的复合情感概念,例如“疏忽”,“孤独”和“无辜”,仅是谓词,无法用于AI进行更深入的内省性检查。它们可以很容易地被诸如“ bling-blang-blong15657”之类的标签所取代。

因此,从某种意义上说,在任何深度进行的情商测试都没有成功,这表明了AI当前面临的普遍问题:无法定义(或以其他方式学习)对人类世界微妙复杂性的有意义的表示,这更多比识别猫的视频更复杂。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.