Questions tagged «intelligence-testing»

4
是Siri和Cortana AI程序吗?
Siri和Cortana的交流非常像人类。与Google现在主要在被问到一些问题(不设置警报或提醒)时为我们提供搜索结果不同,Siri和Cortana就像人一样向我们提供答案。 那么它们是否是实际的AI程序? (通过“问题”,我不是指任何与学术有关的问题或询问路线/温度,而是基于意见的问题)。

1
Lovelace Test 2.0是否已在学术环境中成功使用?
受最初的Lovelace测试(于2001年发布)的启发,2014年10月,Mark Riedl博士发布了一种测试AI智能的方法,称为“ Lovelace Test 2.0”。马克认为原始的Lovelace测试无法通过,因此建议使用较弱的实用版本。 Lovelace Test 2.0做出这样的假设:要使AI变得智能,它就必须表现出创造力。从论文本身来看: Lovelace 2.0测试如下:人工试剂a受到以下挑战: 必须创建类型为t的工件o; o必须符合一组约束C,其中ci∈C是可以用自然语言表达的任何准则; 选择了t和C的人类评估者h确信o是t的有效实例并且满足C;和 裁判员确定t和C的组合对于普通人而言并非不切实际。 由于人工评估者可能会提出一些非常简单的约束来击败AI,因此期望人工评估者不断为AI提出越来越复杂的约束,直到AI失效为止。Lovelace测试2.0的重点是比较不同AI的创造力,而不是像图灵测试那样在“智能”和“非智能”之间提供明确的分界线。 但是,我很好奇这个测试是否实际上已在学术环境中使用,或者目前仅被视为一项思想实验。Lovelace测试似乎很容易在学术环境中应用(您只需要开发一些可测量的约束即可用于测试人工代理),但是它也可能过于主观(人类可以就某些约束的优缺点以及是否对某些约束持不同意见)。由AI产生的创意人工产物实际上达到了最终结果)。

2
只有人类才能解决的问题
随着reCAPTCHA的复杂性不断提高,我想知道是否存在某些问题,只有人类才能解决(或者,如果AI无法完全重现人类的大脑,AI就无法解决) 。 例如,扭曲的文本曾经只能由人类解决。虽然... 现在,即使在最具挑战性的情况下,计算机也可以使[变形文本]测试正确率为99.8%。 同样明显的是,扭曲的文本不再可以用于真实的人类检测。 我还想知道是否可以使用一种算法来创建这样的问题(例如扭曲的文本),或者是否需要人脑的独创性。



3
系统被认为是智能的标准是什么?
例如,您能否提供为什么日d 不是 “智能”的原因?日d感知环境并采取合理行动。输出时间。它还存储感知。(工程师在上面写的数字。) 自动驾驶汽车的哪些特性使其具有“智能性”? 非智能物质与智能系统之间的界线在哪里?


3
图灵测试的特殊要求
图灵测试的具体要求是什么? 评估人员必须满足哪些要求才能有资格进行测试? 对话中必须总是有两个参与者(一个人和一台计算机),还是可以有更多参与者? 是否允许或鼓励进行安慰剂测试(实际上不涉及计算机)? 可以有多个评估者吗?如果是这样,为了使机器通过测试,是否需要在所有评估者之间达成一致的决定?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.