添加一个Wikipedia链接以更深入地了解“原始” 图灵测试。有许多测试称为“图灵测试”。维基百科提到“至少3个主要版本”。Eugeene通过的测试不是这3个。Eugeene通过的测试不是Alan Turing设计的,但这是一个受Turin测试启发的测试,受Alan Turing的启发,Eugeene确实通过了测试。
该部分至少提到了图灵测试的3个主要版本:
索尔·特雷格(Saul Traiger)辩称,图灵测试至少有三个主要版本,其中两个在“计算机和智能计算”中提供,另一个被他称为“标准解释”。尽管有一些争论是关于“标准解释”是图灵描述的,还是基于对他的论文的误读,但这三个版本不被认为是等同的,它们的优缺点是截然不同的。
版本1
图灵的原始游戏描述了一个简单的派对游戏,涉及三名玩家。玩家A是男人,玩家B是女人,而玩家C(扮演询问者的角色)是两性。在模仿游戏中,玩家C无法看到玩家A或玩家B,并且只能通过书面笔记与他们交流。通过询问玩家A和玩家B的问题,玩家C试图确定两者中的哪个是男人,哪个是女人。玩家A的角色是欺骗询问者做出错误的决定,而玩家B则试图协助询问者做出正确的决定。
版本2
第二版后来出现在图灵的1950年论文中。类似于原始模仿游戏测试,玩家A的角色由计算机执行。但是,玩家B的角色是男人而不是女人。在此版本中,播放器A(计算机)和播放器B都试图欺骗询问器做出错误的决定。
版本3
普遍的理解是,图灵测试的目的不是专门确定计算机是否能够欺骗询问者以为它是人,而是计算机是否可以模仿人。尽管对于图灵是否打算使用这种解释存在一些争议-斯特雷特(Serrrett)认为它是第二种版本,因此将其与另一种版本混为一谈,而其他人(例如Traiger)则没有这样做-但是,这导致了可以被视为“标准解释。” 在此版本中,玩家A是计算机,而玩家B是两性。询问器的作用不是确定哪个是男性,哪个是女性,而是哪个是计算机,哪个是人。标准解释的根本问题是询问器无法区分哪个响应者是人,哪个响应者是机器。关于持续时间存在一些问题,但是标准解释通常认为此限制是合理的。
相比之下,Eugeene通过的测试让人类法官与聊天机器人聊天了5分钟,然后他们不得不决定它是否是机器人。