12月20日消息,得老呆最近日,年癡有媒體報道,新研以色列特拉維夫大學的版本一項研究表明AI已有數(shù)字癡呆癥。
在這項研究中,糊涂科學家測試了幾乎所有全球頂尖AI大型語言模型,得老呆最結(jié)果都表現(xiàn)出類似于早期老年癡呆的年癡認知障礙,并且版本越老,新研表現(xiàn)就越差。版本
為了評估實驗效果,糊涂科學家使用了經(jīng)常被用來測試老年癡呆癥的得老呆最蒙特利爾認知評估量表,針對幾種公開的年癡領(lǐng)先大型語言模型進行測試,包括ChatGPT的新研新老版本,Gemini新老版本等。版本設(shè)定的糊涂測試最高分為30分,26分或以上被認為是正常的。
實驗結(jié)果顯示,只有GPT-4o在測試中獲得了最高分26分,其次是GPT-4是25分,Gemini 1.0僅得16分。
研究還發(fā)現(xiàn)幾乎所有模型在視覺空間能力和執(zhí)行任務(wù)方面都表現(xiàn)不佳,無法表現(xiàn)出同理心或準確解釋復雜的視覺場景。
科學家指出,所有大型語言模型在需要視覺抽象和執(zhí)行功能的任務(wù)中都一致失敗,這凸顯了一個可能阻礙其在臨床環(huán)境中使用的重要弱點。因此,他們做出了有數(shù)字癡呆的AI,不可能很快取代醫(yī)生的這一結(jié)論。