微軟報告|GPT-4可能已經具備進階心智能力 AI研究員:實在很恐怖
GPT-4通過心智理論測試
根據報告,GPT-4在經典心理測驗「Sally-Anne測試」中展現出了心智理論能力。為了避免GPT-4記住過去網路資料庫的測試內容,研究將測試改版成Alice和Bob在找一份電腦檔案。儘管如此,GPT-4仍然成功答對了測試。
當Sally和Anne在房間內,Sally拿起一個球放在一個籃子裡後離開房間,而Anne在Sally離開房間後,偷偷把球從籃子拿出來,放進了另一個盒子裡蓋起來。接著測試當Sally回到房間,會去哪裡找球。
如果回答「去盒子內找球」是錯誤答案,因為Sally並不知道Anne曾經更改過球的位置,因此「去原本的籃子找球」才是正確答案。
AI研究人員:實在是很恐怖
AI公司iKala執行長程世嘉在對GPT-4通過心智理論測試感到憂心。程世嘉在Fb表示,他們不知道GPT-4是如何發展出心智能力的,對於這種以類神經網路為基礎訓練出來的AI,對人類來說是一個十足的大黑箱。
實在是很恐怖:GPT-4 可能已經具備進階的心智能力。
表現接近人類水平
根據Microsoft研究人員發表的論文,GPT-4在多個領域,如數學、編程、視覺、醫學、法律和心理學等,表現出接近人類水平的能力。在這些任務中,GPT-4的表現往往遠超過之前的模型,如ChatGPT。研究人員認為,GPT-4可以被合理地看作是一個早期(但仍不完善)的人工通用智能(AGI)系統。
GPT-4仍存在限制
儘管GPT-4具有一定的能力,但該模型仍存在諸多限制和偏見。例如,它在信心校準、長期記憶、個性化、計劃和概念跳躍、透明度、可解釋性和一致性、認知謬誤和非理性以及對輸入敏感性方面存在問題。
這意味著GPT-4在判斷自己的信心和猜測能力方面存在困難,可能會製造虛構的事實,並且該模型的上下文受限,無法輕易向模型傳授新知識。此外,模型無法針對特定用戶進行個性化回應,無法進行概念跳躍,並且無法驗證內容是否與訓練數據一致。最後,GPT-4繼承了訓練數據中的偏見、偏見和錯誤,對提示的表述和措辭非常敏感。
OpenAI CEO :GPT-4有時捏造事實
OpenAI首席執行官Sam Altman在GPT-4發布時強調了其局限性,他表示:「它仍然存在缺陷,仍然有限,並且在初次使用時看起來比在長時間使用後更令人印象深刻。」在一次與Intelligencer的Kara Swisher的訪談中,Altman提到:「它在很多方面仍然不足。」他同意該機器人有時會捏造事實並向用戶提供錯誤信息。他說,要讓GPT-4變得更可靠,還需要更多的人類反饋。
延伸閱讀:飛行里數新手指南│3大飛行里數計劃比較 教你「零成本」賺積分換機票
延伸閱讀:樂悠咭申請方法|滿65歲申請時間表及表格+2元乘車外有咩優惠?10月截止申請