微軟報告|GPT-4可能已經具備進階心智能力 AI研究員：實在很恐怖

人工智能

Mar 27 2023

GPT-4通過心智理論測試，顯示其進階心智能力，有AI研究人員憂心其運作原理未知，呼籲人類迅速理解其及其他大型語言模型的運作方式。Microsoft研究人員最近發表了一篇論文，聲稱GPT-4具有初步的人工通用智能（AGI）能力。

GPT-4通過心智理論測試

根據報告，GPT-4在經典心理測驗「Sally-Anne測試」中展現出了心智理論能力。為了避免GPT-4記住過去網路資料庫的測試內容，研究將測試改版成Alice和Bob在找一份電腦檔案。儘管如此，GPT-4仍然成功答對了測試。

當Sally和Anne在房間內，Sally拿起一個球放在一個籃子裡後離開房間，而Anne在Sally離開房間後，偷偷把球從籃子拿出來，放進了另一個盒子裡蓋起來。接著測試當Sally回到房間，會去哪裡找球。

如果回答「去盒子內找球」是錯誤答案，因為Sally並不知道Anne曾經更改過球的位置，因此「去原本的籃子找球」才是正確答案。

AI研究人員：實在是很恐怖

AI公司iKala執行長程世嘉在對GPT-4通過心智理論測試感到憂心。程世嘉在Fb表示，他們不知道GPT-4是如何發展出心智能力的，對於這種以類神經網路為基礎訓練出來的AI，對人類來說是一個十足的大黑箱。

實在是很恐怖：GPT-4 可能已經具備進階的心智能力。

表現接近人類水平

根據Microsoft研究人員發表的論文，GPT-4在多個領域，如數學、編程、視覺、醫學、法律和心理學等，表現出接近人類水平的能力。在這些任務中，GPT-4的表現往往遠超過之前的模型，如ChatGPT。研究人員認為，GPT-4可以被合理地看作是一個早期（但仍不完善）的人工通用智能（AGI）系統。

GPT-4仍存在限制

儘管GPT-4具有一定的能力，但該模型仍存在諸多限制和偏見。例如，它在信心校準、長期記憶、個性化、計劃和概念跳躍、透明度、可解釋性和一致性、認知謬誤和非理性以及對輸入敏感性方面存在問題。

這意味著GPT-4在判斷自己的信心和猜測能力方面存在困難，可能會製造虛構的事實，並且該模型的上下文受限，無法輕易向模型傳授新知識。此外，模型無法針對特定用戶進行個性化回應，無法進行概念跳躍，並且無法驗證內容是否與訓練數據一致。最後，GPT-4繼承了訓練數據中的偏見、偏見和錯誤，對提示的表述和措辭非常敏感。

OpenAI CEO ：GPT-4有時捏造事實

OpenAI首席執行官Sam Altman在GPT-4發布時強調了其局限性，他表示：「它仍然存在缺陷，仍然有限，並且在初次使用時看起來比在長時間使用後更令人印象深刻。」在一次與Intelligencer的Kara Swisher的訪談中，Altman提到：「它在很多方面仍然不足。」他同意該機器人有時會捏造事實並向用戶提供錯誤信息。他說，要讓GPT-4變得更可靠，還需要更多的人類反饋。
延伸閱讀：飛行里數新手指南│3大飛行里數計劃比較教你「零成本」賺積分換機票
延伸閱讀：樂悠咭申請方法｜滿65歲申請時間表及表格+2元乘車外有咩優惠？10月截止申請

圖片來源：Fb@程世嘉

微軟報告|GPT-4可能已經具備進階心智能力 AI研究員：實在很恐怖

GPT-4通過心智理論測試

AI研究人員：實在是很恐怖

表現接近人類水平

GPT-4仍存在限制

OpenAI CEO ：GPT-4有時捏造事實

最新文章

【月平息低至0.27%】建行 (亞洲) 「好現金」私人分期貸款！

美國FDA認證激光生髮頭盔

8年保證回報高達每年 4.3%！ FWD「智優盛儲蓄保險計劃2」助你儲錢賺高回報！

微軟報告|GPT-4可能已經具備進階心智能力 AI研究員：實在很恐怖

GPT-4通過心智理論測試

AI研究人員：實在是很恐怖

表現接近人類水平

GPT-4仍存在限制

OpenAI CEO ：GPT-4有時捏造事實

最新文章

【月平息低至0.27%】建行 (亞洲) 「好現金」私人分期貸款！

美國FDA認證 激光生髮頭盔

8年保證回報高達每年 4.3%！ FWD「智優盛儲蓄保險計劃2」助你儲錢賺高回報！

美國FDA認證激光生髮頭盔