【有片】Grok 3發布︳馬斯克 xAI 發表新一代AI 各項跑分直上第一
Grok 的由來
「Grok」一詞源自美國作家海因萊(Robert Heinlein)1961年的科幻小說《異鄉異客》(Stranger in a Strange Land),意指「深入或直觀地理解」。馬斯克希望這款 AI 程式能超越傳統的資訊處理,真正理解人類的情感與需求。
🚨ELON: GROK WILL JOIN OPTIMUS ON STARSHIP ROCKETS IN 2 YEARS
“If all goes well, SpaceX will send Starship rockets to Mars with Optimus robots and, and Grok.”
Source: @elonmusk @xai https://t.co/KhMJJySBEl pic.twitter.com/PnmLg4PJ4d
— Mario Nawfal (@MarioNawfal) February 18, 2025
🚨ELON: GROK WILL JOIN OPTIMUS ON STARSHIP ROCKETS IN 2 YEARS
“If all goes well, SpaceX will send Starship rockets to Mars with Optimus robots and, and Grok.”
Source: @elonmusk @xai https://t.co/KhMJJySBEl pic.twitter.com/PnmLg4PJ4d
— Mario Nawfal (@MarioNawfal) February 18, 2025
開發背景
xAI 是馬斯克於2023年7月創立的人工智能公司,致力於推動 AI 的發展,促進人類科學發現。這也是他退出 OpenAI 董事會後再次回到 AI 領域。
- Grok 1:2023年11月發布,為首款大模型。
- Grok 1.5:2024年3月推出,參數量達3140億,超越 OpenAI 的 GPT-3.5。
- Grok 2:2024年8月發布,改進了訓練數據的質量,融入少量高品質的真實數據。
Grok 3 的硬件與性能
Grok 3 的宣傳重點包括「十倍大的預訓練模型」、「具推理能力」和「AI 代理能力」。為了增強性能,xAI 與戴爾(Dell)洽談價值超過50億美元的AI伺服器供應協議,預計將使用含有英偉達(Nvidia)晶片的伺服器。
此外,xAI 正在接洽潛在投資者,計劃籌集約100億美元,用於擴大數據中心並進一步訓練 AI 模型,預計將使 xAI 的估值達到約750億美元。
🚨xAI: GROK 3 WAS ABLE TO COMBINE TETRIS AND BEJEWELED
“The Bejeweled mechanic is, if you get three jewels in a row, they disappear, and gravity activates.
What Grok did in this version is, once you connect at least three blocks of the same color in a row, gravity activates,… https://t.co/y21TK2rMAV pic.twitter.com/k98v6UKppg
— Mario Nawfal (@MarioNawfal) February 18, 2025
Grok 3 的優勢
根據直播片段,Grok 3 在推理和傳統 AI 測試方面表現出色,優於 Gemini-2、DeepSeek 和 Claude 等對手。馬斯克展示了 Grok 3 處理複雜任務的能力,特別是引入「思維鏈」(chain of thought)推理功能,使其能如同人類般逐步處理查詢,並提供更連貫和有邏輯的響應。
Grok 3 在 Chatbot Arena 的表現與未來計劃
在大模型競技場 Chatbot Arena(LMSYS)中,早期版本的 Grok-3 取得了令人矚目的成就,得分達到 1402 分,成為首個突破 1400 分的模型,超過了包括 DeepSeek-R1 在內的所有其他競爭對手。
表現優勢
Grok-3 在數學(AIME 24)、科學(GPQA)及編程(LCB Oct-Feb)三個方面的表現也大幅超過了其他模型,如 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o,顯示出其在這些領域的強大實力。下圖展示了 Grok-3 和其他模型在編程、數學、創意寫作、指令遵循、長查詢及多輪對話中的排名情況,可以看到 Grok-3 在每一個維度上都名列第一。
推理能力
Grok-3 的推理能力更是無可匹敵,解鎖了測試時計算(test-time compute)能力,為激烈的推理模型市場帶來了一個強勁的競爭者。其推理表現超越了 o3 mini、R1 等所有對手,顯示出其在複雜問題解決上的潛力。
訂閱與定價信息
Grok 3 將首先向 X Premium+ 訂閱用戶提供,其他功能則需訂閱 xAI 的 SuperGrok 版本。SuperGrok 的定價為每月 30 美元或每年 300 美元,訂閱後可解鎖更多推理功能和 DeepSearch 查詢,並提供無限的圖像生成。
未來計劃
在發布後,xAI 團隊根據網友提問進行了簡單的問答,並透露將推出一個 Grok 驅動的語音應用,預計大約在一週內發佈。該模型會在與用戶進行語音對話時保留部分對話記憶。
馬斯克重申了 xAI 的開源原則,表示在穩定版 Grok 3 發布後,將開源前一版本 Grok 2,這一過程可能還需幾個月的時間。儘管如此,這一開源進程似乎不及 DeepSeek 的開源速度。
Grok 3 的強勁表現和未來計劃無疑為 AI 市場帶來了新的活力,值得持續關注其後續發展。
免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。