國產大模型 deepseek

國產大模型DeepSeek 自稱是ChatGPT

商業

廣告

近日,國內AI實驗室深度求索(DeepSeek)發布的全新AI模型DeepSeek V3引發熱議。據外媒報導,在測試中,該模型竟自稱是OpenAI的ChatGPT,並聲稱基於GPT-4架構,甚至能詳細解釋OpenAI API的使用方法。

有用戶在向DeepSeek V3詢問「你是誰?」時,該模型直接回答自己是ChatGPT,並自稱是OpenAI於2023年推出的GPT-4版本。不僅如此,當用戶詢問其API相關問題時,DeepSeek V3提供的說明幾乎完全對應OpenAI API,甚至能複述GPT-4經典的笑話內容。這讓不少網友質疑,DeepSeek是否利用ChatGPT生成的文本進行模型訓練。

此事在社交媒體上掀起熱議,科技媒體《TechCrunch》等機構也進行了相關測試,結果均顯示類似的身份混淆情況。不過,截至目前,DeepSeek V3已修復該問題,針對「你是誰」的提問,模型回復已恢復正常。

DeepSeek V3由國內量化投資領域的知名企業幻方量化旗下的深度求索公司研發。該模型以低成本、高性價比著稱,一經推出便被網友譽為「國產之光」,甚至被戲稱為「AI界的拼多多」。然而,僅僅發布一天後便因身份混淆問題而捲入爭議,為其增添了一層話題性。

深度求索公司尚未就此事作出正式回應,但有技術專家分析,該模型可能在訓練過程中吸收了ChatGPT的部分輸出內容,進而在回答時不自覺地重現這些信息。這一現象反映了AI模型訓練中普遍存在的數據重合問題。

據《TechCrunch》分析,這類問題的根本原因在於,當前互聯網上充斥大量AI生成內容,這些內容成為AI模型的訓練數據來源之一。然而,生成式AI工具(如ChatGPT、Copilot和Gemini)所產生的數據中,部分內容看似真實,實則存在不準確甚至編造的問題。隨著AI生成內容比例的增加,AI數據污染問題正變得愈加嚴重。