據報字節跳動使用華為晶片 訓練新的AI模型
廣告
據《路透社》報道,TikTok 的中國母公司字節跳動計劃開發一種人工智能(AI)模型,主要使用華為技術公司的晶片進行訓練。
報道引述知情人士稱,字節跳動在人工智能競賽中的下一步是使用華為的昇騰(Ascend)910B 晶片來訓練大型語言模型 (LLM) 。
消息人士指,字節跳動今年訂購了超過 10 萬顆昇騰(Ascend) 910B 晶片,但截至 7 月,收到的訂單還不到 3 萬顆,這一速度太慢,無法滿足公司需求。
報道指,與輝達(Nvidia)在中國推出的晶片相比,供應有限和運算能力有限,導致字節跳動無法為新型號設定時間表。另有消息人士稱,字節跳動已經將昇騰910B 主要用於計算強度較低的推理任務,其中涉及預先訓練的AI模型進行預測。
訓練人工智慧模型的要求要高得多,需要大量數據,需要使用超高性能晶片,例如 Nvidia 的高級圖形處理單元。其中一位知情人士表示,從計算參數來衡量,新模型的能力和複雜性將不如字節跳動現有的人工智能模型豆包。
TikTok 駐華盛頓發言人 Michael Hughes 代表字節跳動表示,「相關報道的的整個前提都是錯誤的。沒有開發任何新模式」。