人工智能 投資

淺談人工智能投資最新發展

投資

廣告

由中國一家創科公司研發出來的大型語言模型DeepSeek,據稱可與美國的ChatGPT及Llama等先進技術相媲美,而且訓練成本要低得多,因而引起了市場熱烈討論。

早前橫空出世的DeepSeek V3 模型,開發商稱其訓練運算成本僅為560 萬美元,此消息震撼整個市場,因為外界一直認為人工智能技術是相當昂貴的技術,而此模型的開發成本卻可能只是OpenAI(ChatGPT的開發公司)o1模型的十分之一。

效率不俗、訓練成本較為便宜

不過,有報告指其成本可能被低估了,因為該中國公司並無把一些實際費用(例如實驗成本)計算在內。而且外界也難以確定DeepSeek實際上是否擁有更多GPU(圖形處理器),若按一些市場中人的言論,那麼其擁有GPU的開支可能高達十多億美元。儘管如此,與美國同業相比,V3 模型似乎有不俗效率,且訓練成本明顯較為便宜。

DeepSeek的成本優勢很大程度上源於工程技術的進步,因而可減少使用記憶體和降低運算要求,並提高了GPU的利用率。在美國制裁下,中國在先進半導體方面的入口本受到限制,但仍然有公司能開發出如此技術,可見「需要才是創新之母」(Necessity is the mother of innovation)。更重要的是,在1月最新推出的DeepSeek R1模型乃採用「強化學習」來訓練,使模型可以在沒有人為干預的情況下自主學習和發展。

表面上看,DeepSeek這種技術突破可能會對人工智能的發展前景帶來一些干擾。如果開發大型言語模型時,不需要用到那麼多GPU,那麼人工智能供應鏈中的重要環節──例如數據設備和能源需求的潛在市場或會減少,似乎會為人工智能基礎建設帶來負面效果。但是,由於DeepSeek屬於開源系統,來自不同地區的人工智能實驗室理論上都可以整合其技術,以提升自身模型的效能。

新技術無礙人工智能持續發展

另一值得思考的問題是:大型言語模型會否限制了大規模人工智能訓練的需求?這一點尚未明確,但我們的看法仍然正面。DeepSeek反映了強化學習是有效的,隨著運算能力提升和數據量增加,這種方法或會進一步改進,並促進人工智能實驗室的發展潛力。而且很多人工智能實驗室的最大目標是開發出artificial general intelligence(人工通用智能),以此角度來看,行業領導者未必會輕易減省開支。

相反,我們預計市場將會出現各種不同的模型,且規模不一。高成本的大型模型固然有其必要性,然而,低成本的模型也有助推動人工智能的普及。像DeepSeek這種更具成本效益的模型,可能會進一步推動人工智能的實際應用。因此在中期來看,這將增加市場對運算推理的需求,並使晶片的長遠需求比預期更為強勁。簡單地說,DeepSeek的人工智能運算方法和最新的高效能晶片互相結合,或可產生協同效應,使新一代的人工智能模型變得更快、更強大。

總括而言,DeepSeek的面世觸發部分科技股份的估值降到較合理的水平,我們正在評估市場是否浮現一些更吸引的新機會。展望未來,普徠仕會一貫地以靈活、理性且嚴守紀律的方式來投資於創新科技帶來的機遇。

免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。

撰文:周捷