中國DeepSeek登頂美APP Store 全球刷屏震撼業界 比肩頂尖AI模型

职场   2025-01-28 13:26   中国香港  

綜合路透社、觀察者網及本報記者蘇雨潤、凱雷報道,最近幾日,中國人工智能公司深度求索(DeepSeek)發布的大模型DeepSeek-R1震動業界,該模型使用更低的成本和更小的算力規模,實現了足以匹敵美國頂尖AI模型的效果。北京時間1月27日,蘋果App Store中國區免費榜顯示,近一周全球刷屏的DeepSeek一舉登上首位。同時,DeepSeek在美國區蘋果App Store免費榜從前一日第六位飆升至第一位。

美國媒體的報道稱,DeepSeek-R1的出色表現已經給美國科技行業留下深刻印象,其開源模型成為行業關注與分析焦點。

深度求索在1月20日發布了DeepSeek-R1模型,該公司表示,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,其性能比肩美國OpenAI o1正式版。為促進技術社區的充分交流與創新協作,深度求索還公開了DeepSeek-R1訓練技術。

「令人驚嘆」 美企轉用DeepSeek

英偉達高級研究科學家范麟熙(Jim Fan)稱讚DeepSeek取得了突破,他在社交平台X上發文稱,DeepSeek-R1完全由強化學習驅動,「這讓人想起了AlphaZero,從零開始學習圍棋、將棋和國際象棋,而不是先模仿人類大師的動作。」

DeepSeek-R1的表現引起美國科技行業的高度關注。硅谷風險投資家馬克·安德森(Marc Andreessen)表示:「DeepSeek-R1是我見過的最令人驚嘆、最令人印象深刻的突破之一。」

舊金山AI硬件公司Positron的聯合創始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在討論DeepSeek的開源模型,「這太酷了。」

一些美國企業也開始在工作中使用DeepSeek。硅谷一家創業公司的聯合創始人安東尼·普奧(Anthony Poo)告訴《華爾街日報》,他們原先使用Claude模型預測財務回報,但現在已轉向DeepSeek,兩者性能相似,使用DeepSeek的成本僅為Claude的四分之一,「OpenAI的模型有着極佳的性能,但我們不想為我們不需要的能力付費。」

不僅如此,DeepSeek的開發成本和使用的算力規模都遠低於美國頂尖AI公司。先前發布的DeepSeek-V3在僅使用2,048顆英偉達H800 GPU的情況下,完成了6,710億參數模型的訓練,成本約為560萬美元,這遠低於其他頂級模型的訓練成本。美媒指出,H800的算力要弱於英偉達H100等芯片,美國限制對華出口此類高性能芯片。

《華爾街日報》提到,作為對比,美國AI企業、Claude模型開發商Anthropic首席執行官達里奧·阿莫代伊(Dario Amodei)去年曾透露,該公司構建模型的成本約為1億至10億美元。

投行富瑞(Jefferies)分析師指出,DeepSeek開發的開源大語言模型使用極少的計算能力,就達到了與GPT-4o相當的性能。該行認為,對算力需求的重新評估可能導致相關企業2026年AI領域的資本支出下降或不再增長,這也解釋了人工智能相關的半導體股票遭到拋售的原因。「海外人工智能公司一直在不惜一切代價追求模型改進,但DeepSeek的情況可能促使投資者對這些算力投資提出尖銳問題。」富瑞稱。

開源是強心劑 專家:未來AI或會更民主化

清華大學新聞學院、人工智能學院教授沈陽接受香港文匯報採訪時指出,在開源的推動下,AI技術不再是少數幾家技術巨頭的專屬領地,它開始向更多參與者開放。「這不僅僅是技術和資源的再分配,更在於全球技術創新的全新生態系統的建立。」

「也許,未來的AI會更加民主化,更多創意和進步會從全球範圍內的無數小型團隊和初創公司中誕生,而非少數大型機構的閉門造車。」沈陽告訴香港文匯報記者,開源同樣是一劑強心劑,技術共享並非止於代碼的開放,它還意味着思想的交匯、智慧的碰撞,開源讓全球的研究人員和開發者能夠站在一個共同的平台上,快速迭代、快速創新。

原文來源:香港文匯報

(圖片轉自網絡)

覺得,就點「在看」哦! !   ↓ ↓ 

獅子山下
獅子山下,我們共同的家!同心,理性傳播正能量,共築香港夢!
 最新文章