人民網
人民網>>經濟·科技

中國大模型助力AI技術更開放更高效

李 山
2025年01月16日08:41 | 來源:科技日報
小字號

原標題:中國大模型助力AI技術更開放更高效

近日,中國初創企業DeepSeek開發的大語言模型(LLM)DeepSeek-V3引發美歐業界廣泛關注,該模型在技術性能、開源模式、成本效益等方面的突出表現獲得積極評價。開源的DeepSeek-V3是全球AI生態的一次重要變革,有助於美國之外的國家和地區在AI領域自主發展,推動全球AI技術向更加開放、多元和高效的方向邁進。

多項指標媲美頂尖模型

根據測評機構Artificial Analysis的獨立分析,DeepSeek-V3可與世界頂尖的AI模型競爭。在文本理解、編碼、數學和學科知識方面,DeepSeek-V3優於Meta的Llama 3.1-405B和阿裡巴巴的Qwen 2.5-72B等開源模型,並在性能上和世界頂尖的閉源模型OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet不分伯仲。DeepSeek-V3在中文處理、編碼和數學計算等方面的優勢,使其在教育和科研領域具有巨大潛力。

DeepSeek-V3的開發和訓練成本也明顯低於其他大模型。OpenAI創始成員之一安德烈·卡帕蒂強調了這種非凡的效率:像DeepSeek-V3這樣性能和級別的模型,通常需要1.6萬到10萬個GPU的集群來訓練,而中國初創公司僅用了2048個GPU在57天內便完成了訓練。其成本約557.6萬美元,僅為其他主流模型(如GPT-4)的1/10左右。

另一方面,媒體則關注了所謂的“AI污染”、隱私保護和安全等問題。隨著互聯網上AI生成內容的泛濫,AI模型在訓練過程中會產生“幻覺”或誤導性答案。DeepSeek-V3的案例凸顯了在AI生成內容日益普及的背景下,如何確保訓練數據的純淨性和可靠性是個亟待解決的問題。

開源策略改變AI生態

DeepSeek之所以能實現巨大的效率提升,關鍵在於其算法、框架和硬件的協同設計。在美國企業AI模型的開發費用越來越昂貴之際,DeepSeek-V3的出現表明,即使沒有數十億美元的預算,也能開發出頂級AI。這對預算有限的企業和研究機構來說是個好消息。這種高效訓練方法被媒體稱為“AI領域的范式轉變”,這在當前算力緊張的背景下尤為重要。

此外,DeepSeek-V3的開源策略也受到業界熱烈歡迎。像OpenAI這樣擁有大量用戶的公司收費高、不開源,卻仍然虧損數十億美元﹔而DeepSeek-V3以更便宜的價格提供頂級模型,而且還是開源的。這樣低的開發成本和激進的定價政策,讓很多AI企業倍感壓力。長遠看,這將沖擊到美國科技巨頭在AI市場的主導地位。

DeepSeek-V3証明了開源模型在性能和成本上已具備與閉源模型競爭的能力。這將促使更多企業重新評估其技術策略,尤其是在開源與閉源模式、硬件依賴與軟件創新之間的平衡。這有助於推動AI生態向更加開放的方向發展,促使更多企業加入開源陣營,為全球AI社區提供寶貴的資源,進而促進AI技術的普及。

突破“小院高牆”式封鎖

近年來,中美之間圍繞AI進行了激烈競爭。美國試圖通過日趨嚴苛的芯片出口禁令來限制中國AI的發展。1月13日,美國又推出新一輪AI芯片出口限制措施,希望將AI技術的發展集中在所謂的“友好國家和地區”,防止先進芯片流入“對手”國,並為全球AI發展設定美國標准。美國相關政策的制定者想當然地認為,除了美國以外沒有國家可提供高端GPU芯片及相應算力,或是研發出替代算法和產品。然而,DeepSeek-V3的出現証明,美國“小院高牆”式的封鎖終將被技術創新所擊潰。

事實証明,美國的各種限制措施反而催生了中國在算法和架構上的創新。中國的芯片技術在一步步提高,AI應用領域的創新更是取得了明顯進步。DeepSeek-V3為中國AI生態的發展提供了新動力,也有利於全球AI技術向更加開放、多元和高效的方向邁進。

反觀歐洲,雖然各國政府高度重視AI技術和產業發展,但歐洲在AI發展過程中過於依賴美國大型科技公司的投資和技術支持,導致技術主權和市場競爭力被削弱。AI在推動新一輪科技革命和產業變革中的地位日益凸顯。對於倡導技術主權的歐洲來說,推動本土AI技術的發展,減少對美國的依賴,或許才是歐洲AI可持續發展的關鍵。

(責編:楊曦、陳鍵)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部