中國DeepSeek震撼全球國產大模型創奇跡成本僅為OpenAI 5%

　　圖：中國DeepSeek震撼全球

　　「當美國休息時，中國（科技界）在工作，以更低的成本、更快的速度和更強的實力趕上。」美國AI科企Scale AI創始人Alexander Wang所指的，是春節前夕震撼全球的國產新AI大模型DeepSeek（深度求索）。

　　數天前，總部位於中國杭州的DeepSeek發布推理模型R1，在性能逼近OpenAI o1正式版的同時，推理成本卻僅為後者幾十分之一，訓練費用約為GPT-4o的5%。DeepSeek應用於27日登頂蘋果美國地區應用商店免費App下載排行榜，超越ChatGPT，堪稱中國AI發展「里程碑」：在欠缺英偉達AI GPU強大AI算力支持下，中國仍能以極低成本加上性能普通的AI加速器，訓練出推理能力一流的突破式開源AI大模型，創造奇跡。有專家告訴大公報，中美AI博弈已進入戰略相持階段。

　　專家：制裁倒逼創新開源唯一選擇

　　DeepSeek的表現震撼美國硅谷，掀起全球熱潮，甚至被稱作「來自東方的神秘力量」。紐約時報稱，DeepSeek大模型以不到600萬美元的極低成本和僅僅2000塊芯片實現與OpenAI等巨頭相媲美的性能，挑戰「唯科技巨頭才能研發尖端AI」共識。

　　DeepSeek成立於2023年5月，是一家大模型創業公司，創始人之一是來自廣東湛江吳川的梁文鋒。去年12月27日推出開源模型DeepSeek-V3，放棄業內普遍使用的「監督微調」訓練範式，直接通過「強化學習」讓模型自主進化出推理能力。分析指，這是美國對華芯片出口限制下所激發出的創新。

　　今年1月20日，DeepSeek正式開源R1推理模型，在數學、代碼、自然語言推理等任務上的性能能比肩OpenAI o1模型正式版，並支持免費商用、任意修改和衍生開發等，其預訓練費用只有557.6萬美元（GPT-4o約為1億美元），在2048塊英偉達中國市場低配版H800 GPU集群上運行逾50天完成。

　　「物美價廉」是R1一大特點，每百萬個token（符元，AI 時代最基礎運算單位）查詢成本為0.14美元，OpenAI成本為7.50美元，便宜98%。硅谷知名投資機構A16z合夥人Anjney Midha表示：「從史丹福到麻省理工，R1一夜之間成為美國頂尖大學研究人員首選模型。」

　　中國人才濟濟破AI能力「護城河」

　　臉書母公司Meta一位員工在網上發帖披露，Meta內部已進入恐慌模式。「一切源於DeepSeek-V3，其在基準測試中讓Llama 4相形見絀。」據悉，Llama 4訓練規模空前巨大，共使用24萬塊GPU。加州大學伯克利分校AI政策研究員Ritwik Gupta稱，DeepSeek最近發布的模型表明「AI能力沒有護城河」。中國系統工程師人才庫比美國大得多，懂得如何充分利用計算資源來更便宜地訓練和運行模型。

　　日前，OpenAI、軟銀等公司公布「星際之門」計劃，要在4年中砸5000億美元來加速美國人工智能的發展。清華大學新聞學院、人工智能學院教授沈陽說：「DeepSeek的成功不僅是中國在科技領域重大勝利，更可能改變全球AI技術的發展軌跡。」沈陽認為，中美AI博弈已進入戰略相持階段，AI產業未來將不再是單純「大算力」競爭，而是「智能化」與「自主化」全新博弈，通過技術創新打破封鎖、打破壁壘，開源成為唯一選擇。