圖:中國DeepSeek震撼全球
「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。」美國AI科企Scale AI創始人Alexander Wang所指的,是春節前夕震撼全球的國產新AI大模型DeepSeek(深度求索)。
數天前,總部位於中國杭州的DeepSeek發布推理模型R1,在性能逼近OpenAI o1正式版的同時,推理成本卻僅為後者幾十分之一,訓練費用約為GPT-4o的5%。DeepSeek應用於27日登頂蘋果美國地區應用商店免費App下載排行榜,超越ChatGPT,堪稱中國AI發展「里程碑」:在欠缺英偉達AI GPU強大AI算力支持下,中國仍能以極低成本加上性能普通的AI加速器,訓練出推理能力一流的突破式開源AI大模型,創造奇跡。有專家告訴大公報,中美AI博弈已進入戰略相持階段。
專家:制裁倒逼創新 開源唯一選擇
DeepSeek的表現震撼美國硅谷,掀起全球熱潮,甚至被稱作「來自東方的神秘力量」。紐約時報稱,DeepSeek大模型以不到600萬美元的極低成本和僅僅2000塊芯片實現與OpenAI等巨頭相媲美的性能,挑戰「唯科技巨頭才能研發尖端AI」共識。
DeepSeek成立於2023年5月,是一家大模型創業公司,創始人之一是來自廣東湛江吳川的梁文鋒。去年12月27日推出開源模型DeepSeek-V3,放棄業內普遍使用的「監督微調」訓練範式,直接通過「強化學習」讓模型自主進化出推理能力。分析指,這是美國對華芯片出口限制下所激發出的創新。
今年1月20日,DeepSeek正式開源R1推理模型,在數學、代碼、自然語言推理等任務上的性能能比肩OpenAI o1模型正式版,並支持免費商用、任意修改和衍生開發等,其預訓練費用只有557.6萬美元(GPT-4o約為1億美元),在2048塊英偉達中國市場低配版H800 GPU集群上運行逾50天完成。
「物美價廉」是R1一大特點,每百萬個token(符元,AI 時代最基礎運算單位)查詢成本為0.14美元,OpenAI成本為7.50美元,便宜98%。硅谷知名投資機構A16z合夥人Anjney Midha表示:「從史丹福到麻省理工,R1一夜之間成為美國頂尖大學研究人員首選模型。」
中國人才濟濟 破AI能力「護城河」
臉書母公司Meta一位員工在網上發帖披露,Meta內部已進入恐慌模式。「一切源於DeepSeek-V3,其在基準測試中讓Llama 4相形見絀。」據悉,Llama 4訓練規模空前巨大,共使用24萬塊GPU。加州大學伯克利分校AI政策研究員Ritwik Gupta稱,DeepSeek最近發布的模型表明「AI能力沒有護城河」。中國系統工程師人才庫比美國大得多,懂得如何充分利用計算資源來更便宜地訓練和運行模型。
日前,OpenAI、軟銀等公司公布「星際之門」計劃,要在4年中砸5000億美元來加速美國人工智能的發展。清華大學新聞學院、人工智能學院教授沈陽說:「DeepSeek的成功不僅是中國在科技領域重大勝利,更可能改變全球AI技術的發展軌跡。」沈陽認為,中美AI博弈已進入戰略相持階段,AI產業未來將不再是單純「大算力」競爭,而是「智能化」與「自主化」全新博弈,通過技術創新打破封鎖、打破壁壘,開源成為唯一選擇。