在AI領域競爭日趨激烈的當下,中國AI公司DeepSeek 異軍突起。12月26日,DeepSeek正式發布最新一代AI語言模型 DeepSeek-V3,不僅在效能上挑戰GPT-4o等頂級模型,更實現了生成速度的突破性提升。這不僅是DeepSeek的重要里程碑,更代表開源AI模型與閉源商業模型的差距正在快速縮小。
技術實力展現驚人突破
DeepSeek-V3採用自主研發的MoE(混合專家)架構,總參數量達到671B,在實際運算中激活37B參數。該模型已在高達14.8萬億tokens的資料上完成預訓練,規模令人印象深刻。
更值得注意的是,這款新模型在多項關鍵評測中均展現出卓越表現。在知識問答、長文本理解、程式編寫及數學運算等領域,DeepSeek-V3不僅超越了同類開源模型,更在某些測試中勝過GPT-4和Claude-3.5等業界標竿。
全方位能力大躍進
DeepSeek-V3在各個領域都有亮眼表現:在百科知識方面,其表現已接近目前最強的Claude-3.5-Sonnet。在程式設計領域,特別是算法類程式的編寫能力上,更是遙遙領先其他非頂級商業模型。
數學能力更是一大亮點,在美國數學競賽和中國高中數學聯賽的測試中,DeepSeek-V3展現出了超越所有已知模型的解題能力,中文處理能力同樣不容忽視。在權威的C-Eval等測評中,DeepSeek-V3展現出與其他頂級模型相當的實力,在某些細分領域甚至更勝一籌。
速度與效能的完美結合
最令人驚喜的突破在於生成速度。DeepSeek-V3將文字生成速度從每秒20個詞提升至60個詞,實現了驚人的3倍性能提升。「這意味著使用者將享受到更加流暢自然的對話體驗,」團隊表示。
優惠政策回饋用戶
為了讓更多用戶體驗這款突破性的新模型,DeepSeek推出了長達45天的優惠期。從即日起至2025年2月8日,API服務將維持相當親民的價格:每百萬輸入tokens最低只需0.1元,輸出tokens則為2元。
開源共享促進產業發展
秉持開源精神,DeepSeek同步開放了模型原生FP8權重,並提供完整的轉換工具。多個主流框架如SGLang和LMDeploy已在第一時間完成適配,讓開發者可以快速部署使用。
未來發展與願景
DeepSeek團隊表示未來他們將在V3基座模型的基礎上,持續開發更豐富的功能,包括深度思考能力和多模態應用等。同時,他們也將繼續秉持開源精神,與社群共同推動AI技術的進步
DeepSeek-V3的發布,不僅展現了中國AI企業的創新實力,更為開源AI模型的發展寫下了新的篇章。隨著開源與閉源模型的差距不斷縮小,我們或許正在見證AI技術普及化的重要時刻。