《Disney +》迪士尼、Marvel、彼思、星球大戰… 《NieR Replicant ver.1.22474487139…》實體版開放預購區塊鏈遊戲「The Sandbox」中的土地「 LAND」已經在可以輕鬆買賣NFT的平台「 Coincheck NFT（β版）」上販售！新《Resident Evil Village》體驗版邀請玩家明日一探蒂米特雷斯庫城堡 Team ASOBI熱情獻上：教你畫Astro！出道放送情報合集！VTuber介巨頭彩虹社有五名新人出道！「PS VR亮點」挾精采更新回歸 LeSportsac×Pokémon再度推出聯名系列並於11月17日(三)日本開賣！《貓咪大戰爭》Q周年紀念活動第1彈11月15日開始！

DeepSeek-V3 發布！生成速度提升約 3 倍，性能直逼GPT-4o，超性價比新星

商業星期五, 十二月 27, 2024

在AI領域競爭日趨激烈的當下，中國AI公司DeepSeek 異軍突起。12月26日，DeepSeek正式發布最新一代AI語言模型 DeepSeek-V3，不僅在效能上挑戰GPT-4o等頂級模型，更實現了生成速度的突破性提升。這不僅是DeepSeek的重要里程碑，更代表開源AI模型與閉源商業模型的差距正在快速縮小。

DeepSeek-V3 發布！生成速度提升約 3 倍，性能直逼GPT-4o，超性價比新星 1

技術實力展現驚人突破

DeepSeek-V3採用自主研發的MoE（混合專家）架構，總參數量達到671B，在實際運算中激活37B參數。該模型已在高達14.8萬億tokens的資料上完成預訓練，規模令人印象深刻。

更值得注意的是，這款新模型在多項關鍵評測中均展現出卓越表現。在知識問答、長文本理解、程式編寫及數學運算等領域，DeepSeek-V3不僅超越了同類開源模型，更在某些測試中勝過GPT-4和Claude-3.5等業界標竿。

全方位能力大躍進

DeepSeek-V3在各個領域都有亮眼表現：在百科知識方面，其表現已接近目前最強的Claude-3.5-Sonnet。在程式設計領域，特別是算法類程式的編寫能力上，更是遙遙領先其他非頂級商業模型。

數學能力更是一大亮點，在美國數學競賽和中國高中數學聯賽的測試中，DeepSeek-V3展現出了超越所有已知模型的解題能力，中文處理能力同樣不容忽視。在權威的C-Eval等測評中，DeepSeek-V3展現出與其他頂級模型相當的實力，在某些細分領域甚至更勝一籌。

DeepSeek-V3 發布！生成速度提升約 3 倍，性能直逼GPT-4o，超性價比新星 2

速度與效能的完美結合

最令人驚喜的突破在於生成速度。DeepSeek-V3將文字生成速度從每秒20個詞提升至60個詞，實現了驚人的3倍性能提升。「這意味著使用者將享受到更加流暢自然的對話體驗，」團隊表示。

優惠政策回饋用戶

為了讓更多用戶體驗這款突破性的新模型，DeepSeek推出了長達45天的優惠期。從即日起至2025年2月8日，API服務將維持相當親民的價格：每百萬輸入tokens最低只需0.1元，輸出tokens則為2元。

開源共享促進產業發展

秉持開源精神，DeepSeek同步開放了模型原生FP8權重，並提供完整的轉換工具。多個主流框架如SGLang和LMDeploy已在第一時間完成適配，讓開發者可以快速部署使用。

未來發展與願景

DeepSeek團隊表示未來他們將在V3基座模型的基礎上，持續開發更豐富的功能，包括深度思考能力和多模態應用等。同時，他們也將繼續秉持開源精神，與社群共同推動AI技術的進步

DeepSeek-V3的發布，不僅展現了中國AI企業的創新實力，更為開源AI模型的發展寫下了新的篇章。隨著開源與閉源模型的差距不斷縮小，我們或許正在見證AI技術普及化的重要時刻。

參考來源：https://api-docs.deepseek.com/zh-cn/news/news1226

Micorsoft