《Disney +》 迪士尼、Marvel、彼思、星球大戰…  《Tribes of Midgard》:駕馭維京色彩鮮明的猛獸之道   日本最大汽車連鎖百貨AUTOBACS將進駐電競設施!「AUTOBACS REDEE Emotorsports Stadium」於4月16日隆重開幕!   累計販賣數突破450萬套!!《惡靈古堡8村莊》發布追加DLC 還有「那部影片」人氣感謝活動…?   香港最大動漫・電玩盛事「ACGHK 2021(香港動漫電玩節)」即將登場!另有電競活動「香港電競嘉年華2021」!   新《Resident Evil Village》遊戲畫面充分展現戰鬥、反派與環境   PONOS推出新手遊《本当の幸せ》日本上線!冥想翱翔空中的奇妙動作遊戲!   《Godfall》現已登陸PS4,同時推出全新「Fire & Darkness」擴充內容   這個夏天一起來種稻吧!《天穗之咲稻姬》首次特惠開跑! 

DeepSeek-V3 發布!生成速度提升約 3 倍,性能直逼GPT-4o,超性價比新星

商業

在AI領域競爭日趨激烈的當下,中國AI公司DeepSeek 異軍突起。12月26日,DeepSeek正式發布最新一代AI語言模型 DeepSeek-V3,不僅在效能上挑戰GPT-4o等頂級模型,更實現了生成速度的突破性提升。這不僅是DeepSeek的重要里程碑,更代表開源AI模型與閉源商業模型的差距正在快速縮小。

技術實力展現驚人突破

DeepSeek-V3採用自主研發的MoE(混合專家)架構,總參數量達到671B,在實際運算中激活37B參數。該模型已在高達14.8萬億tokens的資料上完成預訓練,規模令人印象深刻。

更值得注意的是,這款新模型在多項關鍵評測中均展現出卓越表現。在知識問答、長文本理解、程式編寫及數學運算等領域,DeepSeek-V3不僅超越了同類開源模型,更在某些測試中勝過GPT-4和Claude-3.5等業界標竿。

全方位能力大躍進

DeepSeek-V3在各個領域都有亮眼表現:在百科知識方面,其表現已接近目前最強的Claude-3.5-Sonnet。在程式設計領域,特別是算法類程式的編寫能力上,更是遙遙領先其他非頂級商業模型。

數學能力更是一大亮點,在美國數學競賽和中國高中數學聯賽的測試中,DeepSeek-V3展現出了超越所有已知模型的解題能力,中文處理能力同樣不容忽視。在權威的C-Eval等測評中,DeepSeek-V3展現出與其他頂級模型相當的實力,在某些細分領域甚至更勝一籌。

速度與效能的完美結合

最令人驚喜的突破在於生成速度。DeepSeek-V3將文字生成速度從每秒20個詞提升至60個詞,實現了驚人的3倍性能提升。「這意味著使用者將享受到更加流暢自然的對話體驗,」團隊表示。

優惠政策回饋用戶

為了讓更多用戶體驗這款突破性的新模型,DeepSeek推出了長達45天的優惠期。從即日起至2025年2月8日,API服務將維持相當親民的價格:每百萬輸入tokens最低只需0.1元,輸出tokens則為2元。

開源共享促進產業發展

秉持開源精神,DeepSeek同步開放了模型原生FP8權重,並提供完整的轉換工具。多個主流框架如SGLang和LMDeploy已在第一時間完成適配,讓開發者可以快速部署使用。

未來發展與願景

DeepSeek團隊表示未來他們將在V3基座模型的基礎上,持續開發更豐富的功能,包括深度思考能力和多模態應用等。同時,他們也將繼續秉持開源精神,與社群共同推動AI技術的進步

DeepSeek-V3的發布,不僅展現了中國AI企業的創新實力,更為開源AI模型的發展寫下了新的篇章。隨著開源與閉源模型的差距不斷縮小,我們或許正在見證AI技術普及化的重要時刻。

參考來源:https://api-docs.deepseek.com/zh-cn/news/news1226

TechApple

隨機商業新聞

Disney Plus