《Disney +》 迪士尼、Marvel、彼思、星球大戰…  索尼克的完全新作《索尼克未知邊境》將於2022年冬季登場!   The Last of Us Day 2021社群慶典   《Demon’s Souls》教會特技表演者的肢體動作二三事   《PUBG: Battlegrounds》自1月12日起採行基本遊玩免費   「瓦干達之戰」中黑豹服裝背後的靈感   《The Last of Us Part II》PS5性能更新檔   《桃太郎電鐵~昭和 平成 令和也是基本款!~》發布免費更新!「桃鐵GP2021夏」夏季活動開跑!   『鬼滅之刃 火之神血風譚』單人遊玩模式介紹② 

DeepSeek V3-0324 更新版本,推理能力和中文寫作大幅提升

商業

深度求索(DeepSeek)近日在Hugging Face平台上發布了DeepSeek-V3-0324新版模型,作為DeepSeek-V3的優化更新版本,在多個關鍵能力上取得了顯著提升,特別是在推理能力、前端網頁開發和中文寫作表現方面有明顯進步。

推理能力大幅提升

在基準測試方面,DeepSeek-V3-0324相較於前代產品取得了亮眼的成績提升:

  • MMLU-Pro測試:從75.9提升至81.2(+5.3)
  • GPQA科學問答:從59.1提升至68.4(+9.3)
  • AIME數學:從39.6大幅跳升至59.4(+19.8)
  • LiveCodeBench代碼基準:從39.2提升至49.2(+10.0)

其中,特別值得關注的是在AIME數學測試中近20點的巨大進步,顯示該模型在處理數學推理任務上有了質的飛躍。

前端網頁開發能力增強

新版模型在網頁開發方面也有顯著改進:

  • 提高了代碼的可執行性
  • 產生更具美觀性的網頁和遊戲前端界面

中文寫作能力優化

DeepSeek-V3-0324在中文寫作上優化明顯:

  • 與R1寫作風格更加一致
  • 中長篇寫作品質提升
  • 增強了多輪互動重寫能力
  • 優化翻譯質量和書信寫作表現

中文搜索與功能調用改進

除了核心能力提升外,新版本還特別針對以下功能進行了優化:

  • 強化報告分析請求,能夠輸出更詳細的內容
  • 提高Function Calling(功能調用)的準確性,修復了之前V3版本的問題

TechApple觀點:中國開源大模型的崛起與差距縮小

DeepSeek-V3-0324的發布代表了中國開源大模型陣營的重要進展。從數據上看,特別是在AIME數學測試上近20點的提升,以及GPQA科學問答上的大幅進步,顯示DeepSeek在處理高難度推理任務上已經取得了實質性突破。值得注意的是,DeepSeek特別強調了中文能力的提升,這反映了中國AI公司對本土市場的重視,也是與西方模型的差異化競爭策略。尤其在報告分析和長文寫作方面的改進,更貼合中國企業和個人用戶的實際需求。

然而,開源模型的發展面臨雙面挑戰:一方面需要不斷提升技術實力,另一方面又要平衡開源與商業化的矛盾。DeepSeek採取MIT許可證方式開源,顯示了其開放的態度,但如何在保持技術透明的同時建立可持續的商業模式,仍是所有開源AI公司需要思考的問題。

參考內容:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324?utm_source=ai.briefnewsletter.com&utm_medium=newsletter&utm_campaign=deepseek&_bhlid=32624859d68cb9ea6e13fce6cb0d5ac0a83e058d

TechApple

隨機商業新聞

Micorsoft