《Disney +》 迪士尼、Marvel、彼思、星球大戰…  Nintendo Switch Lite又推出新顏色?這次是「藍色」!   東京「TOKYO eSPORTS FESTA 2022」邀請知名cosplayer「えなこ」成為官方大使!   離發售還有兩星期!「真・女神轉生V」最新PV公開遊戲內容!   職棒野球魂最新作《eBASEBALL職棒野球魂2021 大滿貫》於2021年夏季Nintendo Switch上發售!   《ZELDA無雙 災厄啟示錄》擴充票第1彈「古代的脈動」詳情發布!   《垂死之光2 堅守人性》:看跑酷與創意戰鬥如何點燃精采動作   超現實敘事冒險遊戲《Where the Heart Leads》於7月13日在PS4、PS5發行   電子遊戲市場背後的雲端 

DeepSeek V3-0324 更新版本,推理能力和中文寫作大幅提升

商業

深度求索(DeepSeek)近日在Hugging Face平台上發布了DeepSeek-V3-0324新版模型,作為DeepSeek-V3的優化更新版本,在多個關鍵能力上取得了顯著提升,特別是在推理能力、前端網頁開發和中文寫作表現方面有明顯進步。

推理能力大幅提升

在基準測試方面,DeepSeek-V3-0324相較於前代產品取得了亮眼的成績提升:

  • MMLU-Pro測試:從75.9提升至81.2(+5.3)
  • GPQA科學問答:從59.1提升至68.4(+9.3)
  • AIME數學:從39.6大幅跳升至59.4(+19.8)
  • LiveCodeBench代碼基準:從39.2提升至49.2(+10.0)

其中,特別值得關注的是在AIME數學測試中近20點的巨大進步,顯示該模型在處理數學推理任務上有了質的飛躍。

前端網頁開發能力增強

新版模型在網頁開發方面也有顯著改進:

  • 提高了代碼的可執行性
  • 產生更具美觀性的網頁和遊戲前端界面

中文寫作能力優化

DeepSeek-V3-0324在中文寫作上優化明顯:

  • 與R1寫作風格更加一致
  • 中長篇寫作品質提升
  • 增強了多輪互動重寫能力
  • 優化翻譯質量和書信寫作表現

中文搜索與功能調用改進

除了核心能力提升外,新版本還特別針對以下功能進行了優化:

  • 強化報告分析請求,能夠輸出更詳細的內容
  • 提高Function Calling(功能調用)的準確性,修復了之前V3版本的問題

TechApple觀點:中國開源大模型的崛起與差距縮小

DeepSeek-V3-0324的發布代表了中國開源大模型陣營的重要進展。從數據上看,特別是在AIME數學測試上近20點的提升,以及GPQA科學問答上的大幅進步,顯示DeepSeek在處理高難度推理任務上已經取得了實質性突破。值得注意的是,DeepSeek特別強調了中文能力的提升,這反映了中國AI公司對本土市場的重視,也是與西方模型的差異化競爭策略。尤其在報告分析和長文寫作方面的改進,更貼合中國企業和個人用戶的實際需求。

然而,開源模型的發展面臨雙面挑戰:一方面需要不斷提升技術實力,另一方面又要平衡開源與商業化的矛盾。DeepSeek採取MIT許可證方式開源,顯示了其開放的態度,但如何在保持技術透明的同時建立可持續的商業模式,仍是所有開源AI公司需要思考的問題。

參考內容:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324?utm_source=ai.briefnewsletter.com&utm_medium=newsletter&utm_campaign=deepseek&_bhlid=32624859d68cb9ea6e13fce6cb0d5ac0a83e058d

TechApple

隨機商業新聞

Disney Plus