傳聞中的 DeepSeek R2 還要等多久？

傳說中的 DeepSeek R2 是 DeepSeek 繼 R1 之後的下一代 AI 推理模型，R1 於 2025 年 1 月發布，迅速因其低成本和高性能而受到全球關注。以下是關於 R2 的全面分析，包括當前狀態、預期功能、發布時間猜測以及進展分析。

背景與 R1 的成功

DeepSeek R1 的發布標誌著中國 AI 初創公司在全球市場的崛起。R1 被認為與 OpenAI 的 o1 在數學、編碼和推理任務上表現相當，但訓練成本僅為數百萬美元，遠低於西方競爭對手的數十億美元投入。這種成本效益得益於 DeepSeek 使用高效的 Nvidia 硬體和創新的訓練方法，如強化學習和混合專家架構。R1 的開放源碼許可（MIT 許可）也吸引了全球開發者和企業，進一步擴大了其影響力。例如，R1 已整合到 Microsoft Azure AI Foundry 和 GitHub 上，供企業使用 (DeepSeek R1 on Azure)。

R2 的當前狀態

截至 2025 年 3 月 1 日，DEEPSEEK R2 尚未正式發布。根據多方報導，DeepSeek 原計劃在 5 月初推出 R2，但近期有消息指他們正在加速進程，目標是盡早發布 (DeepSeek Rushes to Launch New AI Model)。然而，具體發布日期尚未確定，DeepSeek 也未對此作出官方回應。

新版本改進的細節尚未完全披露，但可以推測 R2 將解決 R1 的一些已知問題，如重複生成和可讀性差，這些問題在 R1-Zero 版本中曾被提及 (DeepSeek-R1 on GitHub)。

發布時間猜測

一些分析師和業界觀點認為，基於 DeepSeek 的開發速度（每輪訓練僅需一周，且計算資源增加），R2 可能在幾週內準備就緒。DeepSeek 的成本效益策略已引發全球企業加速自身 AI 努力，特別是在亞洲和發展中國家。隨著 R2 的推出，預計將加劇 AI 模型的價格戰，並可能推動更多開放源碼合作，讓我們好好期待吧。

參考來源：

DeepSeek Rushes to Launch New AI Model as China Goes All In

背景與 R1 的成功

R2 的當前狀態

發布時間猜測

隨機商業新聞