DeepSeek 早前發佈全新R1模型,立即引發轟動,他們更同步開源模型權重,且採用MIT授權協議。用戶可透過蒸餾技術,利用R1訓練其他模型,新模型已同步在DeepSeek官網與App上線,為用戶帶來全新體驗。
實力媲美OpenAI最新技術
DeepSeek-R1在後期訓練階段,大規模運用強化學習技術,即使在極少標註資料的情況下,仍成功提升模型的推理能力。在數學運算、程式碼生成、自然語言推理等多項任務中,表現已能與OpenAI o1正式版比肩。為促進技術交流,DeepSeek更將完整訓練技術公開。
小型模型的突破性成就
除了推出660B的DeepSeek-R1-Zero和DeepSeek-R1兩款主力模型外,團隊更透過R1的輸出成果,成功開發6款小型模型供社群使用。其中,32B和70B版本的效能已超越OpenAI o1-mini,展現驚人實力。使用者可在HuggingFace平台上取得這些模型。
開放授權新政策
為推動開源社群發展,DeepSeek在授權方面做出重大調整,所有開源程式碼(包含模型權重)統一採用MIT授權條款,完全開放且不限制商業使用,無需額外申請。同時,產品使用條款明確允許用戶進行模型蒸餾,藉此促進技術共享與創新。
使用方式與價格方案
想體驗DeepSeek-R1的強大功能,用戶可登入官網或官方App,開啟「深度思考」模式即可使用。在API服務方面,採用彈性計價:每百萬輸入tokens收費1元(快取命中)或4元(快取未命中),每百萬輸出tokens收費16元。
技術創新展望未來
此次DeepSeek-R1的發布,不僅展現了強大的技術實力,更體現出開放、共享的創新精神。透過完整的技術公開和靈活的授權政策,DeepSeek期待能與開發者社群共同推動AI技術的進步,為產業發展注入新動力。這次的突破性進展,為AI領域開創了嶄新篇章。
HuggingFace : https://huggingface.co/deepseek-ai