《Disney +》 迪士尼、Marvel、彼思、星球大戰…  《Ghost of Tsushima》即將改編電影   Nintendo Switch版「Apex英雄」即日起開放下載!你的SD記憶卡準備好了嗎?   『快打旋風V』公布新角色「蘿絲」更新日期!   HP將以4.25億美元收購電競品牌「HyperX」!金士頓DRAM與SSD產品線將不受影響。   hololive與日本全家第3彈合作企劃!「#ホロマート キャンペーンvol.3 5月5期生“May” you be happy」於5月11日開跑!   必備精選優惠重返PlayStation Store   《Uncharted: 盜賊傳奇合輯》重製組合包詳情   日本2022年畢業生的「人氣就業企業排行」大公開!遊戲業界的第1名果然是…! 

轟動世界的 DeepSeek R1 模型,效能直追OpenAI最新產品

商業

DeepSeek 早前發佈全新R1模型,立即引發轟動,他們更同步開源模型權重,且採用MIT授權協議。用戶可透過蒸餾技術,利用R1訓練其他模型,新模型已同步在DeepSeek官網與App上線,為用戶帶來全新體驗。

實力媲美OpenAI最新技術

DeepSeek-R1在後期訓練階段,大規模運用強化學習技術,即使在極少標註資料的情況下,仍成功提升模型的推理能力。在數學運算、程式碼生成、自然語言推理等多項任務中,表現已能與OpenAI o1正式版比肩。為促進技術交流,DeepSeek更將完整訓練技術公開。

小型模型的突破性成就

除了推出660B的DeepSeek-R1-Zero和DeepSeek-R1兩款主力模型外,團隊更透過R1的輸出成果,成功開發6款小型模型供社群使用。其中,32B和70B版本的效能已超越OpenAI o1-mini,展現驚人實力。使用者可在HuggingFace平台上取得這些模型。

開放授權新政策

為推動開源社群發展,DeepSeek在授權方面做出重大調整,所有開源程式碼(包含模型權重)統一採用MIT授權條款,完全開放且不限制商業使用,無需額外申請。同時,產品使用條款明確允許用戶進行模型蒸餾,藉此促進技術共享與創新。

使用方式與價格方案

想體驗DeepSeek-R1的強大功能,用戶可登入官網或官方App,開啟「深度思考」模式即可使用。在API服務方面,採用彈性計價:每百萬輸入tokens收費1元(快取命中)或4元(快取未命中),每百萬輸出tokens收費16元。

技術創新展望未來

此次DeepSeek-R1的發布,不僅展現了強大的技術實力,更體現出開放、共享的創新精神。透過完整的技術公開和靈活的授權政策,DeepSeek期待能與開發者社群共同推動AI技術的進步,為產業發展注入新動力。這次的突破性進展,為AI領域開創了嶄新篇章。

HuggingFace : https://huggingface.co/deepseek-ai

參考資料:https://api-docs.deepseek.com/zh-cn/news/news250120

TechApple

隨機商業新聞

Gearbest