Google正式發佈了Gemma 3,這是一款基於Gemini 2.0技術打造的全新開放模型系列,旨在提供輕量級但功能強大的AI解決方案。自Gemma系列去年發佈以來,已獲得超過1億次下載,社群開發者更創建了超過6萬個Gemma變體。Gemma 3被設計為能夠直接在各種裝置上運行,從手機、筆電到工作站都可支援。
尺寸多樣滿足不同需求
Gemma 3提供多種參數規模(1B、4B、12B和27B),開發者可根據自身硬體和性能需求選擇最適合的模型。這種多樣性使模型能夠適應從輕量級應用到複雜任務的各種場景。
卓越性能超越同級產品
在單加速器性能方面,Gemma 3交出亮眼成績。在LMArena的人類偏好評估中,它的表現甚至超越了Llama3-405B、DeepSeek-V3和o3-mini等競品。這意味著開發者只需單個GPU或TPU主機,就能創建高互動性的用戶體驗。
強大語言與視覺能力
Gemma 3在語言支援上提供了驚人的廣度,開箱即用支援35種語言,預訓練支援超過140種語言。此外,它還具備先進的文本和視覺推理能力,可輕鬆分析圖像、文本和短影片,為互動和智慧應用開創新可能。
超大上下文窗口與功能呼叫支援
該模型配備128k標記的上下文窗口,能夠處理和理解大量資訊。同時,Gemma 3支援功能呼叫和結構化輸出,幫助開發者自動化任務並建立代理式體驗。
量化模型提升效能
Google為Gemma 3推出了官方量化版本,在保持高精度的同時,顯著降低了模型大小和計算需求,讓模型能在更多資源受限的環境中高效運行。
嚴格的安全開發與監控
Google表示,開放模型需要謹慎的風險評估,而Gemma 3的開發包含了廣泛的數據治理、與安全政策對齊的微調以及強大的基準測試。特別是對其增強的STEM性能,Google進行了針對性評估,關注其在創建有害物質方面的潛在濫用,結果顯示風險水平較低。
ShieldGemma 2強化圖像安全
隨Gemma 3一同發佈的還有ShieldGemma 2,這是一款基於Gemma 3基礎構建的4B級圖像安全檢查器。它能為圖像提供三類安全標籤:危險內容、性露骨內容和暴力內容,開發者可進一步自定義它以滿足特定安全需求。
無縫整合多種開發工具
Gemma 3和ShieldGemma 2可輕鬆融入現有工作流程,支援Hugging Face Transformers、Ollama、JAX、Keras、PyTorch等多種主流開發工具。開發者可通過Google AI Studio、Kaggle或Hugging Face立即開始實驗,不需複雜設置。
在部署選項上,Gemma 3提供了包括Vertex AI、Cloud Run、Google GenAI API以及本地環境在內的多種選擇。模型針對NVIDIA GPU進行了直接優化,從Jetson Nano到最新的Blackwell晶片都能獲得最佳性能。此外,它還針對Google Cloud TPU進行了優化,並通過開源ROCm堆疊與AMD GPU整合。
學術支持計劃
為促進學術研究突破,Google推出了Gemma 3學術計劃。學術研究人員可申請價值10,000美元的Google Cloud額度,以加速他們基於Gemma 3的研究。申請表格今日開放,將開放四週時間。
TechApple 觀點:Google的開放策略值得讚賞,但挑戰也隨之而來
Gemma 3的發佈反映了Google在開源AI領域的決心,而不只是玩玩概念而已。與多數科技巨頭往往將最強大模型鎖在雲端服務背後不同,Google選擇將源自Gemini 2.0的技術開放給社區。
開放模型的競爭已經白熱化。Meta的Llama、Mixtral的Mistral以及許多開源項目都在爭奪開發者的注意力。這場戰爭中,Gemma 3能否真正脫穎而出,不僅取決於其技術性能,還要看Google能否提供足夠吸引人的生態系統和支持。