IBM近日宣佈推出第三代Granite大型語言模型(LLM)系列及相關工具,名為 Granite 3.0 。這個新版本在保持強大功能的同時,更注重實用性,為企業用例提供了在性能,安全性、速度和成本效益之間的最佳平衡。
Granite 3.0 主要特點
- 核心模型:Granite 3.0 8B Instruct,一個經指令微調的密集解碼器LLM。
- 訓練數據:超過12萬億個經過嚴格審查的token,涵蓋12種自然語言和116種程式語言。
- 性能:在學術基準測試中與同等規模的開源模型相當,在企業任務和安全性基準測試中表現更優。
- 開源許可:所有Granite模型均以Apache 2.0許可證發布,體現IBM對開源的承諾。
- 透明度:詳細披露了訓練數據集和方法,強調了IBM對構建透明、安全和可信AI產品的dedication。
Granite 3.0系列模型
- 通用密集LLM:8B和2B參數的指令微調和基礎版本。
- 安全防護模型:Granite Guardian 3.0 8B和2B,用於輸入輸出安全管控。
- 專家混合(MoE)模型:為最小延遲優化。
- 推測解碼器:用於提高推理速度和效率。
性能與安全性
- 在學術基準測試中,Granite 3.0 8B Instruct與Meta和Mistral AI的同等規模模型相當。
- 在企業用例基準測試(如RAGBench)中表現出色。
- 在網絡安全和工具調用等關鍵企業領域表現優異。
- Granite Guardian模型在多個安全基準測試中超越了Meta的LlamaGuard。
效率與創新
- 採用IBM Research開發的Power調度器,優化學習率和訓練效率。
- 引入MoE模型,提供高推理效率。
- 推出Granite 3.0 8B Instruct-Accelerator,通過推測解碼提高推理速度。
應用與部署
Granite 3.0模型可通過IBM watsonx.ai平台以及Google Vertex AI、Hugging Face、NVIDIA、Ollama和Replicate等合作夥伴平台使用。IBM還提供了豐富的指南和教程,幫助開發者快速上手使用Granite模型。
結語
Granite 3.0的發布標誌著IBM在企業級AI模型領域的重大進展,結合性能、安全性和開放性,IBM旨在為企業提供可靠、高效且符合道德標準的AI解決方案。隨著更多功能的計劃在2024年推出,Granite系列有望在企業AI應用中發揮越來越重要的作用。
參考來源:https://www.ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models