Google Cloud 宣布對其企業用 AI 平台 Vertex AI 進行重要升級,推出多項新功能,旨在提升平台的可靠性和安全性,並協助企業更快速地推出強大的 AI 虛擬服務專員。這些新功能包括調整、強化、自訂、擴展等多方面的改進。
上月發布的輕量級模型 Gemini 1.5 Flash,現已全面開放使用。該模型結合了低時延、低成本以及 100 萬個字詞(token)的上下文窗口(context window),成為零售客服虛擬專員、文書處理等大規模應用的理想選擇。Gemini 1.5 Flash 相較於 GPT-3.5 Turbo,具有以下優勢:
Gemini 1.5 Flash 相較於 GPT-3.5 Turbo,具有以下優勢:
- 上下文長度是 GPT-3.5 Turbo 的 60 倍
- 輸入一萬個字元的平均速度提高 40%
- 輸入費用僅為 GPT-3.5 Turbo 的四分之一,並提供上下文快取功能
企業和開發人員可立即在 Vertex AI 上使用 Gemini 1.5 Flash。
Gemini 1.5 Pro:處理 200 萬個字詞的上下文窗口
Gemini 1.5 Pro 提供高達 200 萬個字詞的上下文窗口,支援多模態應用,包括處理大規模程式庫和分析數小時的音訊或影片。這使得從無數程式碼中找出錯誤或從研究資料庫中尋找正確資訊變得更加高效。企業和開發人員可立即開始使用能處理 200 萬個字詞的 Gemini 1.5 Pro。
Imagen 3:加速圖像生成
Imagen 3 是 Google 的最新圖像生成基礎模型,提供出色的影像品質和強化功能。與 Imagen 2 相比,Imagen 3 的原型設計和生成速度提高了 40%,並加強了理解和遵循指令的能力。該模型能生成逼真的團體照片,並更準確地控制圖像中的文字成像,部份 Vertex AI 客戶現已可申請使用 Imagen 3。
擴展第三方和開放式模型
Google Cloud 在 Vertex AI 上新增了多款經過精挑細選的第一方、開放式和第三方模型,包括 Anthropic 的 Claude 3.5 Sonnet 模型。此外,Google Cloud 將深化與 Mistral 的合作關係,將 Mistral Small、Mistral Large 和 Mistral Codestral 增至 Vertex AI 的模型園地(Model Garden)。Google 亦宣布向全球研究及開發人員推出 Gemma 2,提供 90億(9B)和 270 億(27B)兩種參數規格選擇,比第一代更強大和有效率。
上下文快取功能降低成本
為幫助客戶更有效地利用 Gemini 的上下文窗口,Google Cloud 推出 Gemini 1.5 Pro 和 Flash 模型的上下文快取公開預覽版。這項功能利用常用上下文的快取資料,幫助客戶降低 75% 的成本,並提高應用程式的效能。
高度傳真模式連結 提升回應真實性
Google Cloud 推出高度傳真模式連結的實驗預覽版本,專門為金融服務、醫療保健及保險等資料密集型行業設計。這項功能由經微調的 Gemini 1.5 Flash 支援,只使用客戶提供的脈上下文來生成答案,確保回應以事實為本。
連接 Google 搜尋及第三方資料
為確保 AI 的真確性並將「幻覺」減低,Google 宣布全面開放使用在 Vertex AI 中連接 Google 搜尋(Grounding with Google Search)。此外,Google Cloud 將從下一季開始提供新服務,讓客戶將專業的第三方資料連接自家 AI 虛擬服務專員,提升 AI 體驗的真實資料可信程度。
按此進一步了解 Vertex AI 可如何幫助不同行業機構。