Google 宣布推出Gemini——其最大、最強大的人工智能模型,開創了人工智能發展的新時代。Gemini 是 Google 團隊齊心協力的成果,展示了非凡的專業知識和創新結合。Gemini 是一款多模態模型,能夠無縫地理解和操作包括文本、代碼、音頻、圖片和視頻等不同類型的訊息。
Gemini 是 Google 迄今為止最靈活的模型,不論由數據中心到行動裝置,都能以高效率地運行。我們將首個版本 Gemini 1.0 引進三種不同尺寸的模型:
- Gemini Ultra:最大型且功能最強大的模型,專為處理高度複雜的任務而設。
- Gemini Pro:最適合處理各種任務擴充的高度優化模型。
- Gemini Nano:專為裝備內置任務而設的高效模型。
主要功能包括:
頂尖效能
Gemini Ultra 在自然影像、音頻和視頻理解和數學推理等方面展現了卓越的實力。它在 32 項普遍用於大型語言模型(LLM)研究的學術基準中,超越了其中的 30 項,以 90.0% 的高分成為了首個在大規模多任務語言理解(MMLU)勝過人類專家的模型。MMLU 包含數學、物理、歷史、法律、醫學和倫理學等 57 個學科,以測試其環球知識和解難能力。我們為 MMLU 設置了新標準,令 Gemini 在解答難題前,更謹慎地運用推理能力,較單憑第一印象解難帶來了明顯的改善。
新一代性能
經過訓練的 Gemini 1.0 可以同時識別和理解文字、圖像、音訊等,可以更好地理解資訊微妙之處,並能就較複雜的題材解答相關問題,這亦令 Gemini 1.0 特別擅長數學和物理學的推理解䆁。其精密的多模態推理能力可以幫助理解複雜的書面和視覺資訊。它擁有從數十萬份文件中閱讀、過濾和理解資訊並提取見解的卓越能力,將助科學以至金融等多個領域以數碼化速度實現新的突破。
在編程方面,第一代 Gemini 可以在世界最流行的編程語言(包括 Python、Java、C++ 和 Go ) 中理解、解釋和生成高品質的程式碼。Gemini Ultra 在多個編程基準中均表現出色,包括評估編程任務的重要業界基準 HumanEval,以及我們內部使用、主要是參考由作者編製的參考資料而不是依賴網上資訊的專用數據庫Natural2Code。我們利用 Gemini 的專門版本創造了更先進的程式碼生成系統 AlphaCode 2,它擅長解決競爭性編程問題,並較早前的 AlphaCode 解決多近兩倍的問題。當程式編製員與 AlphaCode 2 協作,為程式碼樣本定義特定屬性時,它的表現甚至會更好。
更可靠、更具可擴充性和更高效
我們利用 Google 內部設計的人工智能晶片(Tensor Processing Units,簡稱TPUs)v4 和 v5e,在經 AI 優化的基礎架構上對 Gemini 1.0 進行大規模訓練 ,並設計成我們最可靠、最具可擴充性及提供最高效率服務的訓練模型。這些特別定製的 AI 加速器一直是以 Google AI 驅動的產品的核心,這些產品例如搜尋、YouTube、Gmail、Google 地圖、Google Play 和 Android 均在服務數十億使用者。它亦讓世界各地的公司能夠以具成本效益的方式大規模訓練 AI 模型。
今天,Google 亦宣佈推出迄今為止最強大、高效和具可擴充性的 TPU 系統 — Cloud TPU v5p,專為訓練尖端 AI 模型而設,同時能夠比以往更迅速地訓練大規模生成式 AI 模型,讓新產品和功能可以更早推出市場,惠及客戶。
以責任和安全為核心
在 Google,我們秉持大膽且負責任的態度發展 AI 技術。在 Google 的 AI 原則及我們所有產品穩健的安全政策基礎上,我們正加入新的保護措施來進一步支援 Gemini 的多模態功能。
Gemini 是現存所有 Google AI 模型中擁有最全面安全評估的模型,包括偏見和毒性檢測。我們對網絡攻擊、說服力和自主性等潛在風險領域進行了嶄新的研究,並應用 Google Research 中頂級的對抗性測試技術協助在部署 Gemini 前夕識別關鍵的安全問題。為了辨認出我們內部評估的盲點,我們將與不同的外部專家和夥伴合作,針對我們的模型進行全面的壓力測試。
Gemini 正式推出
Gemini 1.0 現已在一系列產品和平台上推出。從今天開始,Bard 將使用經特別調整的 Gemini Pro 版本,進行更高端的推理、規劃及理解等工作。這是自 Bard 推出以來最大規模的升級。它將首先在 170 多個國家和地區以英語提供服務,並計劃在不久的將來擴展到不同的模態及支援新的語言和地區。
在對外推出之前,我們已為 Gemini Pro 進行了多個行業基準測試。在八項測試中,Gemini Pro 有六項的表現都比 GPT 3.5 更出色,特別是大型 AI 模型的指標性業界基準測試 MMLU 和評估小學數學推理的 GSM8K 基準測試。值得一提,Google 專門對 Bard 使用的 Gemini Pro 進行了特別的調整,使其在理解和總結、推理、構思、寫作和規劃等領域更勝一籌。明年年初,我們將推出 Bard Advanced,屆時可以從 Gemini Ultra 率先開始使用我們最先進的模型及效能。
此外,我們還將 Gemini 技術引入 Pixel。Pixel 8 Pro 是第一款搭載 Gemini Nano 的智能手機,支援多個新功能,包括錄音機應用程式中的「摘要」,並在 Gboard 中新增智能回覆功能,此功能將率先應用於 WhatsApp,明年會陸續推出至更多通訊應用程式。在未來數月,Gemini 將應用於我們更多產品和服務中,例如搜尋、廣告、Chrome 和 Duet AI 等。
我們已經開始在搜尋引擎中試用 Gemini,為用戶提供更加迅速的搜尋生成體驗(SGE)。在美國的英文搜索中,時延(Latency)下降 40%,同時搜索質素亦明顯提升。
從 12 月 13 日起,開發人員和企業客戶可以透過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 使用 Gemini Pro。Android 開發人員還可以透過 Android 14 提供的新系統功能 AICore 使用為裝備內置任務而設的最高效模型 Gemini Nano 進行開發工作。
Gemini Ultra 即將推出
我們目前正為 Gemini Ultra 完成全面的可信性和安全檢查才正式推出市場。其間,我們會將讓部分客戶、開發人員、合作夥伴,以及安全和負責任發展人工智能的專家率先試用 Gemini Ultra 並提供意見回饋,明年初才開放予開發人員和企業客戶使用。
Gemini 時代:推動創新未來
這是人工智能發展的一個重要里程碑,也標誌著 Google 開啟新時代的開端,我們將繼續加快創新並以負責任的方式提升我們模型的能力。迄今為止,我們在 Gemini 上取得了重大進展,並正努力進一步擴展其未來版本的性能,包括提升規劃力和記憶力,以及增強處理更多資訊的上下文理解能力,以便提供更好的回應。
相關網誌: