Llama 4 系列：AI 多模態新篇章，上下文處理量大增

Meta 宣佈推出全新 Llama 4 系列，其中包括 Llama 4 Scout 和 Llama 4 Maverick，並預覽了一款極具潛力的超級模型 Llama 4 Behemoth。這一系列不僅代表了技術的突破，更是多模態人工智能領域的一次革命性進展。

Llama 4 系列的誕生標誌著多模態智能的全新篇章。它們以更高效、更強大的性能，將文字、圖像和視頻等多種模式融合於一體，同時保持著 Meta 一貫的開放性和創新性。Meta 表示，這些模型將支持開發者和企業創建更個性化、更智能的應用，滿足未來多樣化的需求。

模型	活躍參數	總參數	專家數量	上下文窗口	主要應用場景
Llama 4 Scout	170 億	1090 億	16	1000 萬	多文件總結、大規模代碼推理
Llama 4 Maverick	170 億	4000 億	128	256K	多模態應用、圖片理解
Llama 4 Behemoth	2880 億	近 2 兆	16	尚未公布	STEM 領域、高階推理

Llama 4 Scout 和 Maverick：多模態的雙子星

此次推出的 Llama 4 Scout 和 Llama 4 Maverick 是Llama 4 系列的兩顆明珠，它們分別適用於不同的應用場景，並在性能和效率上達到了新的高度。

Llama 4 Scout：上下文處理的王者

Llama 4 Scout 配備 170 億活躍參數 和 16 個專家，突破性地支持 1000萬上下文窗口，遠超業界平均水準。這一特性使其特別適合處理長文本、多文件總結、代碼推理等場景。

此外，Llama 4 Scout 在代碼推理、長文本處理和多模態應用程序中的表現，均超越了前代模型和其它競爭者。它的光環在於能夠以更小的參數規模，實現更強大的性能，為多模態應用提供了無限可能。

Llama 4 Maverick：多模態應用的全能選手

Llama 4 Maverick 同樣擁有 170 億活躍參數，但它的 128 個專家系統 使其在處理多模態輸入（如文本與圖片結合）時更為突出。無論是圖像理解、視覺推理，還是創意寫作，它都能為用戶帶來流暢的體驗。

Llama 4 Maverick 的另一大亮點是其優秀的性能與成本比。例如，在 LMArena 測試中，其ELO分數高達 1417，不僅超過了 GPT-4o 和 Gemini 2.0 Flash，還能與更大規模的 DeepSeek v3.1 模型相媲美。

Llama 4 Behemoth：下一代超級智能的預覽

Meta 也首次揭示了正在訓練中的 Llama 4 Behemoth，這是一款擁有 2880 億活躍參數 的巨型模型，並採用了多模態專家架構。這款模型的訓練數據規模達到了驚人的 30 兆億令牌，在 STEM（數學、科學、技術、工程）領域的表現尤為突出。

Meta 表示，Llama 4 Behemoth 的主要作用是作為教師模型，用於進一步提升 Scout 和 Maverick 的性能。儘管這款模型尚未正式發布，但它的潛力已經讓人充滿期待。

Llama 4 與競爭對手性能比較（部分測試結果）

測試項目	Llama 4 Scout	Llama 4 Maverick	GPT-4o	Gemini 2.0 Flash	DeepSeek v3.1
上下文窗口支持	10M	256K	128K	64K	512K
代碼推理性能	業內領先	超越 GPT-4o	良好	略次	與 Maverick 相當
多模態支持	文本+圖像	文本+圖像	僅文本	文本+有限圖像	文本+圖像
性能與成本比	極高	高	中	低	中

技術創新：重新定義多模態AI的核心

Llama 4 系列的成功背後，是一系列技術創新的支持：

1. 混合專家架構（MoE）

Llama 4 是首批採用 混合專家架構（Mixture of Experts, MoE） 的模型之一。這種架構使得每次推斷僅需要啟動部分參數，大幅降低了計算成本，同時提升了性能。例如，Llama 4 Maverick 的總參數規模達 4000 億，但其活躍參數僅為 170 億，在效率與性能之間找到了完美的平衡。