Anthropic 推出 Claude 4 系列Claude Opus 4 與 Claude Sonnet 4。這兩款新模型不僅於程式編碼、進階推理、AI 代理等領域樹立新標準,更直接挑戰當前 AI 行業的頂尖競爭格局。Opus 4 被譽為全球最佳 AI 編碼模型,Sonnet 4 則在指令精度、推理能力與效率上全面升級,為開發者與企業帶來生產力提升。
香港方面,有在POE平台上已經上線,現在已經可用。



Claude Opus 4:最強編碼與長時任務領袖
- 世界頂尖編碼模型:Opus 4 在 SWE-bench(72.5%)、Terminal-bench(43.2%)等權威基準測試中取得最高分,展現無與倫比的程式設計與錯誤修正能力。
- 長時任務穩定運作:可持續數小時專注於複雜任務,遠超前代與同類產品,適合企業級自動化、跨多檔案重構等場景。
- 行業驗證:Cursor、Replit、Block、Rakuten、Cognition 等企業均證實 Opus 4 能處理過去 AI 難以解決的多步驟、關鍵性任務,並在實際專案中展現出色穩定性與精度。
Claude Sonnet 4:效能與實用性兼備的即時 AI
- 效能大幅提升:比 Sonnet 3.7 在 SWE-bench 再上層樓(72.7% 分數),於編碼、推理及多模態整合能力全面進步。
- 高可控性與高效率:新模型在指令跟隨、複雜實作與導航等細節上更可調、更精準,同時保持即時反應速度,適合日常與企業級應用。
- 生態整合:GitHub、Augment Code、Sourcegraph 等平台已將 Sonnet 4 作為新一代主要 AI 編碼模型,提升多特徵自動開發與代碼品質。
全新功能與平台整合
延展思考與工具並行運用(Beta)
- 工具混合推理:Opus 4 與 Sonnet 4 均可於「延展思考」時結合網頁搜尋、程式碼執行等工具,並行運用以增強答案品質。
- 本地記憶強化:當開發者授權存取本地檔案時,模型能自動擷取、儲存關鍵資訊,形成長期上下文記憶,提升專案連續性與深度學習能力。
Claude Code 正式上線
- VS Code、JetBrains 原生整合:直接於主流 IDE 顯示建議與修正,支援 GitHub Actions 背景自動處理,開發者體驗全面升級。
- SDK 與 GitHub 測試:開放自建代理應用,支援 Pull Request 自動分析、回應與修正,開發流程更高效。
Anthropic API 四大新功能
- 程式碼執行工具、MCP 連接器、Files API、Prompt 快取等能力大幅擴展,助力開發者打造更強大的 AI 代理與自動化流程。
性能與安全:高標準新基準
- 混合模式:支援近即時回應與延展思考,靈活應對實時互動及長時專案。
- 安全性升級(ASL-3):針對捷徑與漏洞行為,模型觸發率比 Sonnet 3.7 低 65%,全面導入高等級 AI 安全措施。
- 思考摘要:長流程推理可自動產生摘要,僅約 5% 情境需啟用,資深用戶可透過開發者模式獲取完整思考鏈。
收費與方案
- Opus 4:每百萬輸入詞元 $15、美百萬輸出詞元 $75。
- Sonnet 4:每百萬輸入詞元 $3、每百萬輸出詞元 $15。
- 平台支援:Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 均已同步上線。Sonnet 4 對免費用戶亦有開放。
實證與業界肯定
- SWE-bench Verified、Terminal-bench 等多項國際評測穩居榜首。
- 行業龍頭企業高度評價其於代碼品質、問題解決能力、AI 代理協作與記憶能力上的領先地位。