Anthropic Claude 3.5 新版本令 AI 模型可操作現電腦，新時代開始

Anthropic 公司發布最新Claude 3.5系列更新，不僅帶來性能全面提升的Sonnet版本和全新的Haiku型號，更首次實現了讓AI像人類一樣操作電腦的revolutionary功能。

這項突破性的「電腦使用」功能，讓Claude 3.5 Sonnet成為業界首個能夠自主操作電腦的前沿AI模型，不僅能觀看螢幕內容，更可以自主移動游標、點擊按鈕和輸入文字，徹底改變了AI與電腦互動的方式。儘管目前這項功能仍處於公測階段，但已經吸引了包括Asana、Canva和DoorDash在內的多家科技巨頭率先採用並展開實驗性應用。

在編程能力方面，升級後的Claude 3.5 Sonnet表現令人矚目。在權威的SWE-bench Verified編程測試中，其得分達到49%，不僅大幅超越前代產品的33.4%，更創下了所有公開可用模型中的最高分。GitLab在測試中發現，新版本在開發任務中的推理能力提升了高達10%，而且沒有增加任何延遲。

同時發布的Claude 3.5 Haiku則為用戶帶來了更高的性價比選擇。這款新型號在保持與前代相同價格和運行速度的同時，性能卻達到了上一代旗艦Opus型號的水平。特別是在編程測試中，它也取得了40.6%的優異成績，超越了包括GPT-4在內的多個競爭對手。

考慮到AI技術的潛在風險，Anthropic在安全部署方面做出了充分準備。公司不僅與美國和英國的AI安全研究所展開合作，進行了嚴格的部署前測試，還開發了專門的分類器來識別和防範可能的濫用行為。這體現了科技公司在推動創新的同時，對負責任發展的重視。

這次更新的意義遠超技術層面的進步。它預示着AI即將進入一個能夠真正理解和操作人類工具的新時代。雖然目前這些功能仍處於初期階段，還存在一些限制，但其展現出的潛力已經令人期待。隨着技術的持續進步，我們可能很快就能看到AI在更多領域發揮重要作用，為人類工作和生活方式帶來革命性的改變。

Anthropic強調，他們將持續收集開發者反饋並改進這些功能，確保技術發展既能推動創新，又能維持安全和負責任的使用標準。這種平衡發展的理念，或將為整個AI行業的未來發展提供重要借鑒。

參考來源：https://www.anthropic.com/news/3-5-models-and-computer-use?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=claude-learns-to-use-the-computer&_bhlid=09aab361775d6152614f751b005328db2303ae8d