Anthropic最近推提了一項名為「情境檢索」(Contextual Retrieval)的新技術,能顯著提升AI模型的知識檢索能力。這項技術有望為客戶服務、法律分析等需要豐富背景知識的AI應用帶來突破進展。
解決傳統檢索方法的局限性
傳統的檢索增強生成(RAG)方法在將大量知識編碼時往往會丟失上下文信息,導致系統無法準確檢索到相關知識。Anthropic的「情境檢索」技術通過兩項子技術解決了這一問題:情境嵌入和情境BM25。實驗結果顯示,這種新方法可將檢索失敗率降低49%,若結合重新排序技術,更可降低67%。這意味着AI系統能更準確地找到並使用相關知識,從而顯著提升下游任務的表現。
技術原理與實現方式
「情境檢索」的核心是在將知識庫分割成小塊並進行編碼前,先為每個知識塊添加簡潔的上下文說明。例如,對於一段關於公司季度收入的文本,系統會加上公司名稱、時間等關鍵信息。Anthropic利用其AI模型Claude自動生成這些上下文說明,使得整個過程高效且低成本,結合該公司的提示快取功能,處理百萬字級別的文檔僅需約1美元。
多方面性能提升
Anthropic在多個知識領域進行了廣泛實驗,結果顯示:
- 情境嵌入可將前20個檢索結果的失敗率降低35%。
- 結合情境嵌入和情境BM25可將失敗率降低49%。
- 進一步加入重新排序步驟,失敗率可降低67%。
這些改進在各種嵌入模型和知識領域中均有體現,表明該技術具有廣泛適用性。
實施建議與注意事項
Anthropic建議開發者在實施「情境檢索」時注意以下幾點:
- 合理選擇知識塊大小和邊界。
- 選擇合適的嵌入模型,如Gemini或Voyage。
- 根據具體領域定制上下文生成提示。
- 優化檢索的知識塊數量。
- 進行充分的效果評估。
結語
Anthropic的「情境檢索」技術為AI知識檢索帶來了重要突破。通過結合多種先進方法,這一技術可大幅提升檢索準確率,為需要豐富背景知識的AI應用開闢新的可能性。隨着該技術的進一步發展和應用,我們有望看到更多智能、高效的AI解決方案在各行各業中湧現。