《Disney +》迪士尼、Marvel、彼思、星球大戰… 日本恐怖遊戲工作室Chilla’s Art最新作《The Night Way Home | 帰り道》將於8月7日發售《Cuphead》的《The Delicious Last Course》DLC將於2022年6月30日登陸PS4 侍魂季票3開始更新！查姆查姆正式登場！Xbox Series XS版也開始同步販售！『仁王Collection』明天登陸PS5，體驗完整的『仁王』系列！ HoloStage全像投影座眾籌開始！能召喚你有的NFT和喜歡的角色爭奪寶座：加入我們最新的PlayStation社群活動，就有機會贏取PS5主機一台等各種獎項 hololive 官方網店hololive production OFFICIAL SHOP正式開業奧丁將重返《刺客教條：維京紀元》史詩級資料片《諸神黃昏的預兆》

提示詞還重要嗎？PROMPT ENGINEER還有價值嗎？來看最新研究！

商業星期五, 十一月 15, 2024

人工智能快速發展，提示詞（Prompt）已成為人類與AI模型溝通的關鍵橋樑，然而，不同用戶使用不同表達方式時，AI模型的表現往往會出現顯著差異。針對這一普遍現象，阿里雲聯合上海人工智能實驗室等機構推出了ProSA評估框架，首次系統性地研究了大語言模型對提示詞的依賴特性。一般任務而言，提示詞的重要性已經大大降低，不過在專業使用中，模型表現還是較受提示詞影響，可以說，提示詞的重要性，要看處理任務的類型。

提示詞：AI時代的必要之惡

提示詞作為人類意圖的載體，其重要性不言而喻。研究發現，即便是相同的需求，不同用戶的表達習慣差異可能導致AI模型產生迥異的回應。這種敏感度不僅影響用戶體驗，更為模型評估帶來了挑戰。

量化敏感度的突破

為了準確衡量這種敏感度，研究團隊開發了 PromptSensiScore（PSS）指標。這一創新指標通過計算模型在面對不同表達方式時的響應差異，首次將提示詞敏感度轉化為可量化的數據。測試結果顯示，不同模型和任務類型的敏感度存在顯著差異：

在簡單任務中，模型普遍表現較為穩定
複雜推理任務中，即便是先進模型也容易受提示詞影響
專業領域任務中，模型的表現與提示詞品質高度相關

規模效應與實例學習

研究揭示了兩個重要發現：

模型規模影響：
較大規模的模型通常展現出更強的抗干擾能力，這表明提升模型容量可能是減少提示詞敏感度的一個方向。
實例學習效果：
通過提供示例可以顯著降低模型對提示詞的敏感度，特別是從零樣本到單樣本的轉變最為明顯。這為實際應用提供了重要指導。

深層機制解析

更具啟發性的是，研究團隊發現模型的提示詞敏感度與其解碼置信度存在直接關聯：當模型對其輸出具有高度置信度時，往往能更好地適應不同的表達方式。這一發現為提升模型穩定性提供了新的思路。

提示詞敏感度問題的解決將是AI發展的重要里程碑。ProSA框架不僅幫助我們更好地理解這一現象，也為未來模型的改進指明了方向。研究者們相信，隨著技術的進步，AI模型將能更好地理解人類的多樣化表達，實現更自然、更穩定的人機交互。

參考文件：http://www.arxiv.org/abs/2410.12405

開版圖由AI生成。

Disney+