每天各大社交媒體上都有無數條新的貼文,這些貼文除了有用戶分享日常生活點滴外,更有不少資訊性的帳號,如新聞媒體等。但由於人工智能發展迅速,網絡上開始充斥著不少以人工智能自動生成的假推文、假新聞。有見及此,哈佛大學、麻省理工大學的IBM研究所共同合作,創建一個以人工智能推動的檢測工具,專門用於檢測由人工智能自動生成的文本內容。
這個專門「打假」的人工智能檢測工具名為Giant Language Model Test Room(GLTR),主要功用在於檢測特定文本是否由人工智能自動生成。GLTR能夠區分人工智能自動生成的文章和人類創作的文章。根據研究人員分享的結果,在無需任何事先培圳的情況下,GLTR將假文本的檢測率從54%提高到72%。
該AI算法利用文本中的統計字分佈來識別差異。如果該文本是由自動生成器產生,那麼當中將會存在著很多可預測的單詞組。而且,雖然自動生成器所生成的句子在文法上會完全正確,但實際上沒有任何實際文本意義。所以,GLTR主要是以每30~60個字為一組地分批檢測段落中,有沒有相應的統計字。
檢測結果會以多種顏色標記文本內容。如,綠色就是可能由自動生成工具生成的文字、黃色及紅色則是不太可能由自動生成所產生,而紫色則是最不可能。業界普遍認為,GLTR不僅可以用於檢測假文本,還可以識別用於破壞美國和其他地方選舉過程的Twitter機器人。
除了GLTR之外,現時已有一個名為Botometer的工具,透過機器學習技制來確定社交帳戶是真實帳號,或者虛假的機器人帳戶。據聞Botometer的準確度高達95%。
雖然這些方法都不是萬無一失,但至少目前可以有效地打擊一部分的虛假資訊流通。
資料來源:The Next Web
這篇文章 人工智能「打假」系統面世 輕易檢測出假文章及假推文 最早出現於 TechApple.com。