三星正如火如荼開拓旗艦行動AI體驗。三星新聞中心專訪世界各地的三星研究院,深入了解Galaxy AI如何協助用戶發揮極致潛能。Galaxy AI目前支援16種語言,憑藉通話即時翻譯、語音翻譯、筆記智慧助理和瀏覽助理等終端內建翻譯功能,使更多用戶即使在離線狀態也能拓展語言能力。然而AI語言究竟如何開發而成?稍早我們前往巴西,探索團隊如何在跨文化與跨國界的條件下投入工作,並將Galaxy AI帶進更多人的生活。此站我們來到了印度,發現與當地合作夥伴齊力實踐的價值。
位於印度清奈的韋洛爾理工學院(Vellore Institute of Technology),有一間擺滿未來感音訊設備的實驗室藏身其中。實驗室中可看見業界術語中稱之為「頭頸部模擬器」的人體模型,以及立體音麥克風與聽力裝置。這些器材被擺放在經特別處理、裝有先進吸音機制的隔音室內,這也是印度首座此類型的實驗室。試想一下,這些器材將用於開發最新的高傳真度(Hi-Fi)音效設備。
這便是韋洛爾理工學院與三星聯手產出與開發資料數據及分析洞察的據點,該研究成果用於助力最新AI模型強化Galaxy AI語言功能。此設施隸屬三星SEED(工程數據學生生態系統)旗下實驗室,該計畫自2021年開始,讓印度的大學教職員、學生和實習生可實際參與由三星發起的專案。此為三星資助的眾多大學計畫之一,旨在提供學生機會與三星技術專家合作並投入不同專案的執行。
三星SEED學生Yashika Ilanchezhiyan表示:「身為學生,我很開心能夠與三星這樣知名且備受敬重的公司合作參與不同專案。這個過程不僅幫助我建立以實用方法學習新技能的自信,也讓我感覺自己能在當下和未來的產品開發中發揮真正的影響力。」
印度邦加羅爾三星研發中心(SRI-B)語言AI技術部門負責人Giridhar Jakki表示:「這樣的合作案造就雙贏局面。藉由與大學合作,我們能獲得更多專業知識與自訂的資料集。而大學方也因此獲得投資挹注、財務激勵以及三星專家的指導。」
減少語言隔閡
印度邦加羅爾三星研發中心(SRI-B)與全球各地的團隊合作,開發適用於英國英語、印度英語和澳洲英語以及泰語、越南語和印尼語的AI語言模型。近期,則有來自其他三星研究中心的核心團隊工程師到訪邦加羅爾,借助SRI-B團隊的力量提升技術,將越南語、泰語和印尼語導入Galaxy AI。這也為SRI-B開發適用於Galaxy AI的印度語模型提供助力。
Jakki說道:「每種語言開發都極具挑戰性。但一想到最終目標是讓人們具備以其他語言交流的能力,便會覺得這一切的努力都是值得的。我們非常期待能將印度語導入Galaxy AI。」
開發印度語AI模型並非易事。團隊必須確保模型能涵蓋超過20種區域方言、語調變化、標點符號和俚語。此外,印度語使用者常常在對話中混用英語單詞。因此團隊必須利用翻譯和音譯資料的組合進行多輪AI模型訓練。
Hindi解釋:「印度語擁有複雜的語音結構,包括如將舌頭捲回口腔後方時發出的捲舌音,這在許多其他語言中是不存在的。為了構建AI解決方案的語音合成元素,我們與母語語言學家合力仔細檢視資料,先掌握所有獨特的發音後,再建立一套特殊的音位(phenomes),讓模型得以支援該語言的特定方言。」
在三星與學術合作夥伴的共同努力下,成功開發出能夠反映印度各地區細微文化差異的AI語言模型。韋洛爾理工學院協助收集到近百萬行關於會話語音、詞彙和指令的分段音訊與整理過的音檔資料。對於將世界第四大語言導入Galaxy AI這項關鍵任務而言,資料絕對是舉足輕重的元素。藉由與大學機構的合作,三星得以應用最高品質的資料。
全球串連壯大影響力
此計畫完美詮釋三星所秉持的開放合作理念,同時彰顯出三星深信透過分享專業知識與觀點,能夠造就深具意義的創新。就SRI-B案例而言,不僅涵蓋學術界間的協力合作,更包括與全球其他三星研究中心分享專業洞察和最佳實務心得。
Jakki表示:「我對於攜手合作夥伴共同取得的成就感到非常自豪。聯合雙方之力實現AI創新,是我們的重要任務。未來也將繼續更深入理解、收集並分析語言資料,期望能夠讓更多人有效運用AI工具。」