2021年音訊工程協會(AES)日前於秋季大會上公布十大傑出論文榜單;三星頂尖研發團隊發表的論文,一口氣搶占榜上半數席次,於高科技競技場展現領先群倫的優勢。AES總部位於美國紐約,為音訊技術和工程領域最負盛名的國際學術大會。
今年榮登AES「十大傑出」榜單中的五篇三星電子論文,分別來自三星研究院(SR)(註一)視覺技術團隊,及美國三星研發中心(SRA)的音響實驗室。
請繼續閱讀下文報導,深入了解三星電子發表的論文,如何以傲視業界的技術內涵,榮登今年的十強榜單。
①揚聲器中,延長低音以及降低失真的AI研究(美國三星研發中心)
今年秋季AES大會下載量最高的論文,為美國三星研發中心(SRA)發表的「揚聲器非線性控制中的AI技術應用」(Application of AI Techniques for Nonlinear Control of Loudspeakers),其內容展現團隊於延長低音、降低失真方面的研究成果。該篇論文指出,為獲得良好的低音擴展度、低失真高響度,及兼顧機械保護,需精確控制揚聲器的振膜。
美國三星研發中心(SRA)於論文中提出創新解決方案,研究發現利用神經網路將揚聲器的振膜位置移至電壓輸入處,使揚聲器得以「反轉」。儘管缺乏理論支持,此項技術仍能控制及線性化揚聲器,使其更易於執行。
②開發同步測量多個揚聲器的方法(美國三星研發中心)
美國三星研發中心(SRA)獲選「十大傑出」榜單的第二篇論文為「揚聲器同時激磁,引起之室內脈衝響應進行的反褶積處理」(Deconvolution of Room Impulse Responses From Simultaneous Excitation of Loudspeakers)。該研究提出一種方法,能同時測量室內的多個揚聲器,且測量時間較傳統的沉浸式音響系統快十倍。
傳統的房間中通常一次僅啟動一個揚聲器,並會對來自揚聲器產生室內響應的紀錄,進行反褶積處理。因此,隨著室內揚聲器數量及位置的增加,測量揚聲器室內響應所需的時間亦隨之提升。有鑑於此,美國三星研發中心(SRA)於論文中提出能在啟動所有揚聲器後,同時對脈衝響應進行反褶積處理的技術。
③優化音響系統與整合薄型電視(美國三星研發中心)
近年來,顯示技術日漸講求空間效益應用,進而帶動電視等消費性電子產品,朝輕薄短小的趨勢發展。為克服音訊技術開發設計所產生的物理限制,美國三星研發中心(SRA)提出了一篇以「薄型電視轉換器設計要點」(Transducer Design Considerations for Slim TV Applications)為題的論文,並榮登音訊工程協會(AES)「十大傑出」論文排行榜。
在此產業趨勢下,薄型電視對聲學轉換器的物理性能嚴重受限,音訊系統開發因此面臨諸多挑戰。多數情況下,現代的數位信號處理器(DSP)和功率放大器技術,已能利用轉換器達到極致效能,維持卓越音質;但若需進一步縮減電視厚度,上述技術已不敷使用。美國三星研發中心(SRA)於論文中探討當前設計的物理極限,並針對超薄裝置應用,提出新的動圈轉換器設計。
④探索HDR10+的最佳音訊編解碼器(美國三星研發中心)
隨著HDR10+的新紀元來臨,美國三星研發中心(SRA)付諸大量心力,潛心研究HDR10+的最佳音訊編解碼器,進而發表此篇獲獎論文-「立體聲、環繞聲、沉浸格式音訊編解碼器之位元率需求」(Bitrate Requirements for an Audio Codec for Stereo, Surround and Immersive Formats)。
論文指出,Opus編解碼器將是HDR10+音訊編解碼器的首選。團隊針對Opus編碼的立體聲及5.1和7.1.4 聲道內容進行三次試音,其內容取自音樂、電影和歐洲廣播聯盟(EBU)檔案,編碼速率為每聲道32、48和64 kbps。目前多媒體檔案格式Ogg針對Opus封裝結構並不支援立體聲的7.1.4。因此,本篇論文提出一種新的立體聲配對模式,適應於Opus中含有聯合立體聲編碼的7.1.4內容。研究結果顯示,立體聲的透明度需達每聲道64 kbps以上的位元率,然而對於5.1和7.1.4音訊格式而言,每聲道48 kbps即已足夠。
⑤開發基於AI技術的3D音訊編解碼器,實現高沉浸感的OTT服務環境(三星研究院)
根據市場趨勢分析,用戶對媒體消費平台的偏好,已從過去的電影院或廣播節目轉向OTT服務。三星研究院(SR)發表的論文-「基於自適應內容向下/上動態混音框架的AI 3D沉浸式音訊編解碼器」(AI 3D Immersive Audio Codec Based on Content-Adaptive Dynamic Down-Mixing and Up-Mixing Framework)指出,新型3D沉浸式音訊編解碼器,能針對OTT服務環境配置多個揚聲器,支援各種空間的音效格式。
傳統技術不分內容類型和特性,一律採用固定的混音配置。三星研究院(SR)提出全新框架,透過AI技術動態執行音訊場景分類,並分析空間能量分佈特徵,進而視情況採用混音或不混音配置檔。試音結果顯示,即使處於居家娛樂的OTT服務環境,三星研究院(SR)提出的框架亦能提供優於傳統的沉浸感。
註一:三星電子的前瞻研發中樞,主導DX事業群的未來技術開發。