《Disney +》 迪士尼、Marvel、彼思、星球大戰…  《Sherlock Holmes第一章》於11月16日在PS5展開偵探調查   我要成為「PAC-ONE」!多人混戰小精靈「PAC-MAN 99」正式發布!   《寶可夢大集結》首屆官方線上大賽將於9月19日登場!   「Nintendo Switch Online + 擴充包」詳情發表!   日本國內第二間任天堂官方商店「Nintendo OSAKA」決定開幕!   光榮再次和薩州濱田屋傳兵衛合作!正統芋燒酒「薩州 三國志 ~絕影~」發售!   《Deathloop》最新「似曾相識」預告片:新潮演繹,一窺寇特在黑礁島上的冒險旅程   『超級炸彈人R線上遊戲』5月27日開放下載!「老蛇炸彈人」將在商店中登場! 

Stability AI 推出 Stable Audio Open:1 段文字,生成短音效

商業

Stability AI 近日宣布推出全新開源模型 Stable Audio Open,這是一個專為生成短音頻樣本、音效和製作元素而優化的文本轉音頻模型。這一發布是開放生成音頻里程碑,只要使用文字就可以生成不同音頻。

什麼是 Stable Audio Open?

Stable Audio Open 讓任何人都可以從簡單的文本提示生成長達 47 秒的高質量音頻數據。其專門的訓練使其特別適合創建鼓點、樂器片段、環境聲音、擬音錄音和其他用於音樂製作和音效設計的音頻樣本。

主要特點

  • 高質量音頻生成:可生成長達 47 秒的音頻樣本。
  • 多樣化應用:適用於鼓點、樂器片段、環境聲音和製作元素。
  • 開放源碼:用戶可以基於自己的音頻數據微調模型,例如鼓手可以用自己的鼓聲樣本生成新的鼓點。
Stability AI 推出 Stable Audio Open

與 Stable Audio 的區別

Stable Audio 是商業產品,能夠生成高質量、結構連貫的完整音樂曲目,長度可達三分鐘,並具備音頻轉音頻生成功能及多段音樂合成能力。而 Stable Audio Open 則專注於音頻樣本、音效和製作元素。儘管它也能生成短音樂片段,但並不適用於完整的歌曲、旋律或人聲。這一開源模型提供了一個對聲音設計生成AI的初步探索,同時強調與創意社群共同推進負責任的開發。

訓練數據

新模型基於 FreeSound 和 Free Music Archive 的音頻數據進行訓練,號稱尊重創作者權利的同時創建開放音頻模型。

如何開始使用 Stable Audio Open

Stable Audio Open 模型權重已在 Hugging Face 平台上提供,有興趣的朋友可以嘗試一下。

TechApple

隨機商業新聞

Gearbest