《Disney +》 迪士尼、Marvel、彼思、星球大戰…  【實測】搭載可自訂多功能觸控板,精巧尺寸華碩電競鍵盤「ROG Falchion」!   《Hades》於8月13日登陸PS4和PS5   《Fracked》將於本週五 8 月 20 日推出!   Nintendo TOKYO人氣角色公仔登場!日本各地快閃店同時販售!   《King of Fighters XV》宣佈推出公開測試   東京都內的遊戲酒店! 東京台場日航大酒店推出遊戲專用房!   「Nintendo Direct | E3 2021」確定將於日本時間 6 月 15 日凌晨 1 點起播出!   《Crash Bandicoot™ 4: It’s About Time》即將登上PS5 

Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結)

商業

Google 在人工智能上掌握了不少技術,而他們亦願意跟人分享。近日 Google 宣佈,將強化學習框架放在 GitHub 上開源提供,讓其他的開發者也可以使用這個技術並參與研發。

Google 開放訓練用強化學習框架:用於訓練 AI 模型

這次的強化學習框架是 Google 子公司核心部分 DeepMind 的深度 Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現“超人”性能。不過要使用強化學習框架來訓練相當花時間,而且穩定性不高。

Google 今次在 GitHub 開放的強化學習框架則是基於 TensorFlow 機器學習庫之上開發,讓開發者可以利用這個開源工具,令人工智能可以擁有更好的訓練方式。

Google Brain Team 的研究員 Pablo Samuel Castro 和 Marc G. Bellemare 在網誌中表示,這個工具的靈感來自大腦獎勵動機行為的主要組成部分,反映了神經科學與強化學習研究之間強大的連結。這次公開強化學習框架,是希望能協助研究,促進更大型的新發現。這強化學習框架的主要特點為彈性、穩定性以及可再現性,解決在開發過程中面對的主要問題。

他們和 Google Brain 團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。

為此,它包括一套包括15個Python文件的代碼、用視頻遊戲評估AI技術的平台,以及四種不同的機器學習模型。

除了增強框架的發布,谷歌還推出了一個網站,允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型,原始統計日誌和TensorFlow事件文件,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

Google 方面已經把這個強化學習框架投入到不同範疇的人工智能研究之中,據稱在使用過程中,他們發現可以更彈性去讓他們實現不同的想法。Google 希望未來在開源之後,可以看到開發者社群應用這個工具,為人工智能帶來更多的新發展。

有興趣的可以自己到 Github 參考原始碼。

資料來源:venturebeat

這篇文章 Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結) 最早出現於 TechApple.com

TechApple

隨機商業新聞

Disney Plus