《Disney +》 迪士尼、Marvel、彼思、星球大戰…  Neo Geo Pokect名作「SNK對卡普空 千年之戰」於Nintendo Switch開放下載!   如何在《Disco Elysium》成為巨星偵探?——最終剪輯版於3月30日登陸 PS5   今年冬天在《OlliOlli World》的個人冒險中翻板、輾磨,大玩各種招式!   《決勝時刻:先鋒》將於11月5日上市   DualSense無線控制器為即將上市的遊戲帶來嶄新體驗   《Stranger Of Paradise Final Fantasy Origin》試玩版預覽——正統派動作,遊戲世界觀令人不禁想起原作!   歡慶PlayStation VR推出5週年   睽違19年的系列全新作品將在TETRIS王者盃登場!「密特羅德 生存恐懼合作祭!」舉辦確定 

Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結)

商業

Google 在人工智能上掌握了不少技術,而他們亦願意跟人分享。近日 Google 宣佈,將強化學習框架放在 GitHub 上開源提供,讓其他的開發者也可以使用這個技術並參與研發。

Google 開放訓練用強化學習框架:用於訓練 AI 模型

這次的強化學習框架是 Google 子公司核心部分 DeepMind 的深度 Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現“超人”性能。不過要使用強化學習框架來訓練相當花時間,而且穩定性不高。

Google 今次在 GitHub 開放的強化學習框架則是基於 TensorFlow 機器學習庫之上開發,讓開發者可以利用這個開源工具,令人工智能可以擁有更好的訓練方式。

Google Brain Team 的研究員 Pablo Samuel Castro 和 Marc G. Bellemare 在網誌中表示,這個工具的靈感來自大腦獎勵動機行為的主要組成部分,反映了神經科學與強化學習研究之間強大的連結。這次公開強化學習框架,是希望能協助研究,促進更大型的新發現。這強化學習框架的主要特點為彈性、穩定性以及可再現性,解決在開發過程中面對的主要問題。

他們和 Google Brain 團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。

為此,它包括一套包括15個Python文件的代碼、用視頻遊戲評估AI技術的平台,以及四種不同的機器學習模型。

除了增強框架的發布,谷歌還推出了一個網站,允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型,原始統計日誌和TensorFlow事件文件,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

Google 方面已經把這個強化學習框架投入到不同範疇的人工智能研究之中,據稱在使用過程中,他們發現可以更彈性去讓他們實現不同的想法。Google 希望未來在開源之後,可以看到開發者社群應用這個工具,為人工智能帶來更多的新發展。

有興趣的可以自己到 Github 參考原始碼。

資料來源:venturebeat

這篇文章 Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結) 最早出現於 TechApple.com

TechApple

隨機商業新聞

Disney+