受新型冠狀病毒疫情影響「TOKYO GAME SHOW 2020」宣布取消 主辦商考慮舉辦在線活動   新年優惠!Nintendo Store一同迎接新年吧!   每年不缺席的「ACGHK 2020(香港動漫電玩節)」 官方發表今年延期舉辦   《KINGDOM HEARTS Melody of Memory》發售日確定!還有Nintendo Switch版才有的功能!   櫻花革命連續動畫 第一彈 黑衣的普拉娜 大帝國華撃團B.L.A.C.K.成員介紹   「可以馬上玩到Splatoon2的Pro控制器套裝」決定發售!   虛擬貨幣可以拿來買遊戲?PayPal開放交易加密貨幣!比特幣・以太幣・萊特幣通通都行!   Bandai宣布PC Engine mini因新型冠狀病毒肺炎影響延遲發貨 

Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結)

Google 在人工智能上掌握了不少技術,而他們亦願意跟人分享。近日 Google 宣佈,將強化學習框架放在 GitHub 上開源提供,讓其他的開發者也可以使用這個技術並參與研發。

Google 開放訓練用強化學習框架:用於訓練 AI 模型

這次的強化學習框架是 Google 子公司核心部分 DeepMind 的深度 Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現“超人”性能。不過要使用強化學習框架來訓練相當花時間,而且穩定性不高。

Google 今次在 GitHub 開放的強化學習框架則是基於 TensorFlow 機器學習庫之上開發,讓開發者可以利用這個開源工具,令人工智能可以擁有更好的訓練方式。

Google Brain Team 的研究員 Pablo Samuel Castro 和 Marc G. Bellemare 在網誌中表示,這個工具的靈感來自大腦獎勵動機行為的主要組成部分,反映了神經科學與強化學習研究之間強大的連結。這次公開強化學習框架,是希望能協助研究,促進更大型的新發現。這強化學習框架的主要特點為彈性、穩定性以及可再現性,解決在開發過程中面對的主要問題。

他們和 Google Brain 團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。

為此,它包括一套包括15個Python文件的代碼、用視頻遊戲評估AI技術的平台,以及四種不同的機器學習模型。

除了增強框架的發布,谷歌還推出了一個網站,允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型,原始統計日誌和TensorFlow事件文件,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

Google 方面已經把這個強化學習框架投入到不同範疇的人工智能研究之中,據稱在使用過程中,他們發現可以更彈性去讓他們實現不同的想法。Google 希望未來在開源之後,可以看到開發者社群應用這個工具,為人工智能帶來更多的新發展。

有興趣的可以自己到 Github 參考原始碼。

資料來源:venturebeat

這篇文章 Google 開放訓練用強化學習框架:用於訓練 AI 模型(附 GitHub 連結) 最早出現於 TechApple.com

相關文章