Google 開放訓練用強化學習框架：用於訓練 AI 模型（附 GitHub 連結）

星期四, 八月 30, 2018

Google 在人工智能上掌握了不少技術，而他們亦願意跟人分享。近日 Google 宣佈，將強化學習框架放在 GitHub 上開源提供，讓其他的開發者也可以使用這個技術並參與研發。

Google 開放訓練用強化學習框架：用於訓練 AI 模型

這次的強化學習框架是 Google 子公司核心部分 DeepMind 的深度 Q-network（DQN），可以在多個工作人員中分配學習，例如，在Atari 2600遊戲中實現“超人”性能。不過要使用強化學習框架來訓練相當花時間，而且穩定性不高。

Google 今次在 GitHub 開放的強化學習框架則是基於 TensorFlow 機器學習庫之上開發，讓開發者可以利用這個開源工具，令人工智能可以擁有更好的訓練方式。

Google Brain Team 的研究員 Pablo Samuel Castro 和 Marc G. Bellemare 在網誌中表示，這個工具的靈感來自大腦獎勵動機行為的主要組成部分，反映了神經科學與強化學習研究之間強大的連結。這次公開強化學習框架，是希望能協助研究，促進更大型的新發現。這強化學習框架的主要特點為彈性、穩定性以及可再現性，解決在開發過程中面對的主要問題。

他們和 Google Brain 團隊開發了強化框架，其中考慮了三個原則：靈活性，穩定性和可重複性。

為此，它包括一套包括15個Python文件的代碼、用視頻遊戲評估AI技術的平台，以及四種不同的機器學習模型。

除了增強框架的發布，谷歌還推出了一個網站，允許開發人員快速可視化多個代理的培訓運行。它還提供經過訓練的模型，原始統計日誌和TensorFlow事件文件，用於TensorBoard繪圖，TensorBoard是Mountain View公司的TensorFlow程序可視化工具套件。

Google 方面已經把這個強化學習框架投入到不同範疇的人工智能研究之中，據稱在使用過程中，他們發現可以更彈性去讓他們實現不同的想法。Google 希望未來在開源之後，可以看到開發者社群應用這個工具，為人工智能帶來更多的新發展。

有興趣的可以自己到 Github 參考原始碼。

資料來源：venturebeat

這篇文章 Google 開放訓練用強化學習框架：用於訓練 AI 模型（附 GitHub 連結）最早出現於 TechApple.com。

Google 開放訓練用強化學習框架：用於訓練 AI 模型

相關文章