DeepMind:強化學習能達到通用人工智慧水準
作者 Unwire Pro | 發布日期 2021 年 06 月 16 日 7:45 |
比起限定功能的人工智慧系統,「通用人工智慧」是不少研究的目標,這樣的系統可以更有彈性自動對應不同的應用範疇,就如真人。DeepMind 最近宣稱,就算只是用強化學習方式訓練,也可以達此水準。
DeepMind 最近於《Artificial Intelligence》期刊發表的論文表示,人工智慧系統的能力並不是透過制定和解決複雜問題而產生,而是透過「獎勵最大化」的單一原則可達成。他們認為,獎勵最大化和試行錯誤的經驗,可培養出智力相關能力,其中一個實際應用的方式就是強化學習,他們相信最終可達通用人工智慧水準。
他們提出,利用這原則可更有效建立 AI 系統,他們假設「最大化獎勵的一般目標足以驅動表現出自然和人工智慧研究的大部分(如果不是全部)能力的行為」,模仿大自然智慧進化的適者生存機制,迫使系統在單一目標下發展出不同的相關能力。不過這套理論仍有需解決的地方,例如對學習代理的樣本效率應該如何判斷,始終強化學習需要大量數據訓練,而現有數據下可能要幾個世紀的訓練時間才能發展出通用人工智慧。
資料來源:https://technews.tw/2021/06/16/deepmind-says-reinforcement-learning-is-enough-to-reach-general-ai/
「reinforcement learning應用」的推薦目錄:
- 關於reinforcement learning應用 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
- 關於reinforcement learning應用 在 軟體開發學習資訊分享 Facebook 的最讚貼文
- 關於reinforcement learning應用 在 軟體開發學習資訊分享 Facebook 的精選貼文
- 關於reinforcement learning應用 在 台大人工智慧應用社NTUAI - Facebook 的評價
- 關於reinforcement learning應用 在 Reinforcement Learning 健身房:OpenAI Gym - MyCoon 的評價
reinforcement learning應用 在 軟體開發學習資訊分享 Facebook 的最讚貼文
NT 590 特價中
在本課程中將學習並實現一種新的令人難以置信的聰明的人工智慧模型,稱為雙延遲 DDPG( Twin-Delayed DDPG ),它結合了人工智慧領域的最新技術,包括連續雙深度 Q 學習( Double Deep Q-Learning )、政策梯度( Policy Gradient )和 Actor Critic。 這個模型是如此強大,以至於在我們的課程中,我們第一次能夠解決最具挑戰性的虛擬人工智慧應用程式(訓練一隻螞蟻 / 蜘蛛和一個半人形機器人在田野中行走和奔跑)。
https://softnshare.com/deep-reinforcement-learning/
reinforcement learning應用 在 軟體開發學習資訊分享 Facebook 的精選貼文
深度強化學習實際上是兩個主題的結合: 強化學習和深度學習(神經網路)。
雖然這兩者都存在了相當長的一段時間,但是直到最近深度學習才真正開始起步,隨之而來的還有強化學習( Reinforcement Learning )。
https://softnshare.com/cutting-edge-artificial-intelligence/
reinforcement learning應用 在 Reinforcement Learning 健身房:OpenAI Gym - MyCoon 的推薦與評價
Gym 是OpenAI 所開源的Reinforcement Learning 工具包。 ... 雖說目前Reinforcement Learning 打造出許多超越人類的遊戲AI,但在其他領域的應用, ... ... <看更多>
reinforcement learning應用 在 台大人工智慧應用社NTUAI - Facebook 的推薦與評價
Rethinking the Importance of Implementation Tricks in Multi-Agent Reinforcement Learning - hijkzzz/pymarl2. Seth Harding, profile picture ... ... <看更多>