未來機器人:一起工作 互相學習
通過“強化學習”,讓每個智能體適應周圍環(huán)境和群體協(xié)作。未來的分布式機器人可以互相學習,一起工作,共同完成復雜任務。圖片來自網絡
分布式智能體(Agent)具有自主性、交互性、反應性和主動性
據美國《連線》雜志網站近日報道,目前大部分人工智能研究都集中在個體智能體(Agent,指能自主活動的軟件或者硬件實體)上,人工智能系統(tǒng)也一直是作為個體運作,但這些個體智能體不能組合成一個團隊來學習、工作,也不能相互協(xié)作完成相應的任務。麻省理工學院航空航天教授喬納森·豪認為,這種工作模式喪失了一個巨大的機會,未來機器人應該一起工作,互相學習。
在分布計算領域,人們通常把在分布式系統(tǒng)中持續(xù)自主發(fā)揮作用并具有自主性、交互性、反應性和主動性的計算實體稱為Agent。例如一輛單獨行駛在街道上的汽車,一種能根據周圍環(huán)境變化而不斷調整的恒溫器。
豪領導的研究團隊一直致力于研究改變“移動和人工智能設備相互協(xié)作和學習的方式”,希望通過人工智能的核心能力——機器學習,幫助智能對象,使彼此更智能。
豪認為,未來機器人可以互相學習,共同工作,從而改變物流(機器人完成訂單并送貨上門)和太空探索(機器人合作探索新領域)等行業(yè)。而真正的挑戰(zhàn)是為這些人工智能機器人在實驗室之外的真實世界做好準備,這才是人工智能應該涉獵的領域。
機器人個體結成團隊工作
現實世界遠比人工智能機器人開發(fā)實驗室環(huán)境復雜。在團隊工作中,人類會思考,其他人在做什么?如何共同完成任務?這個任務會發(fā)生怎樣的變化?等等。而這些問題,都將是機器人以團隊形式工作時所需要“考慮”的。
為了讓機器人以群體形式工作,豪帶領的團隊讓智能體在周邊環(huán)境中反復試驗,像人類一樣學習。團隊利用他們自己開發(fā)的新算法,以及機器人行業(yè)的經驗,對其進行了優(yōu)化,使用了一種名為強化學習的機器學習技術,讓它們適應周邊環(huán)境。
團隊甚至更進一步研究了“多智能體”參與時發(fā)生了什么!岸嘀悄荏w”強化學習這門新興學科存在許多難題,包括:如何讓獨立的智能體在其他方面建立共識并達成一致?如何確保它們之間不斷的交談不會淹沒整個網絡?當一個有人工智能功能的機器人認為自己知道正確的做事方式,但它卻錯了時又會發(fā)生什么?
豪說:“如果我們對什么時候去吃晚飯都有不同的看法,你需要多少溝通才能達成一致?這看起來相對簡單的問題,但在機器人系統(tǒng)中,我們要處理的問題非常多,通常這些問題都有很多不確定性。”
只有出現了可行的深度學習平臺,才有可能真正回答這些問題。豪和他的團隊使用由亞馬遜的EC2 GPU實例支持的AWS深度學習AMI環(huán)境,這些實例不需要管理機架和服務器,就可以在云上執(zhí)行非常復雜的計算。他們的最終目標是訓練和運行強化學習模型的速度和準確性,以保證機器人足以應對現實世界中行為的影響。比如,當機器人意見不一致時,它們之間不斷的嘮叨不會淹沒整個網絡。
復雜計算需要云平臺
在智能機器人共同學習的理想生態(tài)系統(tǒng)中,整體大于部分之和,這需要重大的技術努力才能實現。
在亞馬遜云服務(AWS)、波音和IBM聯(lián)合資助下,豪的團隊已經進行了一段時間的深入研究,通過足夠的計算能力運行復雜的強化學習算法,使一群機器人保持不斷的通信,并在聯(lián)機中調整它們的行為。新的強化學習系統(tǒng)被稱為分層多智能體教學,通過優(yōu)化獎勵功能和更有效的溝通,成功地提高了機器人在團隊范圍內的學習和協(xié)作整合解決問題的能力。利用基于云的服務,團隊中的每個成員都可以根據自己的需要,訪問盡可能多的計算能力。
“在這種基于模擬的訓練中,我們要測試數百種設置,速度是至關重要的!焙澜淌诘拇T士研究生金東基(音譯)說,“機器學習直接轉化為我們在更短的時間內運行更多迭代的能力。AWS提供了強大的GPU實例,大大縮短了訓練時間,加快了我們的研究步伐!
豪認為,這項研究商業(yè)化需要5—10年的時間,但這可能是未來人工智能應用的一個基本推動者。他表示,合作、有彈性機器人的用途幾乎是無限的。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網產業(yè)大會
-
10 大模型的盡頭是開源
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 華為公布昇騰芯片三年計劃,自研HBM曝光
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 7 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 8 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 9 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 10 華為已殺入!AI領域最熱黃金賽道,大廠的數字人美女讓我一夜沒睡著覺