蓋世汽車(chē)訊 據(jù)外媒報(bào)道,麻省理工學(xué)院(MIT)和斯坦福大學(xué)(Stanford University)的研究人員設(shè)計(jì)出新的機(jī)器學(xué)習(xí)方法,可用于在條件快速變化的動(dòng)態(tài)環(huán)境中更有效地控制機(jī)器人,例如無(wú)人機(jī)或自動(dòng)駕駛汽車(chē)。
圖片來(lái)源:arXiv
這項(xiàng)技術(shù)可以幫助自動(dòng)駕駛汽車(chē)學(xué)會(huì)補(bǔ)償濕滑的路況以避免打滑,允許機(jī)器人自由飛行器(free-flyer)在太空中牽引不同的物體,或者使無(wú)人機(jī)能夠在強(qiáng)風(fēng)的沖擊下緊緊跟隨下坡滑雪者。
研究人員的方法是將控制理論中的某些結(jié)構(gòu)融入到學(xué)習(xí)模型的過(guò)程中,從而產(chǎn)生一種控制復(fù)雜動(dòng)力學(xué)的有效方法,例如風(fēng)對(duì)飛行器軌跡的影響。思考這種結(jié)構(gòu)的方法之一是作為一種提示,可以幫助指導(dǎo)如何控制系統(tǒng)。
麻省理工學(xué)院機(jī)械工程系和數(shù)據(jù)、系統(tǒng)與社會(huì)研究所(IDSS)Esther和Harold E. Edgerton助理教授、信息與決策系統(tǒng)實(shí)驗(yàn)室(LIDS)成員Navid Azizan表示:“我們工作的重點(diǎn)是了解系統(tǒng)動(dòng)力學(xué)的內(nèi)在結(jié)構(gòu),從而設(shè)計(jì)出更有效、更穩(wěn)定的控制器。通過(guò)從數(shù)據(jù)中共同學(xué)習(xí)系統(tǒng)的動(dòng)力學(xué)和獨(dú)特的面向控制的結(jié)構(gòu),我們能夠自然地創(chuàng)建在現(xiàn)實(shí)世界中更有效地運(yùn)行的控制器?!?/p>
在學(xué)習(xí)模型中使用這種結(jié)構(gòu),研究人員的技術(shù)可以立即從模型中提取有效的控制器,這與其他需要通過(guò)額外步驟單獨(dú)導(dǎo)出或?qū)W習(xí)控制器的機(jī)器學(xué)習(xí)方法不同。通過(guò)這種結(jié)構(gòu),新研究方法還能夠使用更少的數(shù)據(jù)(與其它方法相比)來(lái)學(xué)習(xí)有效的控制器。因此新基于學(xué)習(xí)的控制系統(tǒng)可在快速變化的環(huán)境中更快地實(shí)現(xiàn)更好的性能。
主要作者、斯坦福大學(xué)研究生Spencer M. Richards表示:“這項(xiàng)工作試圖在識(shí)別系統(tǒng)結(jié)構(gòu)和從數(shù)據(jù)中學(xué)習(xí)模型之間取得平衡。受機(jī)器人學(xué)家利用物理學(xué)推導(dǎo)出更簡(jiǎn)單的機(jī)器人模型的啟發(fā),我們開(kāi)發(fā)出該新技術(shù)。對(duì)這些模型的物理分析通常會(huì)產(chǎn)生用于控制目的的有用結(jié)構(gòu),例如如果只是試圖將模型與數(shù)據(jù)擬合,則可能會(huì)錯(cuò)過(guò)這個(gè)結(jié)構(gòu)。相反,我們嘗試從數(shù)據(jù)中識(shí)別類(lèi)似有用的結(jié)構(gòu),以指示如何實(shí)現(xiàn)控制邏輯?!?/p>
來(lái)源:蓋世汽車(chē)
作者:劉麗婷
本文地址:http://www.healthsupplement-reviews.com/news/jishu/207257
以上內(nèi)容轉(zhuǎn)載自蓋世汽車(chē),目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.healthsupplement-reviews.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。