123,123,123

美國國家工程院院士、福特技術研究員 Dimitar Filev ：用于智慧出行的智能車輛系統(tǒng)

2019-06-18 10:16

智車科技IV

關注

當前智能駕駛汽車算法和解決方案面臨的挑戰(zhàn)如下：

1、能學習特定駕駛員和環(huán)境、擁有最少的手工標定和標簽數(shù)據(jù)的車載或者云平臺的實時解決方案；

2、相比較監(jiān)督式學習更傾向于無監(jiān)督和半監(jiān)督強化學習；

3、包含認知信息和物理模型的混合AI算法；

4、AI算法可解釋、可驗證；

5、擁有魯邦特性并且可以自評估；

6、維護成本低。

下面介紹一些有效的解決方案，每當我們遇到一個復雜系統(tǒng)時，我們會努力學習用一些復雜函數(shù)去近似這個系統(tǒng)例如神經(jīng)網(wǎng)絡，這是其中一種方法。另一種方法使用許多簡單的小的子系統(tǒng)進行組合模擬復雜系統(tǒng)。

非監(jiān)督的演化聚類算法可以實現(xiàn)實時的學習對系統(tǒng)的狀態(tài)空間進行預測，一個重要的例子是對引擎特性具有自適應標定和控制能力的在線空時濾波器�；旌像R爾科夫模型對于目的地和路徑的預測也是非常有效的。神經(jīng)網(wǎng)絡的可解釋性是近年來的熱點話題，強化學習可以使用神經(jīng)網(wǎng)絡將狀態(tài)空間映射到行為空間，這是個非線性映射。這種非線性映射可不可以使用其他的映射來近似并且時刻解釋的呢？

基于強化學習的控制器將狀態(tài)空間映射到行為空間，而使用模糊控制器基于規(guī)則的模型則是一種通用的近似器，通過將強化學習Agent仿真為黑盒子動態(tài)系統(tǒng)，它可以被有限級的“if－then”規(guī)則近似和解釋。以強化學習車輛跟蹤控制為例，跟車問題基本是是一種自適應巡航問題，后車需要保持與前車的安全距離、控制好各自的車速以及加速度，傳統(tǒng)方法中車速控制器基于吉布斯分布、加速度控制器使用智能駕駛模型（Intelligent Driving Model，IDM）建模，福特使用強化學習，分別建立速度、加速度以及距離的獎勵函數(shù)，最大化獎勵函數(shù)得到的結果達到甚至超過傳統(tǒng)方法。

在得到加速度結果后，他們使用聚類算法以相對速度和相對距離作為輸入，預測加速度作為輸出，對數(shù)據(jù)進行聚類來近似強化學習控制器，強化學習器被近似為可解釋的PI控制器的非線性組合的形式，組合系數(shù)為各數(shù)據(jù)點到聚類中心距離負值的Softmax函數(shù)。

擬合效果基本達到原始強化學習其的性能，但是推理時間從強化學習器的0．3ms降低到了非線性組合的0．13ms。最后，對演化系統(tǒng)地總結如下：

1、使用演化聚類和核粒化的方法講一個復雜系統(tǒng)實時分解為多個相互重疊的子區(qū)域；

2、實時同步學習系統(tǒng)架構以及局部子系統(tǒng)的參數(shù)；

3、對具有多個操作模式和多元化行為的系統(tǒng)實時建模；

4、特定的機器學習技巧（無監(jiān)督聚類與監(jiān)督學習的組合）；

5、反映人類從現(xiàn)實中學習、總結、管理知識的能力。

我們在此提到的演化系統(tǒng)是多個子系統(tǒng)的組合，它的功能非常強大，包含了監(jiān)督學習方法和非監(jiān)督學習方法，可應用在實時的無人駕駛大數(shù)據(jù)處理中。大數(shù)據(jù)、物聯(lián)網(wǎng)以及AI技術的快速發(fā)展為智能汽車提供了更多的解決方案，AI算法則需要具備更多的人性化、自適應和最小標定以適應嵌入式實施的需求也很廣泛，智能汽車的發(fā)展為傳統(tǒng)AI算法的改進提供了新的發(fā)展方向，傳統(tǒng)AI算法應與基于規(guī)則的系統(tǒng)、認知知識和基于第一性原理的模型相結合，此外，認知模型對統(tǒng)計機器學習的近似使得傳統(tǒng)機器學習算法變得可解釋和性能的可升。

以上就是我的報告，非常感謝大家

<上一頁 1 2 3