世俱杯规则-虎牙直播-比利亚vs西班牙人-德国杯|www.cnyhmy.com

基于PSO-BP優(yōu)化MPC的無人駕駛汽車路徑跟蹤控制研究*

時間:2024-11-16 15:30:02 來源:網(wǎng)友投稿

史培龍 常宏,2 王彩瑞 馬強 周猛

(1.長安大學(xué),西安 710064;
2.比亞迪汽車有限公司,西安 710119)

主題詞:無人駕駛 路徑跟蹤控制 模型預(yù)測控制 粒子群尋優(yōu) BP神經(jīng)網(wǎng)絡(luò)

無人駕駛汽車的關(guān)鍵技術(shù)包括環(huán)境感知、決策、運動規(guī)劃和跟蹤控制等。其中路徑跟蹤的目標(biāo)是在保證行駛穩(wěn)定性的前提下,使被控車輛沿著期望的路徑行駛。目前常用的路徑跟蹤控制方法有斯坦利(Stanley)前輪反饋控制[1]、比例積分微分(Proportional Integral Derivative,PID)控制[2]、滑模控制[3]、線性二次最優(yōu)(Linear Quadratic Regulator,LQR)控制[4]以及模型預(yù)測控制(Model Predictive Control,MPC)[5]等算法,MPC以車輛動力學(xué)模型作為預(yù)測模型,加入約束條件,能夠顯著提高控制精度。

Falcone 等[6]基于線性車輛模型建立了MPC 路徑跟蹤控制器,并對輪胎側(cè)偏角進(jìn)行約束,提高了車輛在低附著路面上的跟蹤精度及穩(wěn)定性;
龔建偉等[7]利用MPC 算法進(jìn)行路徑跟蹤,通過離散變步長,提高車輛高速行駛時的跟蹤實時性,同時考慮了車輛操縱穩(wěn)定性問題;
張睿等[8]采用基于非線性預(yù)測及沿軌跡線性化的MPC 算法,提高了路徑跟蹤的實時性以及車輛在低附著系數(shù)路面條件下的跟蹤精度。然而,上述研究并未考慮跟蹤控制器時域參數(shù)對控制效果的影響。劉溯奇等[9]針對不同車速下恒定預(yù)測時域跟蹤誤差大的問題,設(shè)計了適用于變車速、變預(yù)測時域的MPC 控制器,以此提高控制精度;
白國星等[10]設(shè)計了可變預(yù)測時域的MPC 路徑跟蹤控制器,利用三次多項式擬合最佳預(yù)測時域與速度的關(guān)系,在不同車速下使用不同的預(yù)測時域參數(shù),提高了控制器對速度的自適應(yīng)性。但是,上述研究忽略了不同路面附著系數(shù)與時域參數(shù)的關(guān)系。吳施鵬等[11]基于MPC 算法,利用遺傳算法獲得最優(yōu)時域參數(shù),提高了車輛在低附著路面條件和高速行駛時的行駛穩(wěn)定性;
范賢波等[12]采用模糊控制法對MPC 控制器的預(yù)測時域及控制時域進(jìn)行在線優(yōu)化,根據(jù)車輛的橫向及縱向車速自適應(yīng)選擇預(yù)測時域參數(shù),優(yōu)化后的MPC 控制器提高了車輛路徑跟蹤的穩(wěn)定性及跟蹤精度。但對時域參數(shù)進(jìn)行在線優(yōu)化會增加MPC 的計算量,影響控制器的實時性。

綜合考慮時域參數(shù)、路面附著條件及控制時效性對控制效果的影響,本文利用粒子群尋優(yōu)-反向傳播(Particle Swarm Optimization-Back Propagation,PSO-BP)離線優(yōu)化MPC 控制器的預(yù)測時域和控制時域參數(shù),通過在不同路面附著系數(shù)及車速條件下自適應(yīng)選擇最優(yōu)時域參數(shù),保證控制器具有較好的效果。

汽車是高度非線性的復(fù)雜系統(tǒng),車輛模型越復(fù)雜,其仿真結(jié)果越接近真實運動規(guī)律,但當(dāng)系統(tǒng)模型復(fù)雜時,計算量增加,會降低控制器的時效性,影響跟蹤效果,甚至引發(fā)危險。為此,本文對車輛模型進(jìn)行簡化,建立了三自由度車輛動力學(xué)模型[13],如圖1 所示。建模過程考慮了轉(zhuǎn)向輪輪胎的側(cè)偏特性,忽略了垂向運動、空氣動力學(xué)特性、橫向載荷及前、后軸荷轉(zhuǎn)移帶來的影響。

圖1 三自由度車輛動力學(xué)模型

由牛頓第二定律可得:

式中,m為整車整備質(zhì)量;
φ為車輛的航向角;
Fxf、Fxr分別為前、后軸輪胎的縱向力;
Fyf、Fyr分別為前、后軸輪胎的側(cè)向力;
vx、vy分別為質(zhì)心的縱向及橫向速度;
Iz為繞z軸的轉(zhuǎn)動慣量;
a、b分別為質(zhì)心到前、后軸距離。

大地坐標(biāo)系與車身坐標(biāo)系的轉(zhuǎn)換以及車輛動力學(xué)模型為:

式中,Ccf、Ccr分別為車輛前、后輪側(cè)偏剛度;
Clf、Clr分別為前、后輪胎縱向剛度;
Sf、Sr分別為前、后輪胎縱向滑移率;
δf為前輪轉(zhuǎn)角;
X、Y為車輛在大地坐標(biāo)系下的縱向、橫向位置。

3.1 MPC路徑跟蹤控制器設(shè)計

3.1.1 MPC控制器

MPC由預(yù)測模型、滾動優(yōu)化和反饋校正3個部分組成,其流程如圖2所示。MPC控制器依據(jù)預(yù)測模型及目標(biāo)函數(shù)進(jìn)行最優(yōu)求解,得到最優(yōu)序列u(t)并輸出,通過滾動優(yōu)化、反饋校正保證被控車輛沿著期望路徑行駛。考慮到車輛模型的非線性特性,為了提高控制精度,本文基于非線性MPC模型進(jìn)行路徑跟蹤控制器設(shè)計。

圖2 基于MPC的路徑跟蹤控制流程

3.1.2 預(yù)測模型及其離散化

本文采用三自由度車輛動力學(xué)模型作為控制器的預(yù)測模型。式(2)經(jīng)狀態(tài)轉(zhuǎn)換,得到系統(tǒng)狀態(tài)為:

系統(tǒng)輸出量η為:

η的構(gòu)造公式為:

3.1.3 目標(biāo)函數(shù)與約束條件設(shè)計

考慮到跟蹤過程中車輛的穩(wěn)定性,為車輪轉(zhuǎn)角變化量和跟蹤誤差分別賦予權(quán)重,建立目標(biāo)函數(shù)。設(shè)控制器預(yù)測時域為Np,控制時域為Nc,建立目標(biāo)函數(shù):

式中,ηref(k+i)、η(k+i)分別為以當(dāng)前時刻k起,預(yù)測時域Np內(nèi)第i個時刻的期望輸出量、輸出量預(yù)測值;
ρ為常量;
ε為松弛因子;
Q、R分別為跟蹤過程中準(zhǔn)確性和平穩(wěn)程度的權(quán)重。

式(7)中第1 項為系統(tǒng)輸出與期望軌跡間的偏差,表征無人駕駛汽車路徑跟蹤的準(zhǔn)確性,第2項為系統(tǒng)輸入的變化量,表征車輛路徑跟蹤過程中的平穩(wěn)程度。為獲得最優(yōu)解,目標(biāo)函數(shù)改寫為:

為了防止控制量超出范圍,對輸出的前輪轉(zhuǎn)角和增量進(jìn)行約束:

式中,Umin、Umax分別為車輪轉(zhuǎn)角的最小值和最大值;
ΔUmin、ΔUmax分別為車輪轉(zhuǎn)角增量的最小值和最大值。

3.2 路徑跟蹤控制器設(shè)計

3.2.1 評價指標(biāo)

為了保證控制精度和車輛行駛穩(wěn)定性,建立評價函數(shù),判斷時域參數(shù)Np和Nc的優(yōu)劣。文獻(xiàn)[14]以平均橫向偏差、最大偏差和平均橫擺角偏差作為路徑跟蹤準(zhǔn)確性評價指標(biāo),文獻(xiàn)[15]以質(zhì)心側(cè)偏角和橫擺角速度作為車輛行駛穩(wěn)定性的評價指標(biāo)。為此,本文選擇平均橫向偏差emean、最大橫向偏差emax、最大質(zhì)心側(cè)偏角βmax和最大橫擺角速度作為路徑跟蹤過程評價指標(biāo)。

路徑跟蹤時,emean、emax越小,控制器精度越高;
βmax、超過路面允許值[16]時,車輛將失穩(wěn)。βmax、、車速及路面附著系數(shù)存在約束關(guān)系:

式中,g為重力加速度;
μ為路面附著系數(shù);
v為車輛行駛速度。

為了消除不同量綱的影響,將評價指標(biāo)emean、emax、βmax和進(jìn)行歸一化處理。用最大橫向偏差和平均橫向偏差歸一化總和E表征控制器的控制精度;
用最大橫擺角速度、最大質(zhì)心側(cè)偏角歸一化總和W表征行駛穩(wěn)定性。

考慮到Np較大時,能夠預(yù)測未來更多信息,轉(zhuǎn)向動作時間充裕,車輛行駛穩(wěn)定性較好,但控制精度會降低,因此一組Np和Nc控制參數(shù)難以保證控制精度E和穩(wěn)定性W同時達(dá)到最小。為此,設(shè)計評價函數(shù)S,獲得最優(yōu)時域參數(shù)時,能夠兼顧控制器控制精度和跟蹤時車輛的行駛穩(wěn)定性的時域控制參數(shù):

式中,A為控制精度E的權(quán)重;
B為穩(wěn)定性W的權(quán)重。

3.2.2 基于PSO-BP的MPC時域參數(shù)優(yōu)化策略

為了獲得不同路面附著系數(shù)及車速下的最優(yōu)時域控制參數(shù),本文提出基于PSO-BP 算法的MPC 優(yōu)化策略,如圖3 所示。首先,訓(xùn)練基于BP 神經(jīng)網(wǎng)絡(luò)模型,輸入層為時域控制參數(shù)Np、Nc、路面附著系數(shù)μ和車速v,輸出層為控制精度E和穩(wěn)定性W;
其次,在不同μ和v條件下產(chǎn)生粒子群,并賦予粒子不同的時域控制參數(shù)Np、Nc,再次獲得E和W;
通過不同的Np、Nc進(jìn)行迭代尋優(yōu),利用評價函數(shù)S判斷Np、Nc是否為最優(yōu)時域參數(shù),直至達(dá)到最大迭代次數(shù),并輸出最優(yōu)時域參數(shù),由MPC控制器進(jìn)行路徑跟蹤控制。

圖3 基于PSO-BP算法的MPC優(yōu)化策略

3.2.3 不同時域參數(shù)下試驗數(shù)據(jù)獲取

為了獲取最優(yōu)時域參數(shù)Np、Nc,利用設(shè)計的MPC 路徑跟蹤控制器獲取試驗數(shù)據(jù),并對數(shù)據(jù)進(jìn)行分析處理。在路面附著系數(shù)μ=0.4,車速分別為18 km/h、36 km/h 和54 km/h低、中速條件下,以及μ=0.8,車速分別為18 km/h、36 km/h、54 km/h、72 km/h 和90 km/h 低、中、高速條件下,利用遍歷的方法,對不同時域參數(shù)Np和Nc的MPC控制器進(jìn)行仿真,得到評價指標(biāo)emean、emax、和βmax。Np的取值范圍為15~36,Nc的取值范圍為1~Np-1,剔除異常值后獲得數(shù)據(jù)4 094組,訓(xùn)練數(shù)據(jù)結(jié)構(gòu)如圖4所示。

圖4 訓(xùn)練數(shù)據(jù)結(jié)構(gòu)

3.3 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練

利用獲取的試驗數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),其中80%的數(shù)據(jù)作為訓(xùn)練集,剩余20%的數(shù)據(jù)作為測試集。輸入層為路面附著系數(shù)μ、車速v以及時域控制參數(shù)Np和Nc,輸出層為控制器控制精度E和車輛行駛穩(wěn)定性W,隱藏層數(shù)為3層,每層神經(jīng)元數(shù)量為50個,最大迭代次數(shù)為1 000次,最大均方誤差為0.000 01,訓(xùn)練迭代過程如圖5所示。

圖5 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果

由圖5 可知,第378 次迭代時,均方誤差9.991×10-6小于0.000 01,停止迭代,此時相關(guān)性系數(shù)R=0.999 96,擬合效果較好。此時,輸出控制精度E和穩(wěn)定性W的訓(xùn)練集擬合效果和測試集預(yù)測效果如圖6和圖7所示,控制精度E訓(xùn)練集及測試集擬合最大誤差分別為0.038和0.062,穩(wěn)定性W訓(xùn)練集及測試集擬合最大誤差分別為0.023 和0.051,真實值與預(yù)測值基本吻合,表明神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試效果較好。

圖6 控制精度E神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試結(jié)果

圖7 穩(wěn)定性W神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試結(jié)果

為了驗證本文設(shè)計控制器的實際效果,分別進(jìn)行低路面附著系數(shù)低速工況、高路面附著系數(shù)低速和高速工況及中路面附著系數(shù)中速工況雙移線跟蹤仿真對比驗證。考慮實際運行安全因素,取目標(biāo)函數(shù)權(quán)重A=8、B=2。

4.1 低路面附著系數(shù)低速工況雙移線跟蹤仿真

設(shè)置路面附著系數(shù)μ=0.4、車速v=40 km/h,利用PSO-BP 算法得到Np=15、Nc=7;
選擇對比驗證固定時域參數(shù)Np=25、Nc=10。將參數(shù)輸入MPC控制器進(jìn)行仿真,各評價指標(biāo)如表1所示,跟蹤效果及跟蹤偏差如圖8所示,質(zhì)心側(cè)偏角及橫擺角速度如圖9所示。

表1 低附著低速工況仿真結(jié)果

圖8 低附著低速工況跟蹤效果及橫向偏差

圖9 低附著低速工況質(zhì)心側(cè)偏角及橫擺角速度變化

由表1可知,固定時域MPC橫向偏差的最大值和平均值均大于PSO-BP優(yōu)化的MPC對應(yīng)值,其最大值分別為0.400 5 m 和0.204 7 m,后者降低了近50%。仿真結(jié)果顯示,PSO-BP優(yōu)化的MPC控制器最大質(zhì)心側(cè)偏角和最大橫擺角速度較固定時域MPC 控制器大,但二者僅相差0.014°和0.042(°)/s,因為后者采用了較大的時域控制參數(shù),車輛穩(wěn)定性相對增加,但橫向偏差較大。由圖8 可知:PSO-BP 優(yōu)化的MPC 控制器控制車輛跟蹤的橫向偏差始終小于固定時域MPC作用時的橫向偏差;
2種控制器分別作用時,質(zhì)心側(cè)偏角及橫擺角速度相差較小,均能保證車輛進(jìn)行路徑跟蹤時的穩(wěn)定性,如圖9 所示。由此可見,PSO-BP優(yōu)化的MPC路徑跟蹤控制策略能夠提高路徑跟蹤精度。

4.2 高路面附著系數(shù)低速工況雙移線跟蹤仿真

設(shè)置路面附著系數(shù)μ=0.8、車速v=40 km/h,利用PSO-BP 算法得到Np=12、Nc=3;
選擇對比驗證固定時域參數(shù)Np=25、Nc=10。將參數(shù)輸入MPC控制器進(jìn)行仿真,各評價指標(biāo)如表2所示,跟蹤效果及跟蹤偏差如圖10所示,質(zhì)心側(cè)偏角及橫擺角速度如圖11所示。

表2 高附著低速工況仿真結(jié)果

圖10 高附著低速工況跟蹤效果及橫向偏差

圖11 高附著低速工況質(zhì)心側(cè)偏角及橫擺角速度變化

由表2可知,固定時域MPC橫向偏差的最大值和平均值均大于PSO-BP優(yōu)化的MPC對應(yīng)值,其最大值分別為0.351 7 m 和0.157 8 m,后者降低了55%。仿真結(jié)果顯示,PSO-BP優(yōu)化的MPC控制器最大質(zhì)心側(cè)偏角和最大橫擺角速度較固定時域MPC 控制器略大,但其僅相差0.226 7°和0.455 8(°)/s,因為后者采用了較大的時域控制參數(shù),車輛穩(wěn)定性相對增加,但其橫向偏差較大。由圖10可知:PSO-BP優(yōu)化的MPC控制器控制車輛跟蹤的橫向偏差始終小于固定時域MPC 作用時的橫向偏差;
2 種控制器分別作用時,質(zhì)心側(cè)偏角及橫擺角速度相差不大,均能保證車輛進(jìn)行路徑跟蹤時的穩(wěn)定性,見圖11。由此可見,PSO-BP優(yōu)化的MPC路徑跟蹤控制策略能夠提高路徑跟蹤精度。

4.3 高路面附著系數(shù)高速工況雙移線跟蹤仿真

設(shè)置路面附著系數(shù)μ=0.8、車速v=80 km/h,利用PSO-BP 算法得到Np=36、Nc=21;
選擇對比驗證固定時域參數(shù)Np、Nc不變。將參數(shù)分別輸入控制器進(jìn)行仿真,得到仿真結(jié)果如表3、圖12及圖13所示。

表3 高附著高速工況仿真結(jié)果

圖12 高附著高速工況跟蹤效果及橫向偏差

圖13 高附著高速工況質(zhì)心側(cè)偏角及橫擺角速度變化

由表3可知:相比于固定時域MPC,PSO-BP優(yōu)化的MPC各項評價指標(biāo)均小于前者;
前者橫向偏差較大,控制精度較低,最大質(zhì)心側(cè)偏角接近10°,最大橫擺角速度達(dá)到39.476(°)/s,車輛行駛穩(wěn)定性較差,可能產(chǎn)生側(cè)滑等危險。

4.4 中路面附著系數(shù)中速工況雙移線跟蹤仿真

設(shè)置路面附著系數(shù)μ=0.6、車速v=60 km/h,利用PSO-BP 算法得到Np=19、Nc=9;
選擇對比驗證固定時域參數(shù)Np、Nc不變。將參數(shù)分別輸入控制器進(jìn)行仿真,得到仿真結(jié)果,如表4、圖14及圖15所示。

表4 中附著中速工況仿真結(jié)果

圖14 中附著中速工況跟蹤效果及橫向偏差

圖15 中附著中速工況質(zhì)心側(cè)偏角及橫擺角速度變化

由表4可知,固定時域MPC橫向偏差最大值和平均值均大于PSO-BP 優(yōu)化的MPC 對應(yīng)值,分別為0.531 m和0.441 m,最大質(zhì)心側(cè)偏角和最大橫擺角速度小于后者,但是后者顯著提高了跟蹤精度,如圖14所示。由圖15 可知,后者最大質(zhì)心側(cè)偏角和橫擺角速度分別為2.168°和20.457(°)/s,車輛處于穩(wěn)定狀態(tài),在保證車輛穩(wěn)定性的前提下,能夠提高跟蹤精度。

4種工況下雙移線跟蹤仿真驗證結(jié)果表明:車輛以中低車速行駛時,基于PSO-BP獲得時域參數(shù)的MPC控制器,能夠在保證車輛行駛穩(wěn)定性的前提下提高控制器的跟蹤精度;
車輛高速行駛時,利用PSO-BP 優(yōu)化算法獲得時域參數(shù)的MPC 控制器,不僅能夠提高控制器的跟蹤精度,還能提高車輛的行駛穩(wěn)定性。

為了兼顧時域參數(shù)、路面附著條件及控制時效性對無人駕駛汽車路徑跟蹤控制效果的影響,本文提出了基于PSO-BP優(yōu)化的MPC路徑跟蹤控制策略,并在低路面附著系數(shù)低速、高路面附著系數(shù)低速、高路面附著系數(shù)高速及中路面附著系數(shù)中速工況下驗證了控制效果,得出以下結(jié)論:

a.PSO-BP優(yōu)化后的MPC控制器路徑跟蹤過程中,高附著、低附著路面低速工況下橫向控制精度提高了50%以上;
中速工況和高速工況下橫向控制精度分別提高了20%和9%。

b.基于PSO-BP 優(yōu)化的MPC 路徑跟蹤控制策略能夠依據(jù)路面附著條件和車速自適應(yīng)Np、Nc參數(shù),與固定時域參數(shù)相比,不僅能提高車輛路徑跟蹤精度,還能兼顧車輛行駛穩(wěn)定性。

c.利用PSO-BP 離線優(yōu)化MPC 控制器的預(yù)測時域和控制時域參數(shù),利用BP神經(jīng)網(wǎng)絡(luò)泛化能力,降低在線數(shù)據(jù)復(fù)雜程度,可有效提高控制的時效性。

本文BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本附著系數(shù)只有0.4 和0.8,后續(xù)研究工作需要進(jìn)一步優(yōu)化;
控制策略僅在仿真環(huán)境驗證,需要進(jìn)一步開展實車驗證。

猜你喜歡 控制精度時域偏差 如何走出文章立意偏差的誤區(qū)學(xué)生天地(2020年6期)2020-08-25兩矩形上的全偏差數(shù)學(xué)年刊A輯(中文版)(2020年2期)2020-07-25基于時域信號的三電平逆變器復(fù)合故障診斷測控技術(shù)(2018年11期)2018-12-07MW級太空發(fā)電站微波能量波束指向控制精度分析宇航計測技術(shù)(2018年3期)2018-09-08基于安卓的智能車轉(zhuǎn)速系統(tǒng)的設(shè)計與實現(xiàn)物聯(lián)網(wǎng)技術(shù)(2017年7期)2017-07-20基于極大似然準(zhǔn)則與滾動時域估計的自適應(yīng)UKF算法系統(tǒng)工程與電子技術(shù)(2016年7期)2016-08-21關(guān)于均數(shù)與偏差系統(tǒng)醫(yī)學(xué)(2016年8期)2016-02-20基于時域逆濾波的寬帶脈沖聲生成技術(shù)西北工業(yè)大學(xué)學(xué)報(2015年4期)2016-01-19基于時域波形特征的輸電線雷擊識別電測與儀表(2015年2期)2015-04-09歐瑞傳動SD10系列伺服系統(tǒng)在無縫針織內(nèi)衣機上的應(yīng)用解決方案紡織導(dǎo)報(2014年9期)2014-10-31

推薦訪問:路徑 跟蹤 優(yōu)化

最新推薦
猜你喜歡