周宏濤,方美華
南京航空航天大學 航天學院,南京 211100
2004年7月,中國發射的TC-1與TC-2衛星同時頻繁出現通信異常、儀器失效等故障,嚴重影響了衛星正常運行。文獻[1]指出是空間高能電子增強導致的深層充電效應引起了故障。深層充電是指能量在0.1~10 MeV的高能電子在穿過航天器表面屏蔽層后,在航天器內部介質材料沉積并建立電場。當電場強度超過材料的擊穿閾值后便會引發靜電放電現象(electrostatic discharge,ESD),嚴重影響航天器的電子系統,甚至對航天器的儀器和結構造成破壞。在對國外航天器在軌故障的統計中,由深層充電引起的ESD占到了由空間環境引起的異常的23%[2]。因此研究深層充電對于航天器的安全運行極為重要。
目前,對深層充放電風險的研究主要集中在兩個方面:
一是在衛星上搭載深層充電探測器,通過探測高能電子在探測器中的電流信號,實現對深層充放電的風險評估。缺點是沒有考慮不同材料的特性,如文獻[3]對Giove-A衛星上深層充電探測器的探測電流進行了分析。
二是在地面建立衛星軌道的環境電子模型,利用GEANT4等軟件對衛星在軌運行的內帶電情況進行仿真計算,從而評估衛星深層充放電的風險。如文獻[4]結合GEANT4與RIC模型對復雜結構的介質進行了深層充電數值模擬;
文獻[5]在此基礎上,研究了非線性電導對深層充電的改善;
而文獻[6]則利用該模型研究了位于木星軌道上的衛星對高能電子進行屏蔽的最佳材料。這種方法的缺點是無法實時評估衛星放電風險,且計算耗費時間較長。
衛星深層充放電與高能電子環境、材料特性和接地方式等因素密切相關,而上述兩種方法不僅無法針對不同的材料特性給出相應的結果,在對深層充放電風險評估的實時性、準確性等方面也無法滿足航天工程的需求,因此本文提出了一種基于神經網絡算法的高能電子環境反演模型來實現對深層充放電的風險評估。
近年來,得益于人工神經網絡的發展與空間輻射環境觀測數據的大量積累,神經網絡算法在空間輻射及效應方面得到了廣泛的應用。文獻[7]利用神經網絡,根據當前衛星位置和電子環境對未來一段時間的電子環境進行預測;
文獻[8]基于大量的觀測數據,利用神經網絡建立了磁層中高能粒子分布模型、磁層頂的三維模型、地球輻射帶電子動力學模型以及太陽活動參數的預測模型;
文獻[9]則實現了太陽輻射的估計。基于空間電子環境與深層充電的關聯性,將神經網絡算法應用于深層充電計算中,相較于傳統的數值模擬方法,既能實現空間電子環境的反演計算,又能規避數值計算的高時間復雜度,在模型訓練完成后便可迅速計算得出結果,同時也具有較好的精度。數值模擬方法雖然能較準確地反映出深層充電效應,但是存在建模復雜、計算時間長等缺點,同時也無法由深層充電反演出空間電子環境。
此外,由于根據輻射探測器的計數率計算入射帶電粒子的通量屬于不適定問題[10-11],計算困難,且容易出現較大的誤差。利用神經網絡計算得出的結果可以幫助對輻射探測器的結果進行修正。
本文基于空間高能電子環境與深層充電的關聯性,設計了一種用于探測深層充電效應的探測器,并將實際探測數據與模擬探測數據作為神經網絡的訓練集,建立了通過深層充電反演空間電子環境的神經網絡模型,最后利用探測結果驗證了模型的準確性與可靠性。
2.1 深層充電計算
空間高能電子在穿過屏蔽、進入介質后,與介質材料發生相互作用,傳遞能量并產生新的次級粒子。文獻[11]將鋁板作為材料,研究了電子在其中的運動過程,給出了用于計算能量Ee<10 MeV的電子的最大射程的公式:
(1)
式中:R為最大射程,單位g·cm-2。
當電子的最大射程小于介質厚度時,便會沉積在介質中引起深層充電效應,否則就會穿過介質。由此可以得到簡要計算厚度為d的介質的深層充電電流密度Jd的公式:
Jd=f(E (2) 式中:f為電子積分通量,單位cm-2·s-1; 根據式(2)對深層充電電流密度的計算,結構如圖1所示的深層充電探測器SURF被設計用來探測深層充電效應,由3個以堆疊方式安裝的鋁屏蔽集電板組成,以在3個不同的屏蔽深度進行內部充電電流的測量。3個鋁板的厚度分別為0.5 mm、0.5 mm、1.0 mm,代表航天器內電介質的典型厚度,每片鋁板都各自連接到靜電計以測量沉積的電流。考慮到在衛星所處的軌道質子的數量相比電子的數量來說可以忽略不計,因此探測得到充電電流可以較準確地反映出深層充電效應。 圖1 深層充電探測器結構示意Fig.1 The structure of deep charging detector 對于神經網絡訓練所需要的數據,為了使模型能更加準確地反演不同情況下的電子通量,分別利用AE9模型與FLUMIC(flux model for internal charging)模型建立兩個不同的神經網絡模型,獲得不同位置、不同時間下電子通量分布,再根據式(1)(2)計算得出3個鋁板的充電電流密度,作為神經網絡的輸入。AE9模型給出了地球捕獲帶電子環境模型,相對于AE8等傳統模型,它使用的數據集更為準確,電子能量的跨度范圍40 keV~10 MeV,空間范圍0.98Re~12.4Re[12],Re為地球半徑。而FLUMIC模型考慮到會引起電子通量在量級上發生改變的因素,如高能電子增強事件、太陽活動等,其對空間高能電子環境的建模相較于AE9而言更為惡劣,較常用于深層充電的計算中。 由于通過深層充電探測數據對電子環境進行反演存在非線性、輸入參數較多、數據量較大等特點,因此采用建立人工神經網絡進行反演研究是一種較好的方法。 人工神經網絡是一種模擬人腦神經元網絡進行計算的模型,通常用于對非線性函數進行擬合和對數據進行分類,具有極強的非線性映射能力。利用BP神經網絡,將誤差進行反向傳播,并利用梯度下降法等算法使誤差達到最小,其結構如圖2所示。樣本由輸入層進入,經過隱含層后由輸出層輸出,每層由若干個神經元組成,神經元的結構如圖3所示,其作用是計算所有輸入的加權和并通過一個非線性函數輸出結果,可以表示為: (3) 圖2 BP神經網絡結構示意Fig.2 The structure of BP neural network 圖3 神經元結構示意Fig.3 The structure of a neural 對于至少具有一個隱含層、激勵函數為sigmoid函數的神經網絡,如果其具有足夠多的神經元,便可以以任意精度逼近任意連續函數[13]。訓練流程是通過對樣本數據的學習,修正不同神經元的權重,從而實現對空間電子環境的反演,如圖4所示。 圖4 神經網絡訓練流程Fig.4 Flow chart of the process of the neural network (1)輸入層和輸出層的設計 根據圖 1給出的探測器的結構,使用探測器3片鋁板的充電電流密度J1、J2、J3與電子能量E作為神經網絡的輸入,電子積分通量f(>E)作為神經網絡的輸出,如圖5所示。 圖5 神經網絡輸入與輸出示意Fig.5 Diagram of neural network input and output (2)隱含層的設計 對于隱含層層數的設計,通常取1~2層。增加隱含層層數雖然能提高模型精度,但會使計算時間大大增加。對于隱含層神經元個數的設計,本文參照了以下的經驗公式: 式中:n1為隱含層神經元個數; (3)激勵函數和誤差函數的選取 本文選取線性整流函數(ReLU)作為神經網絡的激勵函數: 其優勢是使得梯度下降和反向傳播更有效率,簡化計算過程,并且避免出現梯度消失的問題; 選取數據中的70%為訓練集,15%為驗證集,15%為測試集。神經網絡利用訓練集進行訓練,在每次訓練中神經網絡會根據輸入數據更新一次權值。每訓練一次會將驗證集中的數據輸入網絡,得到誤差。在誤差經過一定的訓練次數不再下降后,停止訓練。圖6(a)(b)分別給出了利用AE9模型和利用FLUMIC模型進行訓練的神經網絡模型的MSE隨訓練次數的變化,可以看出驗證集和測試集的誤差隨著訓練次數的推移而增加,圖(a)在第25次訓練后達到最小值0.041 22,而圖(b)在第171次訓練后達到最小值0.008 751 1。 圖6 MSE隨訓練次數的變化Fig.6 The variation of MSE vs.the training epochs 以搭載了深層充電探測器的Giove-A衛星為例,驗證模型在反演電子環境上的準確性。該衛星于2005年12月28日發射,軌道高度為23 300 km,傾角為56°。由于衛星會經過外輻射帶的中心,可能暴露在相對論電子下,會發生嚴重的深層充電效應。下面分別將基于AE9模型訓練的神經網絡以及基于FLUMIC模型訓練的神經網絡應用于日平均充電電流、高能電子增強事件發生時的充電電流兩個方面。 圖7給出了2015年間衛星在磁殼參數L=5.00處對充電電流密度的探測結果的日平均值,其周期性變化特征是由圖8給出的同一時段內測得太陽風速度的變化[3]所引起的。將3塊板的充電電流密度與E=2 MeV作為神經網絡輸入,得到E>2 MeV電子通量隨時間的變化,與GEO軌道在同一時刻電子通量的對比如圖9所示。GEO軌道的電子通量由GOES衛星觀測得到,由于E>2 MeV電子通量與地球靜止軌道的內部充電問題密切相關,因此被廣泛用作內部充電威脅等級的指標,即使是在其他軌道區域[14]。可以由圖9看出在太陽風的影響下,兩者具有一致性。根據圖10[15]給出的外輻射帶高能電子分布圖可知,在GEO軌道由于太陽風的擠壓,高能電子通量的變化幅度在102~104.5cm-2s-1sr-1MeV-1內; 圖7 L=5.00處SURF探測器充電電流密度隨時間的變化Fig.7 Change of charging current of SURF with time at L=5.00 圖8 太陽風速度隨時間的變化Fig.8 Change of solar wind velocity with time 圖9 神經網絡模型反演計算得出E>2 MeV電子通量隨時間變化與GOES衛星觀測結果的對比Fig.9 The time-dependent variation of E>2 MeV electron flux calculated by neural network compared with that observed by GOES 圖10 外輻射帶高能電子微分通量分布Fig.10 Differential flux distribution of high-energy electrons in the outer belt 衛星運行期間,最大的充電事件發生在2010年4月,由太陽風所引起的地磁暴(KP=7)導致。圖11給出了這段時間內深層充電探測器充電電流密度的變化, 圖11 2010年4月1—17日地磁暴發生期間深層充電探測器充電電流密度的變化Fig.11 Variation of charging current of SURF during geomagnetic storm from April 1st to 17th,2010 表 1給出了探測器對應的充電電流密度峰值,可以看出頂板首先測量到了增加的充電電流,其次是中間板,最后是底板。分別將5號、6號、8號的探測電流密度作為神經網絡的輸入,得到如圖 12所示電子能譜的分布。可以看出,相比于5號,6號地磁暴發生時,反演得出的低能電子的通量增加到了1011量級。在8號,頂板電流下降較為明顯,而中間板和底板電流變化不大。根據第2.1小節中給出的對深層充電電流密度的計算,可知探測器的頂板對低能電子敏感,而中間板和底板對高能電子敏感,故神經網絡輸出的低能電子通量下降到了109量級,而高能電子通量變化不大。 表1 地磁暴發生期間不同探測板的峰值電流密度及發生時間 圖12 神經網絡模型反演計算得出2010年4月5日、6日及8日電子能譜Fig.12 The electron fluxes output from the neural network on 5th,6th and 8th April,2010 將圖12給出的探測電流密度數據與E=2 MeV作為神經網絡的輸入,得到了如圖13所示的神經網絡模型輸出E>2 MeV電子通量隨時間的變化與實際探測得到電子通量的對比。可以看出在電子事件發生前后,模型輸出的電子通量略高于真實電子通量周期性變化時的峰值。在7號發生地磁暴時,由于頂板電流的迅速增加,導致模型輸出電子通量接近107量級,與真實值差距較大。而在7號至12號電子事件結束這段時間內,隨著頂板電流的下降,模型輸出電子通量下降到106量級,能夠逐漸接近實際電子通量的變化峰值。 圖13 地磁暴期間神經網絡模型反演計算E>2 MeV電子通量與Giove-A實際觀測數據對比Fig.13 Comparison of E>2 MeV electron flux between output of neural network and Giove-A flux data during geomagnetic storm 除了空間電子通量分布以外,同樣關心航天器中其他材料的深層充電電位,以實現航天器內充電風險實時評估。深層充電探測器探測得到的電流是空間電子環境的直接反饋,因此可采用神經網絡算法直接用探測電流反演不同材料的電位[16]。利用探測器的探測電流計算其他材料的最大內電場。DICTAT可以根據輸入的電子能譜計算不同材料電位,與上文類似,利用DICTAT計算得到大量數據,建立了由電子環境計算不同材料電位的神經網絡模型,從而避免了直接使用DICTAT進行計算所帶來的高時間復雜度。 以4.1中對日平均電流的分析為例,將深層充電探測器的探測電流密度作為神經網絡輸入,選擇航天器3種典型的介質材料Teflon、Kapton、Epoxy作為輸出材料電位。計算得到材料最大內電場隨時間變化如圖 14所示。設Teflon的擊穿電場為1.97×107V/m,根據文獻[17-18]的結論設Kapton的擊穿電場為1×106V/m,Epoxy的擊穿電場為1.21×108V/m,可以發現Teflon與Kapton的最大內電場始終在擊穿電場以上,而Epoxy的始終在擊穿電場以下。 圖14 神經網絡模型計算得出3種介質材料的最大內電場隨時間的變化Fig.14 The variation of the electric fields of three types of dielectrics with time calculated based on the neural network 本文基于人工神經網絡,利用AE9輻射帶電子模型及FLUMIC模型建立了由深層充電反演空間電子環境的神經網絡模型。結果表明,該模型能充分利用深層充電與電子環境的關聯性,借助深層充電探測器實現對電子通量的計算,不僅在測試集上具有較高的精度,與Giove-A衛星探測數據的對比也證明了該模型在實際應用中的可行性。此外,該模型還提供了一種獲取航天器其他材料深層充電電位的手段。后續的研究工作將從以下方面進行:一是擴充訓練集的范圍,增加實際電子通量的探測數據,以提高模型在實際應用中的可靠性;
E為電子能量;
Ed為根據式(1)計算得出最大射程R=d時電子的能量。2.2 數據集
3.1 BP神經網絡
3.2 神經網絡建模
n為輸入神經元個數;
m為輸出神經元個數;
a∈[1,10],為常數。基于以上結論并經過測試,設置模型的隱含層層數為1,神經元個數為10。
選取均方誤差(MSE)函數:3.3 模型訓練結果
4.1 日平均充電電流分析
而L=5.00處于外輻射帶中心,高能電子通量均保持在103.5cm-2s-1sr-1MeV-1以上。圖 9中給出的神經網絡輸出與上述變化趨勢吻合得較好。4.2 高能電子增強事件分析
4.3 其他材料電位反演
二是將建模思路應用到表面充電,從而建立完整的航天器充放電反演電子環境模型。