李曉剛 李婕 曹寧 劉開元 劉啟輝 汪攀
(上汽通用汽車有限公司武漢分公司)
汽車總線的穩定性在汽車功能穩定性中至關重要。隨著整車智能化及集成化程度的提高,總線數據也日趨復雜,當大量的數據出現問題或者丟失時,汽車總線可能出現崩潰的情況。如果汽車出現總線長時間掉線問題,一般會造成汽車部分功能故障[1-2]。汽車通常會出現瞬時掉線,持續時間為20~200 ms 之間,當出現這種情況的掉線時,可能會導致部分車輛模塊瞬間功能異常并彈出警示,但實際功能卻不受影響。基于以上問題,文章通過汽車總線仿真測試軟件(Vehicle Spy3)錄取并分析實車總線數據,確定總線瞬時崩潰的原因,同時分析總線瞬時崩潰對車輛功能的影響,并深入評估車輛功能的恢復和正常使用的情況。
項目進行期間出現了“儀表盤彈出請檢修制動牽引力”問題,隨即進行問題分析,到實車階段發現儀表盤一直顯示該問題,但是汽車制動牽引力可正常使用,汽車無其他故障。
故錄取總線數據后,對總線數據進行相應的分析,發現總線上許多模塊都出現了短暫的掉線,并且掉線狀態持續的時間很短,約為20 ms 左右,如圖1 紅框中所示。
CAN 總線是一種現場總線,連接在CAN 總線上的控制單元通常是通過2 根數據導線彼此相連。2 根導線是雙導線并互相纏繞,稱為CAN-H 和CAN-L,雙絞線對稱信號,抗干擾能力強,適用于環境比較惡劣的條件[3]。
分析數據后發現,總線上的數據出現在20 ms 內丟失1~2 幀數據的情況。模塊集體丟幀這類問題大概率的原因是物理連接問題引起,特別是有外接線束或者設備的情況下,如果存在接觸不良、短接、虛接、短地等情況都有可能出現。
其中儀表盤彈窗提示“請檢修牽引力”,邏輯如下:電子剎車控制模塊是安全件,對于信號改變的識別比較敏銳,只要監控到總線掉線,即多條相關信號不在線,如Ax/Ay(傳感器X/Y軸加速度)等,就會禁用掉TCS(牽引力制動系統)/ESC(電子車身穩定性控制系統),此時電子剎車控制模塊只請求了毫秒級的故障提示,繼而會在儀表盤顯示請維修牽引力。
CAN 總線的故障共分為3 類[4-5]:1)電源故障。由于電源系統電壓低,引起控制器無法正常工作。2)節點故障。通過數據總線實現的控制單元網絡的節點為網絡的各個電控單元,可能存在電控單元本身有故障。3)鏈路故障??赡苡捎谲嚈C震動、系統未正確加裝等原因導致總線的物理層出現故障,即傳輸系統的鏈路不通暢,無法正常通訊。鏈路故障又分為以下3 種,如表1 所示。

表1 汽車CAN 總線鏈路故障原因
該問題發生原因可能是CAN 線斷路導致的,但是該問題現象只保持了20 ms 左右,隨即恢復正常,如果是線路斷路導致,問題現象應該一直存在,故可排除是由于CAN 線斷路導致的。
當電阻缺失時,負載會減小,導致線路電流加大,線路會一直處于總線保護中,問題現象也會一直存在,故可以排除由于電阻缺失導致CAN 線路故障。
問題發生的原因還可能是CAN 線短路導致,為了查明是否由于CAN 線短路導致該問題的發生,需要對問題現象進行復現,以下為3 種復現的工況及手法。
工況一:正常狀態下,啟動汽車,通過對整車啟動過程進行復現,查看儀表盤是否彈出警示;
工況二:懷疑外接設備導致,故插拔數據錄取工具進行復現;
工況三:嘗試短接高速CAN 線的CAN-H 和CAN-L。
分別在上述工況下對問題現象進行復現,通過復現,確認問題發生的根本原因。
1.2.1 工況一描述
不做任何相關的其他觸發操作,只是正常啟動汽車后,觀察儀表盤是否彈出請檢修制動牽引力的警示,并觀察是否有其他現象。
1.2.2 工況二描述
由于插拔外接設備時問題現象會偶然復現,故分析認為在插拔外接設備時,在某種特定工況下會導致總線掉線。因此儀表盤彈出請檢修制動牽引力問題的提示很可能是由于外接設備導致,外接設備及連接方式,如圖2 所示。

圖2 外接設備連接方式
針對該情況,分析插拔外接設備,以確定導致問題現象發生時,外接設備的狀態。通過復現對比,儀表盤彈窗出現“請檢修牽引力”的提示,從而復現出問題發生時的狀況。
首先數據錄取設備接口與汽車延長端口相連接,復現的狀態為外接設備拔出的過程較慢,端口的針腳之間容易出現誤接觸,從而容易產生問題現象。
1.2.3 工況三描述
嘗試短接高速CAN 線的CAN-H 和CAN-L,分別對應引腳中的6/14 腳,如圖3 所示。在短接過程中,需要保證只是短暫的短接,避免由于時間過長影響車輛狀況。短接的方式為:先用金屬絲的一端連在引腳6上,然后用金屬絲的另一端去觸碰引腳14,再瞬間拿開,從而實現短暫短接的工況[6-7]。

圖3 端口引腳分布圖
在短接過程中,我們盡量保證短暫接觸后立即斷開,之后從數據中看到,當短接時間為25 ms 左右時,儀表盤彈出“請檢修制動牽引力”的提示,與問題出現時的現象一致。
針對以上3 種復現工況,為了避免不同車輛因素的干擾,只使用一臺試驗車進行3 種工況的復現操作。通過對上述3 種工況進行相應的復現,并統計復現的次數及頻率,經過一段時間得到結果,如表2 所示。

表2 不同復現工況下的復現概率
從復現結果可以看出,在正常啟動汽車時,復現的概率為0,表示在該復現工況下,問題現象不會出現,可以排除車輛總線自身會掉線的可能性。
當插拔外接設備進行復現時,發現問題現象可以復現,但是頻次較低,發生該現象的可能性是在插拔外接設備時,不一定會出現問題現象,而在插接過程中,2 個接口之間處于某種接插狀態時,才會導致問題現象的發生。通過多次分析及試驗,發現在2 個接口緩慢拔出的過程中,某些針腳處于連接狀態,而某些針腳處于斷開狀態,在這種針腳連接狀態下,可能會出現問題現象的發生。
在短接的CAN-H 和CAN-L 時,發現復現頻次很高,短接的方式如復現工況中描述,基本只要進行短時間的短接,就會造成問題現象的出現。
通過對以上的復現工況及復現結果進行分析,由于短接高速CAN 線時,都會出現問題現象,而在插拔外接設備的過程中,會出現由于針腳誤觸而導致問題現象發生,而問題發生時實際車輛只連接外接設備,而沒有自己短接的可能性存在,所以基本鎖定總線掉線的原因是由于插拔外接設備時,總線偶然出現短接20 ms左右造成的。
為了確認和分析總線崩潰是否會導致車輛出現功能問題,文章經過長時間的跟蹤和車輛數據對比,進行了分析和驗證。
首先對于問題第一次發生的車輛進行7 天的跟蹤,發現缺陷車輛恢復正常之后,車輛功能在該段時間內未發生其他異常,且錄取總線數據后,數據未出現少發幀的現象。
然后對其他3 輛車進行工況三的復現方法對比,即通過短接高速CAN 線的CAN-H 和CAN-L,總線崩潰時間不同,車輛也會有不同的狀態。因為模塊的輪詢周期不同,部分模塊輪詢周期較短,出現總線掉線后立刻會有警示燈彈出。
掉線時間不同對車輛會有不同的影響,對比的指標主要分為以下幾個方面,如表3 所示。

表3 總線掉線對車輛的影響指標
因為汽車外接設備發生崩潰的時間為20 ms 左右,故設定短接時間為10 ms、20 ms、40 ms、80 ms,對比數據,如表4 所示。

表4 不同短接時間指標數據
從表4 中可以看出,在追蹤車輛后期質量時,沒有出現相關的故障,說明總線短暫崩潰后,汽車的功能會迅速恢復正常,并且不影響車輛的其他功能。
通過對以上的復現工況及復現結果進行分析,總線發生瞬時崩潰的原因是在插拔外接設備的過程中,出現針腳誤觸而導致總線短路。通過對問題發生后的車輛功能進行長時間的追蹤,車輛功能未發現故障。綜上所述,當總線短暫崩潰后,車輛的功能會迅速恢復正常,并且不會對車輛的正常功能造成影響。文章在理論上闡述了汽車總線短暫掉線發生后根本原因的確認,并評估此現象對整車功能的影響,可以指導后期車輛出現該問題后的排查及功能評估。后期將進一步研究總線掉線時間長短對于車輛功能安全方面的影響,并研究總線在出現意外情況下保持穩定的方法及策略。