李亞雄
湖南中車時代通信信號有限公司 湖南 長沙 410001
CAN 總線是一種被廣泛使用的現場總線,是ISO 國際標準化的串行通信協議(ISO11898),其高性能和可靠性已被國際認同,廣泛的應用于工業自動化、船舶、軌道、醫療設備、工業設備等方面。近年來,雖然FlexRay總線開始大面積使用,但是Flex Ray總線無論在可靠性還是價格上能完全取代CAN 總線以前,對CAN 總線的作進一步的失效分析和改進仍然是非常有重要意義的。
目前國內使用的鐵路信號處理設備LKJ監控裝置采用的就是CAN總線通信方式,在鐵路局新裝136臺LKJ設備的機車,設備經過一個多月的線上運行,發現有15臺機車記錄文件中頻繁出現單機運行故障,導致記錄有單機運行的部分機車無故排風,非正常停車。另外單機運行大大的降低了LKJ監控裝置系統的雙機冗余可靠性,且會導致揭示不控等一系列嚴重后果,使機車導向不安全。針對CAN 總線在LKJ監控裝置使用過程中發生失效的實際案例,通過具體的實驗,進行分析、研究,找出CAN 總線的失效的原因,進行改進。
LKJ監控裝置CAN 通信分為內CAN 總線和外CAN 總線。內CAN總線是監控主機內部插件和顯示器之間的信息通道;外CAN 總線是監控裝置和其他外圍設備(比如:無線傳輸主機等)的信息通道。內、外CAN總線之間通過擴展通信插件進行信息轉換。典型監控裝置內CAN 總線結構,見圖1。

圖1 帶擴展通信插件監控裝置內CAN 總線結構
經過對失效機車的設備進行一系列分析,得出故障是由CAN 通信質量不佳引起。影響CAN 通信的質量的重要因素為總線信號幅值和波形邊沿特性(上升沿、下降沿延時)。總線信號幅值過低會引起接口芯片傳輸錯誤,波形的邊沿特性會影響波形采樣的正確性。
2.1 CAN 總線電源分析 對設備單機時測試系統供電電源及CAN總線電源,測試情況如表1。主機系統電源穩定,CAN 總線供電電源穩定,完全可以排除電源引起單機的懷疑。

表1 系統供電電源及CAN 總線電源測試表
2.2 CAN 終端電阻分析 在CAN 總線通訊中,終端電阻具有匹配總線阻抗,抑制終端信號反射,維持通訊穩定的作用。過高或者的總線終端電阻都會造成總線阻抗失衡,使得信號波形失真,引起通訊故障。
根據CAN 控制芯片數據手冊,總線信號顯性位時,波形顯性位幅值VDIFF(D)應當大于1.0V。對幅值影響最大的因素為終端電阻,當終端電阻增大時,信號幅值提高,當終端電阻減小時,信號幅值降低。理論計算值,總線上并聯4個120Ω 的終端電阻(總線上的總阻抗為30Ω)時,波形顯性位幅值VDIFF(D)約為1.6V。試驗室環境下,并聯4個120Ω 的終端電阻,測得波形顯性位幅值VDIFF(D)約為1.4V,見圖2。

圖2 試驗室4個終端電阻時測得CAN 總線波形
在機車上實測CAN 信號波形,測得波形顯性位幅值VDIFF(D)約為1.2V,機車上由于車內環境和機車布線的影響,波形幅值比實驗室測得的數據偏低0.2V 左右,見圖3。
LKJ監控裝置上的CAN 終端電阻可以通過插件上的終端電阻跨接套進行配置。根據試驗,LKJ監控裝置CAN 總線終端電阻為30?時,總線通訊丟幀率為0.04%;當CAN 總線終端電阻為20?時,總線通訊丟幀率為6%;當CAN 總線終端電阻為60?時,總線通訊丟幀率為4%。通過多次試驗發現,當LKJ監控裝置終端電阻為30?,總線丟幀率最低,就有較好的效果。試驗室通過軟件配合測試不同的終端電阻對于總線通信的影響,結果見表2。

表2 不同終端電阻對通信的影響
發生單機故障的機車,在機車上實測CAN 波形顯性位幅值VDIFF(D)為960m V,低于1V 的標準,經檢查,監控主機地面信息插件終端電阻跨接上了,存在6.5%的數據丟失率,分析后續幾天的運行記錄文件,單機運行故障發生頻繁,見圖4。

圖3 機車實測CAN 總線波形

圖4 故障機車實測CAN 總線波形
經過對機車設備CAN 總線進行排查,機車上部分CAN 總線終端電阻不匹配是產生設備記錄單機運行一個原因,將所有機車的CAN 總線全部配置為30Ω,然后機車現場運行半個月時間,記錄單機運行的機車數量減少為3臺,且未出現機車無故放風狀態。
由于CAN 總線終端電阻的分析未能完全解決單機運行的故障,繼續對CAN 采樣點配置進行分析,CAN 采樣點配置關系見圖5所示。

圖5 在TSEG1結束位置進行采樣
修改插件軟件CAN 通信采樣點初始化配置如下所示:目前軟件配置分頻比(BRP)設置為1,時段1(TSEG1)設置為7,時段2(TSEG2)設置為6,CAN 通信異常。調整為:時段1(TSEG1)為8和時段2(TSEG2)為5,或者時段1(TSEG1)為10和時段2(TSEG2)為3,時段1(TSEG1)為12和時段2(TSEG2)為1后,CAN 通信正常。
通過改變信息處理插件軟件的CAN 采樣時機,當采樣時機調整到CAN 位寬靠后位置時CAN 通信正常;當采樣時機調整到CAN 位寬居中位置時CAN 通信故障率較高。
這是由于CAN 通信發送異常時CAN 控制芯片CC770的狀態寄存器LEC位顯示“4”,即把隱性位(低電平,表示“1”)錯判為顯性位(高電平,表示“0”),導致信息處理插件重復發送自檢信息,影響CAN 總線正常運行。
因此,當軟件CAN 采樣點取到位寬靠后時可避免采樣到CAN 通信的下降沿,從而避免了誤判正常發送為發送錯誤、重復發送多次導致CAN總線異常的問題。
通過分析CAN 通信波形顯示:在顯示器CAN 通信線懸空時,CAN差分信號上升沿、下降沿較緩,差分信號的邏輯低電平小于0.5V 的區域約占總時間的60%;接上顯示器終端電阻后充、放電時間縮短,差分電壓上升沿、下降沿變陡,差分信號的邏輯低電平小于0.5V 的區域約占總時間的80%。
根據分析結果將系統的所有CAN 節點的CAN 采樣點固定在CAN位寬最后的10%~30%之間。然后所有更改配置的機車現場運行,現場運行三個月,記錄單機運行的機車數量為0,單機故障現象消失。
LKJ監控裝置系統電源和CAN 總線電源符合產品和芯片數據手冊要求,不存在問題,問題的來源應該為CAN 終端電阻配置錯誤和或CAN采樣點配置錯誤。
CAN 終端電阻原因,CAN 終端電阻配置正確時,總線信號顯性位時,波形顯性位幅值VDIFF(D)應當大于1.0V。當終端電阻增大時,信號幅值提高,當終端電阻減小時,信號幅值降低,機車上部分CAN 總線終端電阻不匹配是產生設備記錄單機運行一個原因。
通過改變信息處理插件軟件的CAN 采樣時機,當采樣時機調整到CAN 位寬靠后位置時CAN 通信正常;當采樣時機調整到CAN 位寬居中位置時CAN 通信故障率較高。當軟件CAN 采樣點取到位寬靠后時可避免采樣到CAN 通信的下降沿,從而避免了誤判正常發送為發送錯誤、重復發送多次導致CAN 總線異常的問題。完全的解決LKJ監控裝置單機運行通信故障的現象,提高了系統的可靠性和安全性。