神東煤炭集團(tuán)公司寸草塔二礦 梁志鵬
通過(guò)對(duì)寸草塔二礦一體化管控平臺(tái)系統(tǒng)使用中出現(xiàn)的數(shù)據(jù)故障進(jìn)行分析,提出了故障處理的方法,進(jìn)一步提高系統(tǒng)的安全可靠性,希望能給使用的單位提供借鑒,遇到類(lèi)似的問(wèn)題能夠盡快處理,確保數(shù)據(jù)通暢,保證系統(tǒng)安全可靠運(yùn)行。
煤礦一體化管控平臺(tái)是實(shí)現(xiàn)智能化礦井的重要環(huán)節(jié)之一,在該系統(tǒng)投入運(yùn)行過(guò)程中,如果出現(xiàn)采集數(shù)據(jù)故障,將會(huì)給安全生產(chǎn)管控增加困難,如何快速發(fā)現(xiàn)并及時(shí)處理故障是運(yùn)維工作者的重要職責(zé)之一。針對(duì)數(shù)據(jù)采集存在的軟、硬件故障,通過(guò)使用替換方法、分段診斷等解決方案,達(dá)到處理數(shù)據(jù)通訊障礙的目的。
使用一體化管控平臺(tái)是實(shí)現(xiàn)智能化礦井的發(fā)展趨勢(shì),目前神東公司寸草塔二礦利用國(guó)產(chǎn)軟件平臺(tái)自主建成大數(shù)據(jù)存儲(chǔ)、查詢、分析的統(tǒng)一平臺(tái)系統(tǒng),該系統(tǒng)從開(kāi)發(fā)到投用已有一年有余,截至目前采集數(shù)據(jù)點(diǎn)超十萬(wàn)之多,逐漸日臻完善,可實(shí)現(xiàn)礦井所有子系統(tǒng)的集中展示、集中遠(yuǎn)程控制、移動(dòng)監(jiān)測(cè)、關(guān)聯(lián)分析、故障診斷與決策、智能報(bào)警、生產(chǎn)系統(tǒng)優(yōu)化、智能感知、GIS巡檢、大數(shù)據(jù)分析等功能。
一體化管控平臺(tái)的基本組成層次結(jié)構(gòu)應(yīng)當(dāng)包含終端物理層、數(shù)據(jù)傳輸層、數(shù)據(jù)管理層、數(shù)據(jù)應(yīng)用層。具體在動(dòng)態(tài)監(jiān)測(cè)與識(shí)別礦井空間環(huán)境數(shù)據(jù)的全過(guò)程中,平臺(tái)主要依靠智能傳感器來(lái)跟蹤獲取數(shù)據(jù),然后運(yùn)用自動(dòng)化的礦井?dāng)?shù)據(jù)分析措施方法來(lái)歸納得出結(jié)論。
為實(shí)現(xiàn)礦井各項(xiàng)分散信息系統(tǒng)數(shù)據(jù)的統(tǒng)一管理,應(yīng)用統(tǒng)一的模型、數(shù)據(jù)源,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)的快速收集、分析,并且最終實(shí)現(xiàn)數(shù)據(jù)共享。該系統(tǒng)分為四層設(shè)計(jì)。(1)在終端物理層中。就是有計(jì)算能力而且能聯(lián)網(wǎng)的設(shè)備終端,例如新型磁力啟動(dòng)器、變頻器、饋電開(kāi)關(guān)、移動(dòng)變電站、智能控制器、各類(lèi)傳感器等。(2)在數(shù)據(jù)傳輸層中,井下可以通過(guò)萬(wàn)兆環(huán)網(wǎng)輻射到各個(gè)配電點(diǎn)的綜合分站、千兆網(wǎng)絡(luò)交換機(jī)設(shè)備使用支持modbusRTU串口、modbusTCP傳輸方式,將基礎(chǔ)數(shù)據(jù)上傳至服務(wù)器中。(3)在數(shù)據(jù)管理層中,要進(jìn)行連接管理和通道管理,確保眾多設(shè)備的無(wú)掉線穩(wěn)定連接,同時(shí)還要確保通道的暢通性,能夠高效的進(jìn)行數(shù)據(jù)交換。(4)在數(shù)據(jù)應(yīng)用層中,是整個(gè)系統(tǒng)最核心的部分,也是最能體現(xiàn)數(shù)據(jù)價(jià)值的層面,根據(jù)數(shù)據(jù)運(yùn)用的深度,可劃分為三個(gè)階段,第一階段,遠(yuǎn)程監(jiān)測(cè)監(jiān)控階段。第二階段,大數(shù)據(jù)的分析應(yīng)用階段。第三階段,人工智能應(yīng)用階段。在第一階段中,井下要能夠?qū)崿F(xiàn)實(shí)時(shí)數(shù)據(jù)向地面上傳,地面數(shù)據(jù)平臺(tái)人員可以遠(yuǎn)程監(jiān)控井下的設(shè)備運(yùn)行情況。第二階段中,要能夠?qū)崿F(xiàn)從海量數(shù)據(jù)中提取出有規(guī)律性的和可預(yù)見(jiàn)性的經(jīng)驗(yàn),從而為決策者提供決策輔助。第三階段能實(shí)現(xiàn)海量數(shù)據(jù)的機(jī)器學(xué)習(xí)和無(wú)人參與的自動(dòng)調(diào)控。該系統(tǒng)目前可以實(shí)現(xiàn)B/S,C/S和移動(dòng)端三種展示方式,可以隨時(shí)隨地查看礦井生產(chǎn)數(shù)據(jù),掌握生產(chǎn)狀況,遠(yuǎn)程控制干預(yù),內(nèi)容更加全面、豐富和詳細(xì)。
寸草塔二礦一體化管控平臺(tái)所采集設(shè)備主要有北京朗威達(dá)移動(dòng)變電站、南京雙京饋電、淮南萬(wàn)泰饋電、電光饋電、南京雙京磁力啟動(dòng)器、淮南萬(wàn)泰磁力啟動(dòng)器、華寧控制器等,不同的廠家的數(shù)傳方式各有不同,電光廠家的設(shè)備使用的是偶校驗(yàn)和RS232方式傳輸,華寧控制器和礦壓OPC采用TCP方式傳輸,但是大多數(shù)設(shè)備使用的是RS485兩線制方式進(jìn)行數(shù)傳。
(1)終端設(shè)備與數(shù)傳服務(wù)器通訊不暢,一是終端設(shè)備的物理地址與實(shí)際不符;二是交換機(jī)或者串口服務(wù)器IP地址、網(wǎng)關(guān)設(shè)置、波特率設(shè)置不當(dāng)。
(2)通訊規(guī)約使用錯(cuò)誤,不同終端設(shè)備有著不同的通訊規(guī)約,比如初始寄存器地址、起始位、停止位、CRC校驗(yàn)等參數(shù)存在差異,一定要多查看設(shè)備說(shuō)明書(shū)或者多與廠家技術(shù)人員溝通。
(3)OPC服務(wù)器因軟件運(yùn)行時(shí)間長(zhǎng)或數(shù)據(jù)量過(guò)大而死機(jī)。這種情況會(huì)造成同子系統(tǒng)數(shù)據(jù)大面積卡死。
(4)未按照云臺(tái)帳設(shè)置IP地址、設(shè)備地址,造成地址沖突,導(dǎo)致數(shù)據(jù)傳輸中斷。
(5)遠(yuǎn)程控制設(shè)備發(fā)送命令下寫(xiě)執(zhí)行成功,但是返回錯(cuò)誤的確認(rèn)幀,可能存在I/O點(diǎn)表存在編輯錯(cuò)誤、數(shù)據(jù)類(lèi)型編輯錯(cuò)誤、執(zhí)行機(jī)構(gòu)未動(dòng)作等問(wèn)題導(dǎo)致。
(6)全雙工/半雙工不匹配導(dǎo)致丟包嚴(yán)重。存在這種情形對(duì)網(wǎng)絡(luò)性能造成很大的影響。雖然這種問(wèn)題在多數(shù)情況下容易被運(yùn)維人員忽視,當(dāng)遇到網(wǎng)絡(luò)流量較大時(shí),就會(huì)造成堵塞,造成丟包率高的原因。
(1)終端設(shè)備通訊模塊或保護(hù)器存在故障,這種故障往往發(fā)生在通訊接口接觸不良、內(nèi)部系統(tǒng)故障、極性接反等,都會(huì)造成通訊中斷。
(2)同類(lèi)設(shè)備型號(hào)不統(tǒng)一,更換設(shè)備后,存在設(shè)備通訊規(guī)約不一致,比如掘進(jìn)工作面搬家之前使用的是南京雙京饋電給掘錨機(jī)供電,搬家之后使用淮南萬(wàn)泰的同類(lèi)設(shè)備,如果不及時(shí)在KIO服務(wù)器和開(kāi)發(fā)后臺(tái)更改模型和點(diǎn)表,這會(huì)導(dǎo)致該供電設(shè)備保護(hù)器點(diǎn)表不一致,無(wú)法數(shù)傳。另外同一廠家不同版本的保護(hù)器通訊規(guī)約可能有所不同,比如淮南萬(wàn)泰2.0保護(hù)器與淮南萬(wàn)泰3.0保護(hù)器的點(diǎn)表也有所不同。
(3)交換機(jī)、串口服務(wù)器和采集模塊損壞,如電源、主板、后備電池等故障,造數(shù)據(jù)交換設(shè)備不能正常運(yùn)行,不能收、發(fā)數(shù)據(jù)。
(4)有的設(shè)備終端采用RS232接口,與之通訊要用到RS232轉(zhuǎn)RS485轉(zhuǎn)接器。若轉(zhuǎn)接器損壞,則無(wú)法正常識(shí)別收發(fā)數(shù)據(jù)。
(5)RS485通信最佳接線方式是采用串接,若使用其它接法,則會(huì)影響數(shù)據(jù)傳輸。如果使用非屏蔽的通訊線,在電磁場(chǎng)較大的配電點(diǎn)受到較為嚴(yán)重的干擾現(xiàn)象,導(dǎo)致無(wú)法正常收發(fā)數(shù)據(jù)。
(6)傳感器電池虧電,造成數(shù)傳中斷。尤其是依靠無(wú)線傳輸方式的傳感器由于周期性檢查不到位導(dǎo)致虧電,造成數(shù)據(jù)采集中斷。
一是部分設(shè)備數(shù)據(jù)不能上傳,問(wèn)題可能出在千兆交換機(jī)、串口服務(wù)器、通訊設(shè)置設(shè)置等方面;二是個(gè)別設(shè)備數(shù)據(jù)不能上傳,問(wèn)題可能出在上級(jí)電源無(wú)計(jì)劃斷電、保護(hù)器故障、RS485通信接口故障、RS232轉(zhuǎn)RS485轉(zhuǎn)接器故障、終端設(shè)備通訊設(shè)定等方面。三是數(shù)據(jù)刷新速度慢或數(shù)據(jù)不準(zhǔn)確,問(wèn)題可能出在信號(hào)受到干擾或多臺(tái)設(shè)備采用星接的錯(cuò)誤方式等方面。四是子系統(tǒng)數(shù)據(jù)通訊故障,問(wèn)題更有可能出現(xiàn)在數(shù)據(jù)上傳服務(wù)器的該子系統(tǒng)KIO應(yīng)用運(yùn)行卡死、無(wú)響應(yīng)等故障。
首先應(yīng)查看存在問(wèn)題設(shè)備的鏈路是否正常,PING一下串口服務(wù)器的地址,若地址長(zhǎng)時(shí)間接受不到信號(hào),數(shù)據(jù)包完全丟失,說(shuō)明物理鏈路出現(xiàn)故障,一是檢查供電是否正常,登陸后備電源管理系統(tǒng)查看設(shè)備狀態(tài),向責(zé)任區(qū)隊(duì)了解情況,盡快恢復(fù)供電。二是檢查該處千兆交換器光纖是否完好,對(duì)損壞光纜進(jìn)行熔接。三是檢查串口服務(wù)器的網(wǎng)線是否插好,并檢查3180MOXA模塊、3480MOXA模塊或者交換機(jī)是否損壞等等,最直觀的方法就是查看模塊通訊信號(hào)燈,使用替換法及時(shí)更換板卡或者模塊。四是通訊設(shè)置,嚴(yán)格參照設(shè)備廠家通訊規(guī)約進(jìn)行設(shè)置。五是RS485、RS232及TCP通訊接口存在故障,特別是RS485串口,從左到右分別是GND/T/R-、T/R+、DC+,作為數(shù)據(jù)傳輸時(shí),只需要用到GND/T/R-和T/R+,分別連接RS485設(shè)備的GND/A/B即可連接通訊。六是接線問(wèn)題,使用萬(wàn)用表測(cè)量各接線端子電壓,排除是否虛接線。RS232/RS485轉(zhuǎn)接器可用替代法進(jìn)行測(cè)試,要注意極性,通過(guò)模塊上的收、發(fā)指示燈判斷通信情況。七是采用合理的接線結(jié)構(gòu),使用“手拉手”串接,盡量避免星形接線。使用合格的屏蔽雙絞線。八是如果下發(fā)命令返回錯(cuò)誤或者無(wú)響應(yīng),應(yīng)到KIO對(duì)應(yīng)系統(tǒng)應(yīng)用中查看數(shù)傳命令歷史記錄,找到異步下寫(xiě)命令的報(bào)文,回溯至故障點(diǎn)位進(jìn)行修改,有的設(shè)備一條指令可能存在連續(xù)性的邏輯下發(fā)控制,過(guò)程中某處異常就會(huì)造成整個(gè)控制命令下發(fā)失敗。依照系統(tǒng)架構(gòu)思路,不斷縮小范圍,沿線排查、直至查出故障點(diǎn),根據(jù)實(shí)際情況處理,恢復(fù)鏈路通暢。
根據(jù)寸草塔二礦一體化管控平臺(tái)系統(tǒng)數(shù)據(jù)傳輸方面中出現(xiàn)的一些故障,進(jìn)行了梳理、分析及找出解決方法,遇到類(lèi)似問(wèn)題能夠第一時(shí)間處理故障,提升鏈路系統(tǒng)的可靠性,保障礦井一體化管控平臺(tái)的正常運(yùn)行。