全建軍 鄭永通 陳俊峰 王紹然 賴見(jiàn)深 鄭志泓 陳美梅 林慧卿
1) 福建省地震局永安地震臺(tái),福建永安 366000
2) 福建省地震局龍巖地震臺(tái),福建龍巖 364000
3) 福建省地震局漳州地震臺(tái),福建漳州 363100
計(jì)算機(jī)具有高效性、準(zhǔn)確性、時(shí)效性、先進(jìn)性等技術(shù)特點(diǎn),在應(yīng)用領(lǐng)域深受各行業(yè)包括地震部門(mén)的青睞。目前,地震臺(tái)站監(jiān)測(cè)與數(shù)據(jù)處理是以計(jì)算機(jī)為依托的工作平臺(tái),借助于網(wǎng)絡(luò)環(huán)境,實(shí)現(xiàn)臺(tái)站觀測(cè)人員對(duì)臺(tái)站所有觀測(cè)儀器數(shù)據(jù)采集、數(shù)據(jù)入庫(kù)、數(shù)據(jù)處理、數(shù)據(jù)分析和儀器運(yùn)行狀態(tài)進(jìn)行管理。尤其是地震前兆臺(tái)站計(jì)算機(jī)的硬件與操作系統(tǒng)及專(zhuān)業(yè)應(yīng)用軟件,在長(zhǎng)期臺(tái)站觀測(cè)運(yùn)行中容易出現(xiàn)一些故障,造成臺(tái)站計(jì)算機(jī)工作平臺(tái)運(yùn)行不正常,如:臺(tái)站計(jì)算機(jī)系統(tǒng)遭遇木馬或病毒攻擊,導(dǎo)致計(jì)算機(jī)無(wú)法運(yùn)行或死機(jī),影響到觀測(cè)資料的及時(shí)處理;或因臺(tái)站意外斷電或掉電,造成計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)受到影響。在日常運(yùn)維中,臺(tái)站計(jì)算機(jī)平臺(tái)如何采取合理的運(yùn)維方式,選擇正確、及時(shí)、高效的故障排除辦法,達(dá)到在計(jì)算機(jī)運(yùn)行平臺(tái)管控維護(hù)下,更好、更多方位做好臺(tái)站監(jiān)測(cè)工作,是當(dāng)前臺(tái)站計(jì)算機(jī)維護(hù)人員最渴望解決的關(guān)鍵問(wèn)題。
福建永安地震臺(tái)網(wǎng)絡(luò)平臺(tái)上現(xiàn)有9 臺(tái)計(jì)算機(jī),近幾年故障頻次較少,運(yùn)行率達(dá)99.5%以上。永安地震臺(tái)內(nèi)網(wǎng)計(jì)算機(jī)與福建省地震臺(tái)網(wǎng)中心相關(guān)服務(wù)器直接相連,承擔(dān)永安臺(tái)觀測(cè)數(shù)據(jù)采集、報(bào)送和數(shù)據(jù)共享、實(shí)時(shí)傳輸、地震會(huì)商、日常業(yè)務(wù)辦公等業(yè)務(wù)。
臺(tái)站計(jì)算機(jī)平臺(tái)由軟硬件系統(tǒng)構(gòu)成:硬件部分包括主板(CPU、主板、內(nèi)存儲(chǔ)器、多功能卡板)和外設(shè)(I/O 設(shè)備、外存儲(chǔ)器);軟件部分包括操作系統(tǒng)與專(zhuān)業(yè)應(yīng)用軟件。一旦臺(tái)站計(jì)算機(jī)系統(tǒng)出現(xiàn)問(wèn)題會(huì)是各式各樣的[1]。在臺(tái)站前兆數(shù)據(jù)計(jì)算機(jī)處理日常工作中,常遇到 “系統(tǒng)死機(jī)” “自動(dòng)關(guān)機(jī)” “藍(lán)屏” 等現(xiàn)象。顯然,這對(duì)臺(tái)站人員判斷故障類(lèi)型與處置方式有較高的要求,一定要具備豐富的計(jì)算機(jī)方面知識(shí)和分析判斷處置能力。因此,臺(tái)站計(jì)算機(jī)系統(tǒng)常見(jiàn)故障的排除和維護(hù)經(jīng)驗(yàn)十分重要。一旦臺(tái)站計(jì)算機(jī)出現(xiàn)問(wèn)題,根據(jù)不同故障現(xiàn)象快速準(zhǔn)確判斷計(jì)算機(jī)系統(tǒng)故障所在,盡快檢修排除故障,降低臺(tái)站計(jì)算機(jī)系統(tǒng)因故障造成的臺(tái)站監(jiān)測(cè)工作的影像,使之降低到最小程度。
在日常監(jiān)測(cè)工作中,臺(tái)站計(jì)算機(jī)系統(tǒng)設(shè)備因臺(tái)站突發(fā)斷電,導(dǎo)致計(jì)算機(jī)系統(tǒng) “停止運(yùn)行”,此時(shí),計(jì)算機(jī)內(nèi)部電源電壓會(huì)出現(xiàn)突變,這會(huì)對(duì)計(jì)算機(jī)器件或部件造成傷害,如:CPU、硬盤(pán)、穩(wěn)壓源電路電容、二極管器件等。處置辦法:臺(tái)站計(jì)算機(jī)系統(tǒng)平臺(tái)配置在線UPS 電源系統(tǒng),一旦出現(xiàn)電源故障,可應(yīng)急處置。臺(tái)站計(jì)算機(jī)系統(tǒng)電源應(yīng)選配Intel 公司ATX2.01 以上版本電源模塊,這可最大限度減小外界電源電壓波動(dòng)對(duì)計(jì)算機(jī)的影響。
當(dāng)臺(tái)站出現(xiàn)瞬間斷電,若計(jì)算機(jī)系統(tǒng)磁盤(pán)正在執(zhí)行讀寫(xiě)命令,極易導(dǎo)致數(shù)據(jù)磁道損壞發(fā)生;若正在進(jìn)行文檔編輯,則會(huì)導(dǎo)致編輯數(shù)據(jù)丟失。處置辦法:計(jì)算機(jī)在進(jìn)行Word 編輯時(shí),應(yīng)先勾選Word 自動(dòng)存儲(chǔ) √ 選項(xiàng)。其次,對(duì)磁盤(pán)執(zhí)行讀寫(xiě)突遇停電情況,應(yīng)重啟運(yùn)行模式,嚴(yán)格執(zhí)行磁盤(pán)自檢步驟操作,檢查磁道是否受損,若發(fā)現(xiàn)磁盤(pán)磁道受損,可通過(guò)Victoria、Pqmagic 等常用軟件對(duì)受損磁道修復(fù)或?qū)⑹軗p磁道屏蔽[2](圖1)。也可使用Victoria 命令修復(fù)硬盤(pán),具體步驟:①一般情況下,請(qǐng)從 “測(cè)試” 右下角的 “忽略” “重新映射” 和 “恢復(fù)” 選項(xiàng)中選擇 “重新映射” 。ERASE 主要是擦除掃描的壞磁道,可以修復(fù)一些CRC 錯(cuò)誤,也就是我們常說(shuō)的邏輯錯(cuò)誤,或不是問(wèn)題很?chē)?yán)重的磁道壞塊。REMAP 可重新定義壞塊LBA地址,將原有地址寫(xiě)入硬盤(pán)G-List,硬盤(pán)在生產(chǎn)時(shí)應(yīng)有充足的預(yù)留容量。這種功能可保留容量中好地址替換壞磁塊。② 如果硬盤(pán)上有大量色塊,可先使用ERASE 功能擦除整個(gè)磁盤(pán),看能否減少壞磁道,然后,使用REMAP 功能。在超時(shí)欄中填寫(xiě)適當(dāng)?shù)某瑫r(shí)值,默認(rèn)值1000 ms,建成250 ms 磁道,多次掃描修改成150 ms,大多數(shù)色塊掃描在G 表中。

圖1 臺(tái)站計(jì)算機(jī)系統(tǒng)使用工具軟件對(duì)磁盤(pán)壞磁道進(jìn)行修復(fù)界面Fig.1 Using software to repair bad sectors of the disk
如條件允許的話,可給每一臺(tái)計(jì)算機(jī)配置一臺(tái)UPS(1 kV)電源,以保障計(jì)算機(jī)電源穩(wěn)定可靠,提供臺(tái)站計(jì)算機(jī)在線UPS 電源是十分必要的。
臺(tái)站計(jì)算機(jī)在日常工作中,時(shí)常會(huì)發(fā)生瞬間操作系統(tǒng)停止或系統(tǒng)重啟現(xiàn)象。計(jì)算機(jī)主板對(duì)CPU 處理器有實(shí)時(shí)溫度監(jiān)控功能,如計(jì)算機(jī)運(yùn)行時(shí)間過(guò)長(zhǎng),主板CPU 會(huì)升溫異常,因此,計(jì)算機(jī)主板BIOS 應(yīng)設(shè)置合理閾值,使CPU 主板自動(dòng)對(duì)內(nèi)部電源模塊提供散熱隔熱功能或自動(dòng)關(guān)機(jī)功能,避免內(nèi)部器件過(guò)熱受損。另外,計(jì)算機(jī)操作系統(tǒng)電源管理軟件或部分軟件遭病毒感染,也會(huì)出現(xiàn)上述故障。處置辦法:首先排查CPU 溫度監(jiān)控及散熱功能有無(wú)異常,其次,進(jìn)入主機(jī)內(nèi)部排查風(fēng)扇葉片有無(wú)異常,最后進(jìn)入BIOS 選項(xiàng)查看風(fēng)扇轉(zhuǎn)速與CPU 工作溫度變化有無(wú)關(guān)聯(lián)。若風(fēng)扇故障,應(yīng)及時(shí)對(duì)風(fēng)扇進(jìn)行消塵操作或更換散熱風(fēng)扇。若檢測(cè)判斷為非硬件問(wèn)題,可通過(guò)Windows 系統(tǒng)盤(pán)對(duì)計(jì)算機(jī)操作系統(tǒng)的電源管理軟件進(jìn)行重裝,或徹底進(jìn)行殺毒操作。
在上述因素排除后,其他故障可能因電源模塊性能變差或已部分受損。處置辦法:應(yīng)及時(shí)更換計(jì)算機(jī)電源模塊,強(qiáng)制帶病的電源模塊停止工作,避免臺(tái)站計(jì)算機(jī)硬件造成不可逆的損失。
在臺(tái)站計(jì)算機(jī)日常監(jiān)測(cè)工作中,經(jīng)常會(huì)遇到計(jì)算機(jī)桌面無(wú)端鎖住,點(diǎn)擊鼠標(biāo)左右上下均無(wú)反應(yīng),甚至熱啟動(dòng)也無(wú)法正常運(yùn)行,同時(shí)還會(huì)遇到計(jì)算機(jī)顯示終端出現(xiàn)藍(lán)屏情況(圖2)。分析原因:可能Windows操作系統(tǒng)自帶程序出錯(cuò)或其他軟件的兼容性出錯(cuò);也有可能是工作人員在使用臺(tái)站計(jì)算機(jī)時(shí),短時(shí)間內(nèi)開(kāi)啟多進(jìn)程、多程序,造成計(jì)算機(jī)系統(tǒng)出現(xiàn)阻塞,導(dǎo)致計(jì)算機(jī)系統(tǒng)死機(jī)或出現(xiàn)藍(lán)屏。

圖2 臺(tái)站計(jì)算機(jī)顯示終端出現(xiàn)藍(lán)屏故障Fig.2 A blue screen failure occurred on the computer
處置辦法:臺(tái)站計(jì)算機(jī)系統(tǒng)出現(xiàn)死機(jī)情況,可通過(guò)小鍵盤(pán)區(qū)Numlock 鍵操作辨認(rèn),再查看Numlock鍵指示燈是否發(fā)生改變,若有變化,則是死機(jī)假象,可進(jìn)行ALT+CTRL+DEL 3 個(gè)鍵同時(shí)按下操作,重啟系統(tǒng),查看屏幕顯示任務(wù)列表的程序狀態(tài),若無(wú)法響應(yīng)程序項(xiàng)選定,點(diǎn)擊使其程序結(jié)束運(yùn)行;若出現(xiàn)計(jì)算機(jī)系統(tǒng)死機(jī),只能關(guān)閉電源,冷啟動(dòng)解決問(wèn)題。針對(duì)常出現(xiàn)藍(lán)屏故障,可按ESC 鍵操作,若沒(méi)效果,可執(zhí)行ALT+CTRL+DEL 熱重啟操作,或按動(dòng)主機(jī)上的復(fù)位按鈕。至于軟件的兼容性問(wèn)題,也可通過(guò)卸載 “問(wèn)題” 程序或軟件和升級(jí)主板BIOS 及有關(guān)驅(qū)動(dòng)程序排除故障。
臺(tái)站計(jì)算機(jī)長(zhǎng)時(shí)間在網(wǎng)運(yùn)行時(shí),時(shí)常會(huì)出現(xiàn)指令響應(yīng)滯后,主機(jī)死機(jī),硬盤(pán)指示燈異常閃爍,藍(lán)屏頻繁和許多非正常系統(tǒng)告警等現(xiàn)象(圖3)。計(jì)算機(jī)病毒其實(shí)是一類(lèi)惡意的攻擊計(jì)算機(jī)的程序代碼,病毒利用自身代碼重復(fù)頻繁復(fù)制,潛入計(jì)算機(jī)系統(tǒng)內(nèi)私下運(yùn)行,導(dǎo)致計(jì)算機(jī)系統(tǒng)空間資源被占用,情況危急時(shí)造成計(jì)算機(jī)軟、硬件系統(tǒng)的崩潰,如Petya,硬盤(pán)炸彈等病毒。

圖3 計(jì)算機(jī)系統(tǒng)出現(xiàn)中毒顯屏上彈出很多無(wú)用窗口Fig.3 Windows pop up after computer poisoning
處置辦法:判斷計(jì)算機(jī)系統(tǒng)已中毒,應(yīng)在計(jì)算機(jī)操作系統(tǒng)下重啟DOS 環(huán)境,運(yùn)行殺毒程序(DOS版),進(jìn)行殺毒解決;完畢后,重啟返回Windows 操作系統(tǒng)下,運(yùn)行桌面殺毒程序(Windows 版本)進(jìn)行二次殺毒處置。若臺(tái)站計(jì)算機(jī)系統(tǒng)受病毒感染面廣、影響較大,甚至造成部分文件損壞時(shí),需在病毒初發(fā)有些影響時(shí),及時(shí)備份關(guān)鍵文件,并存儲(chǔ)到系統(tǒng)盤(pán)外的其他介質(zhì)(USB 盤(pán)、硬盤(pán))上;將數(shù)據(jù)文件屬性設(shè)置為只讀模式。
臺(tái)站工作人員應(yīng)經(jīng)常進(jìn)行計(jì)算機(jī)桌面殺毒軟件病毒庫(kù)升級(jí),杜絕使用盜版應(yīng)用軟件,嚴(yán)禁打開(kāi)來(lái)路不明的電子郵件等。
臺(tái)站計(jì)算機(jī)系統(tǒng)出現(xiàn)無(wú)法進(jìn)入操作系統(tǒng)故障問(wèn)題時(shí),應(yīng)在完成系統(tǒng)自檢時(shí),系統(tǒng)運(yùn)行應(yīng)停止;顯屏上出現(xiàn) “The disk is error” 等告警界面,造成此現(xiàn)象很復(fù)雜,最有可能是操作系統(tǒng)文件出現(xiàn)改動(dòng)、損毀,也有可能是運(yùn)行指令出現(xiàn)異常,造成計(jì)算機(jī)硬盤(pán)故障。
處置辦法:首先,將臺(tái)站計(jì)算機(jī)操作系統(tǒng)運(yùn)行進(jìn)入系統(tǒng)安全模式,即主機(jī)運(yùn)行選擇F8 鍵,再按下啟動(dòng)目錄中第3 個(gè)選項(xiàng):Safe model。系統(tǒng)運(yùn)行安全模式,利用設(shè)備管理器及文件目錄查看軟件進(jìn)行故障排查,若發(fā)現(xiàn)系統(tǒng)文件有 “!” 號(hào),應(yīng)仔細(xì)查看,選擇刪除或停止運(yùn)行;將驅(qū)動(dòng)程序重新安裝,若再次出現(xiàn)系統(tǒng)文件出錯(cuò),可采取安裝軟件文件加以覆蓋。若計(jì)算機(jī)無(wú)法進(jìn)入安全模式運(yùn)行,則用帶啟動(dòng)程序光盤(pán)運(yùn)行至DOS 系統(tǒng),在DOS 系統(tǒng)環(huán)境下運(yùn)行查殺病毒軟件,再通過(guò)Dir 命令查看系統(tǒng)盤(pán)中有無(wú)缺失文件,必要時(shí)專(zhuān)業(yè)應(yīng)用系統(tǒng)軟盤(pán)實(shí)施Sys C:,修復(fù)缺失系統(tǒng)基礎(chǔ)文件。如果在C 盤(pán)根目錄下未發(fā)現(xiàn)系統(tǒng)文件,則需對(duì)計(jì)算機(jī)系統(tǒng)軟件重新安裝。
目前,我國(guó)大多數(shù)基準(zhǔn)臺(tái)承擔(dān)著國(guó)家大震速報(bào)任務(wù)。在大震速報(bào)操作時(shí),需使用專(zhuān)業(yè)軟件將分析結(jié)果壓縮后,發(fā)送到省地震臺(tái)數(shù)據(jù)服務(wù)器。在日常工作中,若發(fā)現(xiàn)專(zhuān)業(yè)軟件運(yùn)行無(wú)法正常連接到省地震臺(tái)網(wǎng)中心指定地址。應(yīng)及時(shí)查看本機(jī)的防火墻設(shè)置,必要時(shí)關(guān)閉防火墻,可解決此類(lèi)故障;若關(guān)閉防火墻后,依舊無(wú)法連接到目標(biāo)地址,可將計(jì)算機(jī)脫離路由器,直接接入行業(yè)網(wǎng)。
一些臺(tái)站使用一臺(tái)計(jì)算機(jī)作為地震到來(lái)的報(bào)警器,當(dāng)多個(gè)臺(tái)站信號(hào)振幅均超過(guò)閥值時(shí),警報(bào)器開(kāi)始地震語(yǔ)音報(bào)警或聲光警示,提醒臺(tái)站人員需注意。此類(lèi)告警裝置一般是基于Java 軟件設(shè)計(jì)的,初始安裝處于正常運(yùn)行狀態(tài),一旦出現(xiàn)故障或Java 在瀏覽器中運(yùn)行時(shí),出現(xiàn)瀏覽器自身的缺省JVM,而不同瀏覽器對(duì)JDK 的支持程度高低不同以及在Netscape 或IE 瀏覽器中運(yùn)行Java 發(fā)生故障時(shí),可通過(guò)JDK 提供的工具AppletViewer 或Sun 公司的HotJava 瀏覽器來(lái)支持,即測(cè)試Applet,判斷臺(tái)站計(jì)算機(jī)系統(tǒng)故障與瀏覽器是否有關(guān)。假如Applet 在AppletViewer 或HotJava運(yùn)行沒(méi)問(wèn)題,那么故障出現(xiàn)就是瀏覽器不完整,或兼容JDK 性能差所致。解決方法:安裝HotJava 瀏覽器或安裝Sun 公司的Java Plugin;倘若Applet 在Applet-Viewer 中或HotJava 瀏覽器運(yùn)行發(fā)生故障,應(yīng)按照錯(cuò)誤提示查看Applet 程序。一般情況下,按上述操作故障會(huì)得到排除,若仍未解決,則需檢查臺(tái)站外線網(wǎng)絡(luò)通信鏈路是否異常。
臺(tái)站使用計(jì)算機(jī)是做好臺(tái)站地震監(jiān)測(cè)、數(shù)據(jù)處理的重要平臺(tái)。維護(hù)好臺(tái)站計(jì)算機(jī)及系統(tǒng)十分重要,判斷計(jì)算機(jī)系統(tǒng)故障所在,及時(shí)處置計(jì)算機(jī)及系統(tǒng),是臺(tái)站日常維護(hù)工作的一項(xiàng)重要內(nèi)容[3]。臺(tái)站計(jì)算機(jī)系統(tǒng)日常維護(hù)包含以下幾個(gè)方面:
(1)計(jì)算機(jī)清塵工作,主機(jī)內(nèi)配的驅(qū)熱散熱裝置,在計(jì)算機(jī)工作一段時(shí)間后,會(huì)出現(xiàn)大量灰塵,需定期對(duì)灰層進(jìn)行清理,保證計(jì)算機(jī)穩(wěn)定運(yùn)行,通風(fēng)散熱通暢。
(2)強(qiáng)化對(duì)計(jì)算機(jī)環(huán)境的維護(hù)清潔,計(jì)算機(jī)易受環(huán)境因素的影響,尤其是環(huán)境溫度,計(jì)算機(jī)內(nèi)部各類(lèi)芯片運(yùn)行穩(wěn)定性一定程度上對(duì)溫度要求十分苛刻,由于溫度變化易產(chǎn)生靜電,調(diào)節(jié)合適溫度能有效降低靜電影響。
(3)合理掌握計(jì)算機(jī)運(yùn)行時(shí)長(zhǎng),超負(fù)荷運(yùn)行計(jì)算機(jī)會(huì)降低使用性能及壽命,臺(tái)站計(jì)算機(jī)運(yùn)行務(wù)必遵守相關(guān)規(guī)范性操作要求,如遇特殊雷電、暴雨天氣及時(shí)切斷電源,保證計(jì)算機(jī)的安全,免遭雷電影響。
隨著現(xiàn)代科學(xué)技術(shù)水平的不斷進(jìn)步,計(jì)算機(jī)已在全國(guó)地震臺(tái)站廣泛使用。地震儀器的數(shù)字化、網(wǎng)絡(luò)化都離不開(kāi)計(jì)算機(jī)的應(yīng)用,而計(jì)算機(jī)應(yīng)用也會(huì)帶來(lái)很多問(wèn)題,所以,臺(tái)站人員不能單純依靠計(jì)算機(jī)公司技術(shù)人員來(lái)解決臺(tái)站計(jì)算機(jī)出現(xiàn)的故障,應(yīng)逐步熟悉掌握計(jì)算機(jī)系統(tǒng)的基本功能和性能,分析判斷計(jì)算機(jī)及系統(tǒng)的常見(jiàn)幾類(lèi)故障現(xiàn)象,尤其是在使用專(zhuān)業(yè)軟件與工具時(shí),準(zhǔn)確分析判斷計(jì)算機(jī)系統(tǒng)出現(xiàn)的故障,并具有及時(shí)處置排除的能力十分重要。
通常,從在開(kāi)始工作中遇到計(jì)算機(jī)發(fā)生故障時(shí)的無(wú)從下手,到后來(lái)的逐步熟悉了解。因此,在新時(shí)期下現(xiàn)代化地震臺(tái)站發(fā)展中,努力提高臺(tái)站人員計(jì)算機(jī)常見(jiàn)故障處置能力與計(jì)算機(jī)系統(tǒng)日常維護(hù)管理水平是當(dāng)前臺(tái)站的一項(xiàng)重要工作任務(wù),我們?nèi)沃囟肋h(yuǎn)。