胡五音,李 程
(南陽職業學院,河南 南陽 473000)
大數據技術是未來物聯網和工業互聯網建設的先進技術,能夠為工業生產和人民生活帶來巨大便利。基于大數據技術,衍生出了各類應用,例如目前工業企業中的各類移動應用,又比如生活中的App,每日產生的各類數據已經達到TB級別,我們已經處于大數據時代[1]。大數據處理技術和常規數據處理在數據的量級上存在巨大差異,其對于計算機對數據的處理性能要求也不是同級別的,因此若要使用大數據技術服務于生產和生活[2],就需要根據時代的發展需求,對計算機的硬件進行優化升級[3]。鑒于此,本文對大數據時代計算機硬件維護和故障處理技術進行了研究。
網絡和計算機的有效融合,能夠很大程度上提升工作效率,同時提升人們生活的質量。計算機的主要硬件組成可以分為:計算機主板、ROM和RAM、處理器、外界電源和驅動設備等。計算機硬件是其在程序運行和數據分析過程中的主要執行單元,是計算機運轉的核心部件。隨著大數據技術的不斷發展,大數據對于計算機的數據處理效率要求不斷提升,需要計算機能夠在短時間內高速處理大量數據。要想實現數據的快速處理,必須保證計算機硬件能夠穩定有效運行,這是保證數據處理的基礎。但是在日常應用過程中發現,計算機硬件在數據處理過程中可能會發生各類問題,進而導致故障的發生。硬件問題一旦發生,無法向解決軟件故障那樣,卸載重裝。硬件故障的出現往往會影響整個計算機系統,從而出現系統癱瘓和死機等情況。因此在大數據這樣一個數據為王的時代,必須保證與時俱進,最大限度地實現軟件運行效率的提升和故障的處理。
計算機維護工作是保障其可以正常運行,延長其使用壽命的常規操作。在大數據時代下,對計算機硬件進行日常維護需要按照相關原則,例如考慮軟件和硬件之間的兼容性,在使用過程中注意除濕和防塵等,在此基礎上要把握好以下幾個方面。
計算機硬件正常運行需要借助穩定的運行環境,防塵是計算機硬件的首要維護任務。灰塵是計算機硬件的天敵,灰塵的出現不僅會引發電路溫度升高,還會影響計算機的運行速度。因此對于計算機務必要做好防塵工作。二是,注意防潮防水,尤其是對于電容和二極管等電子元器件;對環境溫度進行必要控制,使其控制在20%~50%之間,并且硬件要遠離水壺等容易發生碰撞的物體。三是,要控制硬件的運行溫度,若計算機硬件的運行溫度較低,可能會使得計算機對于數據的存取和硬件的匹配出現矛盾,若溫度過高則會存在電子元器件燒毀的風險。所以對于計算機溫度的控制應該維持在15℃~35℃間,同時配置良好的通風散熱裝置,為其散熱創造良好的條件。
良好的使用習慣是保證硬件穩定運行的重要條件,對于硬件維護應該盡量采用完全獨立的電源裝置和穩定性好的插座設備。另外,在使用過程中應該按照相關操作流程進行合理的開機和關機操作,先開主機再開顯示器,等待后臺程序穩定運行之后再開展其他操作;在關閉計算機時,應該先關閉計算機前臺頁面,隨后關主機。若頁面還未全部關閉,不可對計算機執行強制關機。對于使用過程中產生的垃圾文件或者C盤內的臨時文件一定要盡量刪除,從而從存儲上保證計算機的使用性能。
近年來計算機硬件也趨于多樣化,因此硬件的維護應該更加具有針對性,才能夠適應硬件快速發展的基本要求。例如,在對計算機的核心部件進行維護時,需要重點關注處理器資源的合理配置,避免溫度過高以及并行開啟過多程序。鑒于主板和大量外界設備,如接口、電路、電容、電阻、擴展槽等互相連接,在計算機維護過程中務必需要保證原件接觸可靠性,例如要遵循主機電源線與其信號線彼此分離等原則。在對關鍵硬件設備進行維護時,需要保障線路的接觸部位不經受長期不規律的強烈的震動,還應該及時對不必要的灰塵進行及時處理,進而為提升計算機的性能做好基礎保障。對于顯示器的維護,應該避免出現重影現象,設置最優分辨率數值,不應對其過分調節,禁止使用水分或者酒精對其外表面進行擦拭,需要重點關注的是,在對光驅激光頭清洗的過程中,需要采用洗耳球設備,不應該采取常規清洗方法,規避由于光驅長時間損耗而導致硬件發生故障等問題。另外,對其他外接設備進行維護時,應該遵循定期常規維護的原則,對其進行縫隙雜物的配合,從而在一定程度上延長硬件的使用時長。
雖然目前已經掌握了計算機硬件維護方面的眾多技術,但在技術層面仍無法解決計算機硬件出現故障的問題,因此對于一些使用時間長,使用頻率高的硬件仍然會存在出現故障的概率,此時需要對計算機硬件的故障處理技術進行研究。
計算機硬件分類比較明確,常見的硬件主要分為內存條、處理器、主板、顯示器以及其他外接設備。計算機硬件和操作系統是支撐大數據平臺可以穩定運行的最基本條件,因此基礎硬件環境的穩定性決定著大數據平臺能否穩定高效的運行。經過近年的實際應用可以看出,在大數據背景下,計算機硬件的常見故障主要有以下幾點。
(1)RAM和ROM的內存條芯片損壞,但計算機無法及時檢測,從而導致計算機在處理TB或者PB級別的數據時,內存出現不足的情況,這不僅會導致計算機核心處理器發熱,還可能導致計算機死機或者重啟。RAM和ROM的另一個常見故障是金手指氧化或松動導致接觸不良,這種情況會導致計算機無法開機或花屏、藍屏,這種故障的特征比較明顯,也比較容易排除和解決。
(2)CPU故障。對于CPU的故障,其自身出現故障概率非常小,基本上均為人為原因,如針腳的接觸不良使得計算機不能開機,塵土較多或溫度較高導致計算機重啟或死機現象,超頻導致顯示屏黑屏等,從而導致計算機對于數據的收集檢索和處理等功能受到阻礙。
(3)主板和顯示器故障。主板故障基本上是和主板的使用年限有關,也可能是電壓不穩定或者發生電磁干擾現象所導致。在主板發生問題時,會導致計算機無法正常工作。顯示器故障基本上是由于顯示器熱量過高或者通風不良造成的,顯示器圖像掉幀頻繁,壽命縮短,若散熱不良還會導致顯示器的色彩失真,計算機運行質量便會受到影響。
在計算機發生故障后,要運用合理的檢測手段對其進行檢測和分析,同時利用最快的速度排查故障。對計算機硬件故障檢測的基本方法如下。
(1)觀察法。采用視覺、聽覺和嗅覺等對計算機的硬件進行常規檢查,判斷其是否存在異響或者異味等,為后續的故障診斷提供充分依據。但在診斷過程中,基本需要將多種感知技術共用,例如在計算機開機異常現象發生時,首先需要開機并判斷其是否發生三長一短的報警聲,并且要借助嗅覺判斷電路是否發生因短路而產生異味,同時經過觸摸后確定是否發生震動現象,同時還需要檢測屏幕是否發生故障等,所有故障的處置必須充分調動各類感知技術實現對以上信息的收集。
(2)增減法。增減法是指在故障診斷過程中,通過對計算機硬件的內部模塊進行增加或者減少,進而實現故障的診斷的過程。增減法的實現邏輯其實很簡單,在計算機出現問題的時候,可以先讓計算機以最簡單的結構來達到一個運行的狀態,比如只給主板通電,如果電流達到正常運行的標準再逐步增加顯卡、硬盤等模塊,直至將故障還原。簡單來說,這種方法就是通過逐步增加的方式,在使得計算機可以穩定運轉的前提下,逐一在主機上增加模塊。其次是在現有的計算機硬件前提條件下逐步減少硬件模塊的數量,在故障的狀態下,對各個模塊進行減法排除。比如計算機故障顯示為大短路的狀態,則應首先考慮南橋或者某個EC、濾波電容是否發生了短路,逐個拆除可疑的模塊來觀察故障是否消除。
(3)替換法。替換法是通過對出現異常的部件進行替換,從而快速鎖定問題部件。此種方法和前兩類方法相比,在問題診斷速度上會較快,但其檢測難度也相對較大,一般需要借助豐富的實踐經驗。在維修過程中,如果替換零件后故障消失,則說明所替換的零件是問題所在,如果替換零件后異常未解決,則應該繼續對其他零件進行排查。在很多情況下,想使用替換法快速解決問題,首先要讓故障的范圍縮小到一個很小的狀態,比如在將故障范圍縮小到某一主板區域時,可以使用強加合理電流的方式來“燒機”,用手摸的方式或者是借助于熱成像儀來確定哪一地方發熱嚴重。在大短路故障下,發熱嚴重的區域通常就是問題區域,在問題區域確定之后就可以直接采用替換法來替換掉可疑的元器件,進而解決故障。
大數據對人類的貢獻將會在未來幾十年內集中體現,大數據的問世對計算機軟件和硬件能力的提升提出了考驗。保證穩定的硬件運行環境對提升大數據的利用水平至關重要。穩定高效的傳輸是基于安全可靠的基礎環境實現的,因此如何預防故障,在故障發生后如何快速診斷故障和處置故障將會是未來的主要研究課題。另外,研究基于智能故障診斷和預測的技術,實現故障的提前預測,也將是未來的發展方向。