摘要:本文介紹了RAID 1技術,并結合RAID 1技術提出了對一些單硬盤DCS工作站(Distributed Control System)進行可靠性提升的改進方案,避免了單硬盤DCS工作站因硬盤單一故障導致不可用的情況,從而提高了工作站的可靠性。本文可為類似的DCS工作站改造提供借鑒。
關鍵詞:DCS工作站;冗余磁盤陣列;固態硬盤
1.概述
工作站是DCS系統的重要組成部分,其可靠性直接影響到DCS系統的運行。十年前投用的DCS系統一般選用的都是32位的機架式工作站。以某電廠選用的Dell Precision 5400為例,其配置為單塊機械硬盤,經過十年持續不斷的運行,現已到了故障高發期,而市面上新型的64位工作站無法與原有的DCS軟件兼容。如何提升工作站的可靠性是該電廠面臨的問題。本文介紹了一種通過配置磁盤冗余陣列、升級固態硬盤提升工作站可靠性的方案。
2.某電廠DCS工作站現狀
某電廠設計時其工作站選用的是Dell Precision 5400機架式工作站,配置單塊機械硬盤(實際硬盤槽位有兩個,支持冗余磁盤插口),未配置冗余磁盤陣列。現工作站已連續運行十年,硬盤作為連續運轉的主要部件,現到了故障的高發期。一旦出現硬盤故障,將導致站點離線,將對主控室操作、監視功能造成影響。若更換硬盤,需要重裝系統、打補丁,重新進行軟件配置等,大約需16小時左右,將影響電站的安全穩定運行。
一般對于工作十年以上的工作站故障,首選的是整體升級替換。調研發現Dell Precision 5400機架式工作站現已停產,目前Dell最新在售可選機架式工作站為Dell Precision R7920。根據官網配置選型,Dell Precision R7920可以選配RAID卡硬盤配置。在現工作站停產的情況下,若升級為新型號且具有磁盤冗余陣列的工作站,將大大提高工作站的可靠性。但進一步研究及實驗發現,目前官網Dell Precision Rack 7920工作站及市面上其它新型號的64位工作站均無法與原有的DCS軟件兼容,若將工作站整體升級,需要找DCS供貨商將DCS軟件同步升級,費用昂貴。如何在現有工作站的基礎上提高工作站的可靠性是該電廠目前需要解決的問題。
3.RAID1技術
RAID(Redundant Array of Independent Disks)即獨立磁盤冗余陣列,是由多個獨立的高性能磁盤驅動器組成的磁盤子系統,從而提供比單個磁盤更高的存儲性能和數據冗余的技術。RAID 的初衷是為大型服務器提供高端的存儲功能和冗余的數據安全。在整個系統中,RAID 被看作是由兩個或更多磁盤組成的存儲空間,通過并發地在多個磁盤上讀寫數據來提高存儲系統的 I/O 性能。大多數 RAID 等級具有完備的數據校驗、糾正措施,從而提高系統的容錯性,大大增強系統的可靠性。
RAID1磁盤陣列也稱為鏡像,它將數據完全一致地分別寫到“工作磁盤”和“鏡像磁盤”。RAID1磁盤陣列提供了很高的數據安全性和可用性,當一個硬盤失效時,系統可以自動切換到鏡像硬盤上讀/寫,并且不需要重組失效的數據。RAID 1磁盤陣列支持“熱交換”,就是說陣列中硬盤的移除或替換可以在系統運行時進行,無須中斷退出系統。RAID 1磁盤陣列是十分安全的,主要用在數據安全性很高,而且要求能夠快速恢復被破壞的數據的場合。
4.固態硬盤
固態硬盤(Solid State Disk或Solid State Drive,簡稱SSD),又稱固態驅動器,是用固態電子存儲芯片陣列制成的硬盤。與傳統的機械硬盤相比,其最大的優點是讀寫速度快,同時還有防震抗摔性好、無噪音、工作溫度范圍大等優點。
讀寫速度:固態硬盤持續讀寫速度可達到500MB/s,7200轉的機械硬盤的讀寫速度一般為100MB/s。與之相關的還有極低的存取時間,最常見的7200轉機械硬盤的尋道時間一般為12-14毫秒,而固態硬盤可以輕易達到0.1毫秒甚至更低。
防震抗摔性:傳統硬盤都是磁碟型的,數據儲存在磁碟扇區里。而固態硬盤是使用閃存顆粒(即MP3、U盤等存儲介質)制作而成,所以SSD固態硬盤內部不存在任何機械部件,這樣即使在高速移動甚至伴隨翻轉傾斜的情況下也不會影響到正常使用,而且在發生碰撞和震蕩時能夠將數據丟失的可能性降到最小。相較傳統硬盤,固態硬盤占有絕對優勢。
無噪音:固態硬盤沒有機械馬達和風扇,工作時噪音值為0分貝。基于閃存的固態硬盤在工作狀態下能耗和發熱量較低(但高端或大容量產品能耗會較高)。內部不存在任何機械活動部件,不會發生機械故障,也不怕碰撞、沖擊、振動。由于固態硬盤采用無機械部件的閃存芯片,所以具有了發熱量小、散熱快等特點。
工作溫度范圍大:典型的機械硬盤驅動器只能在5到55攝氏度范圍內工作。而大多數固態硬盤可在-10~70攝氏度工作。固態硬盤比同容量機械硬盤體積小、重量輕。固態硬盤的接口規范和定義、功能及使用方法上與普通硬盤的相同,在產品外形和尺寸上也與普通硬盤一致。其芯片的工作溫度范圍很寬(-40~85攝氏度)。
因此對于舊的DCS工作站,通過將機械硬盤替換為固態硬盤的方式也可以大幅提高其運行速度及綜合性能。
5.改進方案
本案例中的Dell Precision 5400機架式工作站,由于其支持冗余磁盤插口,只需采購對應的固態硬盤,完成RAID1磁盤陣列配置后,進行功能驗證即可。
對于不支持冗余磁盤插口的機架式工作站,需額外采購冗余磁盤陣列卡。步驟如下:
1) 安裝新的冗余磁盤陣列卡,使用SATA線纜直接連接新的冗余磁盤陣列卡至原SATA硬盤接口;
2) 在更換件Precision R5400中的啟動系統時進入相關BIOS配置硬盤,檢查是否可配置為RAID 1;
3)使用原有的DCS相關軟件對改造后的工作站進行重裝;
4)測試相關硬盤性能、整體系統性能。
改造后的工作站支持硬盤在線更換。出現故障后,相比原重裝的處理方式,大大降低了系統的不可用時間,從而保障了整個電廠的安全可靠運行,同時減少了維修工作量及運維成本。
6.結語
對于一些投用時間較長的DCS工作站,現在面臨著工作站停產、故障率高發諸多問題,影響了系統的安全可靠運行。本文結合已有的RAID 1冗余磁盤陣列技術及固態硬盤技術,提出了一種最低成本的改造方案,在提高工作站性能的同時,也消除了單一硬盤故障對系統不可用的影響。可為同類型的DCS工作站改造提供借鑒經驗。
參考文獻:
[1]周偉 劉琨.RAID技術在數據存儲中的應用研究[J].攀枝花學院學報.2006年(2).
[2]陳華英.磁盤陣列RAID可靠性分析[J].電子科技大學學報.2006(6)
作者簡介:何凡帆(1983-),男,供職于浙江省三門核電有限公司維修處,研究方向:數字化儀控系統。