張素琴 陳傳華 王建軍 趙旭東 何宇飛 李 琪 楊冬梅 胡秀娟
1)中國(guó)北京 100081 中國(guó)地震局地球物理研究所
2)中國(guó)山東 271000 山東省地震局泰安基準(zhǔn)地震臺(tái)
3)中國(guó)蘭州 730000 甘肅省地震局
4)中國(guó)河北 054000 河北省地震局紅山基準(zhǔn)地震臺(tái)
地磁場(chǎng)是一種全球性的地球物理場(chǎng),由起源于地表以下的磁性物質(zhì)和電流形成的內(nèi)源場(chǎng),以及起源于地表以上空間電流體系的外源場(chǎng)組成。因此,地磁觀測(cè)數(shù)據(jù)中包括著非常豐富的日地空間信息,決定了它在地球科學(xué)和空間科學(xué)研究中有著廣泛的應(yīng)用領(lǐng)域。時(shí)間分辨力為1 s—1 h 的觀測(cè)數(shù)據(jù),通常用于脈動(dòng)、鉤擾、灣擾、磁暴等各種短周期變化磁場(chǎng)的研究,用于日地空間電磁環(huán)境監(jiān)測(cè)與預(yù)報(bào)的研究,同時(shí)在地下電性結(jié)構(gòu)探測(cè)、震磁觀測(cè)研究等方面發(fā)揮著重要作用(楊冬梅,2001)。秒采樣數(shù)據(jù)在評(píng)估感應(yīng)電流(GIC)對(duì)地下金屬管網(wǎng)(劉連光等,2016)、輸電網(wǎng)絡(luò)(Kappenman,1996;Bolduc et al,1998,2002;Boteler et al,1998;張燕秉等,2004;劉連光等,2008;Wik et al,2008;Liu et al,2009;Guo et al,2015)、通信電纜、高鐵線路(劉連光等,2016)等重大工程項(xiàng)目影響方面也具有重要的應(yīng)用,發(fā)揮了良好的社會(huì)效益和經(jīng)濟(jì)效益。時(shí)間分辨力為1 h 至幾百年的觀測(cè)數(shù)據(jù),通常用于地磁場(chǎng)及其長(zhǎng)期變化的研究,如地磁急變、磁極移動(dòng)、極性倒轉(zhuǎn)、偶極磁矩變化、西向漂移、非偶極場(chǎng)強(qiáng)度變化等,對(duì)于認(rèn)識(shí)地核內(nèi)部及核幔邊界的物質(zhì)流動(dòng),探索地磁場(chǎng)的起源問題具有重要意義(徐文耀,2014)。地磁數(shù)據(jù)在探礦、導(dǎo)航等領(lǐng)域也有著重要的應(yīng)用。
地磁學(xué)的發(fā)展應(yīng)用有賴于長(zhǎng)期的資料積累,因此在可能的條件下應(yīng)盡量取得連續(xù)的完整的觀測(cè)資料(徐文耀,1997)。利用最新的科學(xué)技術(shù)手段,對(duì)盡可能長(zhǎng)的地磁連續(xù)觀測(cè)數(shù)據(jù)進(jìn)行研究和分析,從而獲取地磁物理場(chǎng)變化信息,一直是國(guó)內(nèi)外科研工作者常采用的方法。世界各國(guó)的科學(xué)家都非常重視觀測(cè)數(shù)據(jù)的積累和歷史數(shù)據(jù)的拯救工作。例如,最近俄羅斯日地物理學(xué)數(shù)據(jù)中心收集整理了前蘇聯(lián)1957 年7 月到20 世紀(jì)90 年代初的41 個(gè)地磁觀測(cè)站的K指數(shù)測(cè)定結(jié)果,涵蓋20 世紀(jì)后半葉,提供給國(guó)際科學(xué)界,用于對(duì)過去的地磁事件回顧性分析以及數(shù)據(jù)驗(yàn)證或預(yù)測(cè)的研究(Natalia Sergeyeva et al,2020)。葡萄牙科英布拉大學(xué)的學(xué)者也收集整理了1866 年建立的葡萄牙科英布拉地磁觀測(cè)站(COI)150 多年的歷史資料,包括磁偏角、水平分量、垂直分量的絕對(duì)月均值系列,并對(duì)數(shù)據(jù)進(jìn)行了人工校正和通化,將數(shù)據(jù)通化至2015 年的水平(Morozova et al,2020)。INTERMAGNET 發(fā)行了最后的物理介質(zhì)數(shù)據(jù),數(shù)據(jù)被存儲(chǔ)在USB 上,包含1991—2015 年期間全球地磁臺(tái)站傳輸?shù)絅TERMAGNET 的分采樣數(shù)據(jù)(Thomson,2020)。我國(guó)自20 世紀(jì)70 年代開始,相繼在各地開展了地磁場(chǎng)的模擬觀測(cè)。由于當(dāng)時(shí)條件的限制,1990 年以前的數(shù)據(jù)大部分是手工記錄在紙介質(zhì)上的,紙介質(zhì)資料無法通過計(jì)算機(jī)網(wǎng)絡(luò)傳遞,勢(shì)必對(duì)數(shù)據(jù)的共享和應(yīng)用造成影響。而且隨著時(shí)間的推移,這些寶貴的歷史資料面臨流失而無法整理的危險(xiǎn)。因此如何有效收集、整理這些資料,并用于科學(xué)研究,一直是我國(guó)科研工作者努力的方向(彭豐林等,2006;董星宏等,2009;趙秀寬等,2017)。然而由于實(shí)際條件限制,這些研究工作主要集中在某個(gè)地磁臺(tái)站,覆蓋范圍不夠廣。基于上述原因,也得益于“地震科學(xué)數(shù)據(jù)共享項(xiàng)目”的實(shí)施,項(xiàng)目組對(duì)我國(guó)最早開始觀測(cè)的8 個(gè)地磁臺(tái)站,即北京白家疃、佘山、長(zhǎng)春、拉薩、廣州、武漢、蘭州、烏魯木齊地磁臺(tái),俗稱為“老八臺(tái)”開展歷史資料的清理工作。“老八臺(tái)”的分布基本呈十字狀(程安龍,1995),承擔(dān)著監(jiān)測(cè)我國(guó)境內(nèi)地磁場(chǎng)時(shí)空變化規(guī)律的重要任務(wù)。因此將這些珍貴的歷史觀測(cè)數(shù)據(jù)整編、搶救出來,為科學(xué)研究和后人提供連續(xù)完整、準(zhǔn)確可靠的地磁場(chǎng)觀測(cè)數(shù)據(jù),對(duì)于研究各種地磁學(xué)現(xiàn)象,保護(hù)人類生命財(cái)產(chǎn)安全等具有重要的現(xiàn)實(shí)意義。本次工作重點(diǎn)收集清理了“老八臺(tái)”1985—1990 年期間的歷史資料,然后采用數(shù)碼拍照和人工錄入方式,實(shí)現(xiàn)紙質(zhì)資料數(shù)字化,同時(shí)研制數(shù)據(jù)入庫(kù)軟件,將梳理后的數(shù)據(jù)導(dǎo)入“十五”數(shù)據(jù)庫(kù),并進(jìn)行質(zhì)量審核,實(shí)現(xiàn)珍貴歷史資源的電子化、數(shù)據(jù)化、標(biāo)準(zhǔn)化和規(guī)范化。
1990 年以前的地磁數(shù)據(jù)大部分為手工記錄的紙介質(zhì)資料,隨著時(shí)間的遷移許多一線觀測(cè)臺(tái)站的資料散落遺失,地磁學(xué)科管理組因?yàn)樨?fù)責(zé)全國(guó)資料評(píng)比的原因,大部分臺(tái)站報(bào)送的觀測(cè)報(bào)告得以妥善保存,但仍有部分資料缺失。項(xiàng)目組首先根據(jù)地磁臺(tái)站建臺(tái)產(chǎn)出報(bào)告年代,清理臺(tái)站應(yīng)有資料的年份,然后從學(xué)科管理組資料庫(kù)、所在單位資料室查找相關(guān)資料,并發(fā)動(dòng)臺(tái)站,從單位自身查找缺失資料,將查找結(jié)果反饋至學(xué)科管理組。管理組對(duì)查找結(jié)果進(jìn)行系統(tǒng)梳理,盡可能將分散在各處的資料收集整合起來,保證觀測(cè)資料盡可能完整齊全。經(jīng)過近一年的梳理整合,本次工作完成了白家疃、佘山、長(zhǎng)春、拉薩、廣州、武漢、蘭州、烏魯木齊8 個(gè)地磁臺(tái)1985—1990 年期間歷史數(shù)據(jù)的清理,數(shù)據(jù)內(nèi)容由磁偏角(D)、水平強(qiáng)度(H)和垂直強(qiáng)度(Z)3 個(gè)要素的絕對(duì)時(shí)均值組成。
本數(shù)據(jù)庫(kù)(集)元數(shù)據(jù)簡(jiǎn)表見表1。

表1 數(shù)據(jù)庫(kù)(集)元數(shù)據(jù)簡(jiǎn)表Table 1 Metadata table of the geomagnetic datasets
采用500 萬像素?cái)?shù)碼相機(jī),借助燈光拍攝紙質(zhì)資料的照片(圖1),利用文字識(shí)別軟件對(duì)照片進(jìn)行識(shí)別,并與紙介質(zhì)數(shù)據(jù)進(jìn)行一致性核對(duì),發(fā)現(xiàn)軟件的文字識(shí)別效果不理想。因此,采用人工錄入方式實(shí)現(xiàn)紙質(zhì)資料的數(shù)字化。

圖1 紙質(zhì)資料照片F(xiàn)ig.1 Photos of observation reports
設(shè)計(jì)一套excel 模板,統(tǒng)一數(shù)據(jù)錄入格式。模板錄入?yún)?shù)包括D分量絕對(duì)時(shí)均值、H分量絕對(duì)時(shí)均值、Z分量絕對(duì)時(shí)均值、標(biāo)度值、標(biāo)準(zhǔn)變遷、基線值、日變幅7 個(gè)工作簿。每個(gè)絕對(duì)時(shí)均值錄入工作簿由14 個(gè)工作表組成,分別為錄入說明表、每年1—12 月的數(shù)據(jù)表和自動(dòng)匯總表。每月數(shù)據(jù)工作表又包含臺(tái)站代碼、測(cè)點(diǎn)ID、日期、大數(shù)、24 個(gè)時(shí)均值和一個(gè)日均值(圖2)。

圖2 數(shù)據(jù)錄入excel 模板Fig.2 Template for data input
研發(fā)“十五”數(shù)據(jù)庫(kù)數(shù)據(jù)導(dǎo)入軟件(具有參數(shù)配置、數(shù)據(jù)錄入、質(zhì)量監(jiān)測(cè)和查詢輸出的功能),實(shí)現(xiàn)數(shù)字化數(shù)據(jù)的入庫(kù)操作(圖3)。

圖3 數(shù)據(jù)導(dǎo)入軟件Fig.3 Software for data import
入庫(kù)后的數(shù)據(jù)可以按用戶需求格式導(dǎo)出保存。本數(shù)據(jù)集采用國(guó)際地磁與高空物理協(xié)會(huì)推薦的IAGA2002 國(guó)際通用磁數(shù)據(jù)交換格式(International Association of Geomagnetism and Aeronom,2003)。IAGA2002 的格式描述如下。
(1)12 個(gè)強(qiáng)制性和1 個(gè)可選文件頭記錄。第1 列以空格字符開頭,并在第70 列以豎線“|”結(jié)束,內(nèi)容標(biāo)簽從第2 列開始,描述從第25 列開始。
(2)可選的注釋記錄,用來記錄未包含在已定義字段中數(shù)據(jù)的重要信息。該注釋記錄在第1 列以空格字符開頭,第2 列以#開頭,每個(gè)記錄末尾用豎線“|”表示。
(3)1 個(gè)強(qiáng)制性數(shù)據(jù)頭記錄。該記錄內(nèi)容包括DATE(日期)、TIME(時(shí)間)和DOY(一年中的第幾天)。磁場(chǎng)要素標(biāo)頭包含4 個(gè)字母:3 個(gè)字母為IAGA 編碼,1 個(gè)字母為所報(bào)告的磁場(chǎng)要素。有效值為H、D(或E)、I(或V)、X、Y、Z、F(或G)。列標(biāo)題以空格分隔。每個(gè)記錄末尾用豎線“|”表示。
(4)一系列數(shù)據(jù)記錄。每條數(shù)據(jù)記錄長(zhǎng)70 個(gè)字符,包含報(bào)告的日期、時(shí)間和磁場(chǎng)要素以及回車符/換行符。數(shù)據(jù)記錄嚴(yán)格地報(bào)告4 個(gè)磁場(chǎng)要素(DHIF、DHZF 或 XYZF)。若少于4 個(gè)要素,則以相應(yīng)精度的99999(如99999.0 或99999.00)表示缺失數(shù)據(jù),未觀測(cè)數(shù)據(jù)則在該字段中用88888(至相應(yīng)的準(zhǔn)確度)表示。
(5)推薦的文件命名規(guī)則。文件名由2 部分組成,即基本名稱和3 個(gè)字符的擴(kuò)展名,使用句點(diǎn)將基本名稱與擴(kuò)展名分開。基本名稱最長(zhǎng)為27 個(gè)字符,擴(kuò)展名為3 個(gè)字符。文件名由小寫字母a—z、0—9、下劃線“_”和破折號(hào)“-”組成。文件名必須以IAGA 代碼(由3 個(gè)字母iag 組成)、日期和數(shù)據(jù)類型開頭,通用格式為iagyyyymmddtint.int,其中:iag 是各個(gè)地磁臺(tái)站根據(jù)IAGA 要求編寫的臺(tái)站代碼(3 個(gè)字母);yyyy=4 位年份;mm=2 位數(shù)月份;dd=2 位數(shù)天(01—31);t=類型數(shù)據(jù)(p:臨時(shí),d:確定,q:準(zhǔn),v:變化);int=數(shù)據(jù)間隔(mon:每月,day:每天,hor:每小時(shí),min:每分鐘,sec:每秒)。
本數(shù)據(jù)集的數(shù)據(jù)記錄來源于所選8 個(gè)國(guó)際地磁資料交換臺(tái)站1985—1990 年的資料(表2),數(shù)據(jù)內(nèi)容由磁偏角(D)、水平強(qiáng)度(H)和垂直強(qiáng)度(Z)3 個(gè)要素的絕對(duì)時(shí)均值組成。每月一個(gè)數(shù)據(jù)文件,文件由文件頭和數(shù)據(jù)組成。以北京白家疃地磁臺(tái)站1985 年數(shù)據(jù)為例,給出文件頭和數(shù)據(jù)樣例,見圖4、圖5,其中D分量單位為分(即角度′),H、Z、F分量單位為nT。

圖4 文件頭樣例Fig.4 An example of file header

圖5 數(shù)據(jù)樣例Fig.5 An example of data

表2 數(shù)據(jù)集中8 個(gè)地磁臺(tái)站信息Table 2 Information of 8 geomagnetic stations in the datasets
在數(shù)據(jù)集中選取1989 年1 月佘山、武漢(九峰)、廣州(肇慶)3 個(gè)臺(tái)站的磁偏角D、水平分量H、垂直分量Z時(shí)均值數(shù)據(jù),繪制數(shù)據(jù)曲線,結(jié)果見圖6—圖8,可見各分量有明顯的靜日和擾日變化形態(tài)。

圖6 佘山、九峰、肇慶地磁D 分量日變化曲線(1989 年1 月)Fig.6 Daily variation data for D component at observatories SSH,WHN and GZH(Jan.,1989)

圖7 佘山、九峰、肇慶地磁H 分量日變化曲線(1989 年1 月)Fig.7 Daily variation data for H component at observatories SSH,WHN and GZH(Jan.,1989)

圖8 佘山、九峰、肇慶地磁Z 分量日變化曲線(1989 年1 月)Fig.8 Daily variation data for Z component at observatories SSH,WHN and GZH(Jan.,1989)
將觀測(cè)數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù),采取計(jì)算機(jī)自動(dòng)處理和人機(jī)交互檢驗(yàn)的方法,評(píng)估觀測(cè)數(shù)據(jù)的完整性、日變形態(tài)的準(zhǔn)確度、長(zhǎng)趨勢(shì)變化的穩(wěn)定性,并從觀測(cè)環(huán)境、觀測(cè)系統(tǒng)、觀測(cè)技術(shù)、數(shù)據(jù)處理等方面,分析數(shù)據(jù)質(zhì)量影響因素,以便有效監(jiān)控觀測(cè)數(shù)據(jù)質(zhì)量。
完整率=(應(yīng)有觀測(cè)樣本數(shù)-原始缺記觀測(cè)樣本數(shù)-預(yù)處理刪除樣本數(shù))/應(yīng)有觀測(cè)樣本數(shù)。調(diào)查發(fā)現(xiàn),影響本數(shù)據(jù)集完整率的主要因素是儀器故障停測(cè),如拉薩地磁臺(tái)1989年因儀器故障暫時(shí)停止觀測(cè),并于1990 年恢復(fù)觀測(cè)(表2 備注)。表3 給出的是1985—1990 年8 個(gè)地磁臺(tái)站的數(shù)據(jù)完整率。

表3 1985—1990 年8 個(gè)臺(tái)站數(shù)據(jù)完整率Table 3 The data integrity of 8 geomagnetic stations from 1985 to 1990
鄰近臺(tái)站或同一經(jīng)度鏈磁場(chǎng)日變化形態(tài)具有較好的空間相關(guān)性,基于該原理,對(duì)本數(shù)據(jù)集中臺(tái)站絕對(duì)時(shí)均值數(shù)據(jù)日變化一致性進(jìn)行分析。選取分布在120°E 附近的北京、長(zhǎng)春、武漢(九峰)、廣州(肇慶)地磁臺(tái)站1985 年1 月記錄的D、H、Z三分量時(shí)均值數(shù)據(jù),繪制時(shí)序曲線,見圖9,可見同一經(jīng)度鏈的臺(tái)站地磁觀測(cè)數(shù)據(jù)日變形態(tài)一致性較好。

圖9 120°E 鏈附近北京、長(zhǎng)春、九峰、肇慶臺(tái)站三分量時(shí)均值日變化曲線(1989 年1 月)Fig.9 Hourly mean values curves for D,H and Z components at observatories BJI,CNH,WHN and GZH near 120° E(Jan.,1989)
地磁場(chǎng)的長(zhǎng)期變化主要受地球主磁場(chǎng)的控制,因此相鄰地磁臺(tái)記錄的長(zhǎng)期變化趨勢(shì)具有一定相關(guān)性。但由于地殼分布的不均勻性,當(dāng)臺(tái)站間的距離增大時(shí),其長(zhǎng)期變化趨勢(shì)又有差異,因此可繪制各臺(tái)站地磁日均值圖,通過對(duì)比鄰近臺(tái)或相關(guān)臺(tái)之間地磁日均值的分布形態(tài)和差值曲線,判斷臺(tái)站絕對(duì)日均值數(shù)據(jù)長(zhǎng)趨勢(shì)變化穩(wěn)定性,達(dá)到對(duì)資料質(zhì)量的檢驗(yàn)。選取分布在120°E 附近的北京、長(zhǎng)春、佘山、廣州(肇慶)4 個(gè)臺(tái)站1985—1990 年D、H、Z三分量日均值數(shù)據(jù),繪制時(shí)序曲線,結(jié)果見圖10,可見同一經(jīng)度鏈的地磁臺(tái)站記錄長(zhǎng)趨勢(shì)變化穩(wěn)定,一致性較好。

圖10 120°E 附近北京、長(zhǎng)春、九峰、肇慶臺(tái)站三分量日均值曲線Fig.10 Daily mean values curves for D,H and Z components at observatories BJI,CNH,SSH and GZH near 120°E
本數(shù)據(jù)集可用于開展地磁場(chǎng)建模、地磁圖編繪、主磁場(chǎng)及其長(zhǎng)期變化、地磁異常場(chǎng)分析等研究工作,直接或間接服務(wù)于導(dǎo)航、能源和礦產(chǎn)資源的探查;可用于開展磁暴特征和過程的研究工作,建立磁暴預(yù)報(bào)模型,為通訊、電網(wǎng)、高鐵、油氣管道、航空和空間天氣預(yù)警服務(wù);還可用于震磁異常信息監(jiān)測(cè)與提取,為地震監(jiān)測(cè)預(yù)測(cè)服務(wù)。
文中介紹了1985—1990 年8 個(gè)地磁基準(zhǔn)臺(tái)站地磁時(shí)均值數(shù)據(jù)集的獲取建立過程、質(zhì)量評(píng)價(jià)及應(yīng)用前景,數(shù)據(jù)集涉及的地理區(qū)域跨度大,對(duì)于地磁場(chǎng),尤其是主磁場(chǎng)及主磁場(chǎng)長(zhǎng)期變化的研究具有重要價(jià)值。紙質(zhì)資料的搶救是一項(xiàng)耗時(shí)費(fèi)力的工作,數(shù)據(jù)的收集、清理及數(shù)字化需要耗費(fèi)大量人力物力資源。在此次地磁歷史數(shù)據(jù)集的獲取過程中發(fā)現(xiàn)了較多問題,如:①因時(shí)間久遠(yuǎn),紙質(zhì)報(bào)表破損較多,有些報(bào)表中字體顏色不同程度地變淺,給正確識(shí)別帶來一定困難,只能采取人工鑒別方式錄入;②個(gè)別臺(tái)站信息不完整,為確定某個(gè)臺(tái)站信息,往往需要耗費(fèi)大量精力查詢資料;③受歷史、自然條件及其他原因制約,一些臺(tái)站資料已經(jīng)缺失,造成無法彌補(bǔ)的損失;④分析入庫(kù)數(shù)據(jù)發(fā)現(xiàn),一些臺(tái)站數(shù)據(jù)資料存在質(zhì)量問題,若不加以處理或標(biāo)注,將影響后續(xù)科研工作的開展。
針對(duì)數(shù)據(jù)集獲取過程中出現(xiàn)的問題和不足,計(jì)劃在下階段工作中對(duì)數(shù)據(jù)庫(kù)進(jìn)行綜合修改和完善,補(bǔ)充新的歷史觀測(cè)資料,并加強(qiáng)數(shù)據(jù)質(zhì)量審核工作。
地磁基準(zhǔn)臺(tái)站時(shí)均值1985—1990 年數(shù)據(jù)集是一項(xiàng)集成性成果,研究工作的順利開展與項(xiàng)目組全體成員的辛勤勞動(dòng)和共同努力是分不開的,在此對(duì)長(zhǎng)春地磁臺(tái)、烏魯木齊地磁臺(tái)、北京白家疃地磁臺(tái)、蘭州地磁臺(tái)、佘山地磁臺(tái)、武漢地磁臺(tái)、拉薩地磁臺(tái)、廣州地磁臺(tái)的工作人員表示衷心感謝。