周忠超,劉曦元
(國家無線電監測中心云南監測站,昆明 650031)
在大數據時代背景下,我們對于信息的獲取,已不僅僅滿足于數據表面,而是需要對這些數據進行加工、深度挖掘才能使數據體現出價值,從而為未來工作決策做出正確的判斷和提出預見性的建議。目前,隨著無線電監測基礎數據的大量積累,數據挖掘在無線電監測管理工作中顯得尤為重要,應用愈加廣泛。對短波監測而言,除了掌握和獲取短波信號動態,如何對這些監測數據進行深度挖掘,從而優化常規監測方法,更為科學高效地實現短波頻段資源監管,為頻譜管理提供決策支撐,是未來短波監測工作的又一個重要內容。
短波通信是指利用波長為100-10m(頻率為3-30MHz)的電磁波進行的無線電通信。短波通信主要是利用不易被“摧毀”的“中繼系統”電離層的反射來進行,具有傳輸距離遠、機動重建性好、成本低廉、容易實現等優點,廣泛應用于政府、軍事、外交、氣象等領域。為了更好地掌握短波頻段電臺設置情況、頻率使用情況,合理進行頻譜資源配置,為短波頻譜管理工作提供數據支撐,開展短波監測意義重大。日常短波監測工作所關注的主要參數有:電臺呼號、發射地點、時間、發射頻率、所屬業務類型等。短波監測數據分析挖掘,主要分為兩部分:研究監測周期內各參數自身的變化趨勢;與其他外部因素之間的關聯性等。
在進行短波監測數據分析與挖掘時,假設研究的參數為n個,其具體分析步驟如下:(注:以下對研究參數本身周期內變化規律分析稱為:內部分析;對研究參數與其他參數之間的關系分析稱為:外部分析。)首先,進行內部分析。對所研究的n個參數,在一定周期內單獨對每個參數進行統計與分析,以便觀察其自身變化情況;其次,進行單因素外部分析。先選擇其中一個參數(有Cn1種選擇)作為研究對象,與另外n-1個參數之間進行探究分析,共有(n-1)*Cn1種選擇,如:選擇電臺呼號為研究對象,對于同一個電臺呼號,對其出現的時段、發射頻率、位置、業務類型的分布分別進行統計,以便掌握某電臺的發射特征及規律;然后,進行雙因素外部分析。在第二步的基礎上繼續推進,再次選擇一個參數(有Cn-11種選擇)與另外n-2個參數之間的聯系探究,共有(n-2)*Cn-11種選擇,如:選擇發射頻率為第二個研究參數,對使用某一發射頻率的某一電臺,對其出現的時段、位置、業務類型,進行統計分析;最后,逐步縮小范圍,進行n-1因素外部分析。對n-1個參數與另外一個參數之間的聯系探究,共有1種選擇,由此可以找到精確地規律,最終挖掘出具有足夠信息量、清晰具體的信息條目,找到一條完整的涉及所有參數項目的信息。具體流程如圖1所示:

圖1 短波數據挖掘基本流程
下面以電臺呼號、發射地點、時間、發射頻率、所屬業務類型這5個基本參數為例,運用以上數據挖掘方法進行統計分析。(注:由于監測數據為敏感信息,以下示例中,涉及到的具體名稱、數據均以字母表示。)
選擇電臺呼號為研究對象,分析統計周期內電臺呼號的個數以及每個出現的次數,假設電臺呼號情況如表1所示:(現設電臺名稱為:XX、YY、ZZ,出現次數為:a、b、c,下同)

表1 電臺呼號
內部分析,對于監測周期內電臺呼號分布情況進行了統計分析,可以得出統計周期內,存在3個電臺,分別為:XX,YY,ZZ。以下外部分析,繼續以電臺呼號為研究對象,以XX電臺為例,現選擇發射頻率作為一個外部因素,來分析電臺呼號與發射頻率之間的關系。XX電臺,對其發射頻率分布進行統計,可以按特定頻率間隔分段統計,假設XX電臺的頻率分布情況如表2所示:

表2 發射頻率
基于單因素外部分析的結果,得到以下組合:對3-10MHz頻段的XX電臺,進行分析;對10-20MHz頻段的XX電臺,進行分析;對20-30MHz頻段的XX電臺,進行分析。選擇另一個外部因素:發射時間,進行雙因素外部分析,以3-10MHz為例,對3-10MHz頻段的XX電臺,對其發射時間進行統計,假設其發射時間分布情況如表3所示。

表3 發射時間
基于雙因素外部分析結果,得到以下組合:
對3-10MHz頻段、0-8h的XX電臺,進行分析;對3-10MHz頻段、8-16 h的XX電臺,進行分析;對3-10MHz頻段、16-24h的XX電臺,進行分析。對10-20MHz、20-30MHz頻段的分析跟0-10MHz類似。選擇另一個外部因素為:發射位置,進行三因素外部分析。例如:對3-10MHz頻段、0-8h的XX電臺,對其發射位置進行分析。假設其發射位置分布情況如表4所示(發射位置分別記為:M、N,次數為:a,b)。

表4 發射位置
基于三因素外部分析結果,得到以下組合:對3-10MHz頻段、0-8h、M地區的XX電臺,進行分析;對3-10MHz頻段、0-8h、N地區的XX電臺,進行分析。對10-20MHz、20-30MHz頻段、8-16h、16-24h的分析跟以上類似。
選擇最后一個外部因素為:業務類型,進行四因素外部分析。無線電業務類型,是根據各頻段信號的用途、場景來進行的劃分。主要有:廣播業務、固定業務、航空移動業務等,對業務類型進行分類統計能夠掌握其業務分布規律,更高效地進行無線電監管。
例如:對0-10MHz頻段、0-8h、M地區的XX電臺,對其業務類型進行分析:假設其分布情況如表5所示(業務類型以廣播和固定業務為例,次數設為:a,b)。
以上完成了5個研究參數的數據挖掘,可以得出如下所示的信息:如:對0-10MHz頻段、0-8h、M地區的XX電臺,其業務類型分布情況如表5所示。

表5 業務類型
該條信息完整包含了5個研究參數的具體內容,實現了從監測數據表中,提取具體、有價值信息的目的,將零散的信息匯總成一條條完整的信息條目,有利于進行頻譜數據分析。
本文介紹了一種基于短波監測數據表進行的數據分析挖掘的方法,通過分析各個參數內部關系、與其他參數之間的聯系來進行多維的數據分析,有利于從繁雜的數據表中提取信息,最終形成大量有效的信息流,便于進行監測數據分析,為頻譜管理提供依據。