何 崢
(中國人民解放軍新疆軍區南疆軍區信息保障隊,新疆 喀什 844000)
云計算服務能由使用者本人選擇內容和方式,以便更好地利用現有資源來學習,除了能為學習者帶來便利外,還能降低教育管理的成本,使傳統教育模式發生改變。 如何融合網絡環境中的共享數據,提升網絡學習的效率,強化信息資料之間的共享,成為當前需要討論的問題。
網絡時代的到來雖然使人們能從網絡上獲得更多的信息,但是同時也讓信息愈發碎片化,而數據融合能夠有效解決該問題。 數據融合的目的在于對碎片化的信息,按照最終的目的與需求進行重新提取與融合,形成一個數據資源集合,以達到信息使用者所要達到的目的。 但在這一過程中,如果信息數據的標準傳輸模式出現差錯,就容易產生信息孤島問題。 網絡學習環境是孤島問題多發區, 因此作為跨學科領域,數據融合需要考慮多種復雜因素,并且有必要建立信息標準體系,以防止數據共享過程出現問題。
大數據時代的數據融合是多方向的信息匯總,其中包括傳統科學和新興科學, 傳統科學類目中主要包括數學、通信以及計算機網絡,新興科學則主要包括機器學習、人工智能和在線溝通等項目。 在數據融合中,主要的技術有假設檢驗、聚類分析和機器學習,用這些技術對數據庫進行分析,屬于決策級別融合。隨著互聯網的發展, 網絡學習環境的數據構建主要用到同類與異類數據的融合。 同類與異類的融合能起到數據歸納的效果,進行有效信息的壓縮和聚集,在計算機數據系統中通常使用決策樹和神經網絡法的方式來表示。
(1)需求定義。 需求定義也就是學習者線上學習的方向,即用戶需求,只有清楚定義要解決的問題,明確了方向才能提取出數據庫中能夠利用的數據,從而建立基于有效的數據模型。
(2)數據預處理。 在進行數據分析之前,數據預處理是數據融合的關鍵步驟,因為數據庫中的數據類型是多種多樣的,用戶的需求確定以后,預處理就顯得更加重要。 數據預處理主要包括描述數據、清理垃圾數據、集成有效數據和變換有效數據,只有通過預處理才能進行到下一步分析。
(3)深度理解。 深度理解的含義是深度挖掘數據需求,由于大數據時代的特性,以及用戶需求的多樣化,構造網絡學習環境對數據融合分析有了更高的要求,不僅指浮于表面的數據內容,還要針對被挖掘數據和分析特征模型把握演變的規律。
(4)計算模型。 由于傳統數據計算已經與現代互聯網技術相適應,面對結構復雜和類型多樣的信息數據,需要構建高效的數據計算模型,這也是進行數據產出的重要環節。 對用戶需求進行匯總、分析之后的精準輸出,是數據融合的關鍵。
(1)優化網絡學習環境。 很多用戶不信任互聯網環境的一個重要原因,是網絡學習環境不佳,除了信息種類比較復雜外,信息庫的數據也有不確定性。 因此,要改善數據融合現狀,避免信息孤島現象,首先要優化網絡學習環境。
(2)提高數據融合技術水平。 數據融合需要從技術層面上提高,首先要進行人才培養。 為了更好地整合數據, 必須培養有著互聯網整合技術的專業人才,專項培養人才,滲透規章法則,對相關人員進行質量上的考核,嚴格把控人員技術水平,才能保障構建優質的學習網絡環境,推動網絡環境的良性發展。
(3)優化網絡結構。 網絡異構問題的產生,使優化網絡結構提上綱程。 其主要內容有系統的優化、課程的優化2 項,歸根究底是對課程資源的優化,并提高資源含金量,可以通過提高數據運維知識,辨別網絡結構中不適用的、無效的信息,通過技術上的優化升級才能改善現有網絡學習環境。
網絡學習需要一個健康的、科學的環境,因此除了凈化網絡環境, 還有精準提煉信息資源這些要求。網絡學習中的信息資源是通過計算機為載體表現出的學習方式,在現階段主要在Web 平臺實現,在網絡學習環境中,環境構建的核心內容有控制學習資源和遠程教學管理2 種,除此之外,還有學習網站和網絡指導教師這種輔助方式。
網絡學習方式逐漸被教育領域中的眾多學習者認可,彰顯了構建科學學習環境的必要性。通過上文總結出的網絡融合步驟, 綜合考慮網絡學習環境構建的地位,就能得出結論:通過數據融合的方式構建出的網絡學習環境,將有利于教育和互聯網技術的進步。 目前,高速發展的互聯網環境使得傳統數據難以滿足用戶需求,一些“僵尸數據”與“信息孤島”的出現,造成了不必要的資源浪費。針對這些冗余的數據,需要結合云計算和人工智能技術,提高數據計算模型的價值。
數據獲取的主要方式是平臺自行沉淀、 網絡抓取、合作共享、增值服務。 現如今,互聯網是各種跨學科數據的龐大數據庫, 這些數據經過清洗和篩選后,可以進行下一步,歸納到網絡學習系統中,比方說書刊出版社的CRM 系統、Kindle 等閱讀軟件的App,從用戶習慣來沉淀、抓取用戶需求。 又或者可以在增值服務上下功夫, 在實體商品上附加網址和二維碼,進行軟推廣,起到數據的捕捉和需求的獲取。
第一時間獲取的數據有時雜亂、 重復和模糊,有這種冗余問題的存在,在實際運用中,數據預處理有必要升級變換。 變換的首要步驟就是數據清洗,通過清洗重復數據和填補空缺數據, 提高數據的準確性。常見的數據預處理方法有EM 最大期望法、MI 算法,等等,在清洗和填補之后將數據集成,集成的數據主要是異構數據的合并與歸納,在合并與歸納期間還需要進行數據的變換,利用函數等方式,規避權重不平衡現象發生。 數據預處理在網絡學習環境中,主要是利用網絡爬蟲形成數據模型來完成的,具體表現為瀏覽器、學習軟件一類的平臺展現出的推送圖文。
數據轉換是經過數據處理和數據分析得來的,常見的處理模型有 MapReduce、Dryad、Storm, 這些都是可以在復雜的數據庫環境中進行數據處理的模型,并且具有很高的準確性。 現如今,數據轉換起到的作用不僅僅是將用戶的需求內容呈現出來,還起到深度挖掘的作用,對流數據進行聚類,并且檢測異常。 近年來,快速地轉換數據越來越重要,所以,提高數據處理的實時性也勢在必行,這樣才能使處理模型有一個快速優質的應用效果。
本文采用大數據時代為背景,列舉和分析網絡學習環境中數據融合的步驟,并且對目前數據融合的升級演變做了系統性總結。 研究重點在于網絡學習中,因用戶需求而進行的數據獲取、預處理、數據分析、數據模型計算流程是如何運作的。 在未來,數據融合的效率必然會更加高效便捷,實踐證明,只有通過升級每個細節步驟,準確的數據產出,才能惠及大眾,避免學習行為與資源庫發生孤島效應,只有從技術上做出改進,才能讓網絡學習效率真正地得到提升。