王梓北京聯合大學生物化學工程學院
信息時代大數據應用的探索
王梓
北京聯合大學生物化學工程學院
隨著計算機技術的普及和發展,各行各業所使用的數據量愈來越大,數據的內容更加復雜,而且還有數據保密和共享的需求,開放數據不僅是公開數據,使得數據可以被重復使用,任意加工,而且數據還可能涉及到個人隱私等問題。數據開放與共享已經成為一種大趨勢,互聯網將成為智能的數據網。
信息;大數據;開放與共享
信息時代是農業時代、工業時代之后出現的一個全新文明時代,在信息時代,信息資源已經成為比人力資源和物質資源更重要的資源,信息資源的收集、公開、利用以及整合已經成為經濟社會活動的樞紐,并對整個社會的政治、文化生活產生積極的影響。
在大多數情況信息和數據這兩個詞是可以互相替換的。但嚴格來說,數據和信息這兩個概念還是有著比較大的區別。信息是把數據放置到特定的條件下,對數字進行解釋并賦予意義,數據是將信息進行數字化記錄,其本身并無意義。比如:2.26是一個數據,姚明的身高2.26米就是一個信息。但是,自從步入了信息時代之后,人們更加趨向把已經存在計算機上的信息,包括音視頻多媒體資料統稱為數據。本文所說的大數據主要是指不能快速的利用普通軟件工具進行捕捉、處理和管理的海量數據集合,這是需要更加新型的計算模式才能具有更強的優化能力和決策能力的海量多元化信息資產。
隨著計算機技術的普及和發展,各行各業所使用的數據量愈來越大,數據的內容更加復雜,而且還有數據保密和共享的需求,開放數據不僅是公開數據,使得數據可以被重復使用,任意加工,而且數據還可能涉及到個人隱私等問題。因此什么樣的數據能夠共享,什么樣的數據需要保密已經成為目前亟待解決的問題。
能夠共享的數據應該是完整原始的、可讀取可處理的,所以數據公開的格式也非常重要。例如我們身邊經常能接觸到的共享數據資源包括,通過手機通訊等渠道即時發布的節假日旅客出行情況,我們能夠提前預判交通擁堵的可能性,公眾便以此來決定出行的時間和方向,從而緩解假日出行帶來的交通擁堵問題。數據開放與共享已經成為一種大趨勢,互聯網將成為智能的數據網。
目前信息時代的主要特點是創新。信息的存儲、處理、發布已經不再是重點,基于信息的創新已經成為主導。信息的高度個性化已成現實,隨著無線傳感器以及普適計算的深入“萬物皆聯網、無處不計算”逐漸成為現實。我們察覺到隨著大數據的應用給社會帶來了改變,軟件開源和數據開放催生了大眾的創新——從滴滴打車到共享單車,信息共享正在向普通人流動。目前數據已成為重要的資源,一旦信息數據自由開放,就意味著信息和每個人的距離是相等的,而且中間沒有損耗。數據的開放和流動是多方面多渠道的。在這個時代,社會的主體結構將從“層級”轉向“網狀”,在網狀傳播的不斷沖擊下,個人的主體價值將得到空前地張揚,大數據催生一個更加開放、更加平等的網狀社會。
傳統的學校教育手段大都是一對多的講授,無法做到對每位學生的個性化教學。信息技術的變革給教育領域帶來的最直接的改變就是在線互動學習對傳統的教育機構的沖擊。教育資源優勢學校可以把本校大量的在線精品課程匯集成海量的數據公布在網絡平臺,通過計算統計廣大在線用戶的點擊數據,從而不斷的淘汰和沉淀,最終會成為經典的教育資源,這些課程數據作為寶貴的現實需求資源,可能會取代老師在課堂上的講授。
未來大部分教育工作者更多是扮演著教學組織者和引導者。學習者可以根據自身的特點和條件自主定制個性化課程表,合理的安排好業余時間進行在線學習。優質的教育資源將得到共享,廣大民眾將是這場變革最大受益者。大數據在教育領域的應用在不遠的將來還有可能對我國的整個教育體制產生深遠的影響。
信息時代大數據的迅猛發展給各行各業帶來了前所未有的機遇。教育行業利用自身學術優勢搭建在線教育平臺之所以具有優勢,是因為能夠通過在線平臺收集、分析、使用大量的數據。這類數據的規模是空前的,用戶通過身份驗證登錄在線學習平臺,從中挑選自身需要的各類課程,我們從中獲取的個人信息和用戶需等數據是及時的、海量的,真實有效的。這不僅僅是簡單的數據,通過有效的算法提煉加工形成各種信息資源,我們可以通過用戶群體的年齡性別以及所學課程了解當前社會最熱門領域的人才需求,及時優化教育資源配置,提高資源的利用率。還可以利用各類在線測試挑選出優秀人才,使得優質的人力資源在相應的領域能夠最大限度地發揮自身價值。
信息時代大數據應用對各個行業產生的影響是巨大的。以用戶的在線學習成績等評價手段選拔行業所需人才只是大數據應用的冰山一角。隨著信息技術的不斷發展,數據在不斷的積累,我們每個人在現實生活中的活動都會形成各類數據被完整的記錄下來,這種記錄可能通過身邊的手機通訊設備、公共監控設備、共享資源系統,匯集成完整的數據信息。這些數據信息看似雜亂無序,通過有效的整合提煉,可以形成非常有價值的信息資源。
信息時代,虛擬網絡的信息的真實可靠性相對較低。隨著現代應用平臺對身份驗證的要求不斷提高,采集信息的真實可靠性都有了質的飛躍。這對社會科學的分析研究提供了精準的、可靠的、及時的數據資源。社科類研究再也不再需要設計各類調查問卷的形式收集特定研究對象的相關信息,而是通過已有的大數據資源,篩選、提煉從而得到比以往更加精準的分析結果。
信息時代大數據的應用對每個人的工作、生活都會產生影響,我國是一個人口大國,但不是一個數據大國,我國大數據技術發展相對不平衡,數據的收集渠道、處理手段還有需要加強和完善,不論是國家還是個人在收集數據的意識這方面都需要更加的規范。只有這樣才能使得我們在這個充滿數據的時代發揮人口大國優勢,充分利用好大數據資源給我們的歷史機遇。
[1]涂子沛.大數據[M].桂林:廣西師范大學出版社,2014.7
王梓(1983-),男,北京人,北京聯合大學生物化學工程學院,實驗師,大學本科,研究方向:計算機技術。