□ 于 希
“白云依山盡”的云時代
□ 于希

下一次霧霾是大數據,下一個戰場是云平臺。
我們已經跨入了大數據的時代并飛向云端。
我們的下一次災難將是什么?
置身于大數據時代,我們從查字典翻書轉向通過網絡獲取信息,年齡越小的群體越是有網絡和數據的依賴,但哪些數據是真實的?哪些數據是準確的?哪些數據是有用的?哪些數據是最新的?誰來幫我們甄別?
可能我們腦中少了一塊芯片。這塊芯片,可以迅速過濾掉那些虛假、錯誤、無用、過時的信息,并迅速挑選出真實、準確、有用、最新的信息。
事實上,我們采集到的數據,既沒人幫助甄別,也無法在腦中植入芯片進行智能分析,我們只能想當然地認為哪個網站權威,它提供的信息就是權威的。
問題從這里開始產生。
過去,我們使用公式、引用數據,會去查辭典、找出處,而現在,手工勞動效率遠遠低于電腦,人工查找會非常浪費時間并降低工作效率,于是我們習慣性地到百度、維基百科去檢索數據,這些檢索工具不知不覺中替代了我們的工具書。
用過這些檢索工具的人都知道,這里的數據庫是“眾籌”的,所有信息都沒有經過權威機構驗證,我們在使用著,同時也在擔心著。
隨著全民化的“拷貝”、“粘貼”和上傳,這些檢索資料庫變得越來越龐大,檢索一個關鍵詞,會搜出幾十萬甚至上百萬條信息,你根本沒時間一一瀏覽、對比并核實,只能根據主觀判斷,使用自認為最準確、最靠譜的數據。當你由此生產出新的數據并上傳后,又給下一位檢索者帶來了新的不確定性。
隨著人類網絡依賴性的日漸增強,同時也隨著網上云數據的建立,這些上傳數據在量上會呈現幾何級數增長。起先,天上只有一兩朵小云,后來云越來越多,越來越大,慢慢地,整個天空被云的陣列徹底遮蓋,再也看不到藍天。并且,隨著每塊云朵里因數據的不準確而產生的黑色素(BUG)越來越多,這些云慢慢變成為烏云甚至黑云——此時,互聯網的天空中已布滿了信息的霧霾。
如果你不敢呼吸夾雜著霧霾的空氣,那你必將對使用這種充滿霧霾的云數據而憂心忡忡。
所以,在云的霧霾到來之前,我們與其天天在制造新的云,上傳不確定的數據,還不如做一件比制造新云更有意義的事:對云上數據的準確性進行認證。
我們有理由相信,誰此刻意識到未來云數據的準確性直接決定著云平臺和云天空的生死,誰此刻著手建立云數據認證標準,在全球部署云數據認證中心,對上傳數據者建立誠信等級,對已上傳數據進行及時認證,他一定會成為未來最富有的企業家。因為誰都清楚,信息化時代之前,知識先學后用;信息化時代到來后,知識需要學習還需要快查、查對才足夠應用。在檢索和引用階段就帶著錯誤,隨后帶入產品的設計、研發、生產和服務,那種破壞性將是致命的,正如一位患者,他的病不是后天的,而是先天的,其治愈的難度可想而知。
不妨舉例,為紀念唐代詩人王之煥,需要鑄一尊金鼎并引用《登鸛雀樓》一詩,結果在檢索時,“白日依山盡”寫成了“白云依山盡”,但設計人員并不知道這一錯誤,于是開始設計:轉換書法字體,設計樣稿,制作模具,澆鑄作品,打磨鍍金,剪彩展示,這時,前來瞻仰的觀眾們發現“白日”寫成了“白云”
如果這樣的錯誤不是發生在金鼎上,而是發生在一種新型火箭的研制甚至是國家導彈防御體系建設之中,它又會導致什么樣的后果呢?
今天,我們處在生產信息和生產錯誤信息、垃圾信息并存的階段,如果這些信息不經過過濾和凈化就直接上傳至網絡及云端,這不等于在給云端生活的人們提供沒有經過過濾和凈化的空氣嗎?誰能保證吸入這樣的空氣對我們的機體不會帶來疾病和影響呢?
可惜,我現在無法從網上找到對數據進行檢索、過濾、分析、認證、加工、提出使用建議的智能化工具,只能想當然地認為它正確,最多在時間允許時“貨比三家”一下,而當只有一條檢索結果時,你只能認為它正確,要不,你自己手工去進行大海撈針。
我相信,這都是未來的云服務平臺應該具備的功能,考慮更加全面,技術更為先進,但有一點存疑,就是及時性數據準確性的認證。大數據的集成及智慧處理和服務只會催生新發明、新創造、新公式、新成果等新數據的加速形成,如果不及時進行認證并上傳,將會延誤科技的發展,及時上傳而不進行認證,又會導致云端的再次污染。
為此,在云平臺數據陣列的設計上,要有“原始數據庫”,“認證數據庫”,“待認證新數據”,“數據應用進展”等等模塊,并且要對“原始數據庫”和“認證數據庫”進行安全保護、嚴格管理,確保不被污染。尤其是“原始數據”(源數據)庫,必須保證絕對安全,確保“認證數據”受到破壞時,還能通過“原始數據”進行推導。
如果對“源數據”不進行最嚴密的保護,“白日依山盡”被黑客篡改為“白云依山盡”,最初的影印原件都被篡改,誰還能證明或推導出“白日依山盡”呢?即使你有這首詩的真實原件,在許多人引用了“白云依山盡”之后,又有誰不認為你手里持有的是贗品呢?
這就引發了另一個話題,在互聯網時代落后于美國的其他國家,在“互聯網+”時代,是否可以超越而成為強者呢?美國在互聯網時代搶先建設了高速路,其他國家能否在“互聯網+”時代生產出質量最過硬的汽車并提供品質最過硬的汽油,讓我們在高速路上跑得既快且十分安全呢?
這其實是一次絕好的機遇。我們能否搶先一步,從標準制訂到數據認證再到數據服務,在云上建起4S店或是5S店,提前占據主動并引領時代之先呢?
再深入一步說,要從國家安全的戰略高度審視這一問題。
如果我們跑的路、用的車都是別人修建和生產的,對路的缺陷和車的隱患一無所知,甚至對一些惡意國家故意搞的設計缺陷和質量隱患毫無察覺,兩國沖突之時,我方的車毀人亡不就是一瞬間的事嗎?戰爭的勝敗不也成了傾刻間的事了嗎?
由此可以推斷,未來,在云端上,尤其是在云根部的“源數據”及“認證數據庫”這一區域,將是大國云上部隊(天兵天將)廝殺得昏天黑地的戰場。
其實,想想也是非常可恥的,大國對人類幾千年積累下來并共用的原始數據進行爭奪,并各自通過做手腳的方法讓對方引用錯誤數據而導致連鎖反應,實在是非常卑劣無恥的行為。
退一步講,即使未來人類相互間的爭奪不是云平臺云數據而是在此平臺進行云端的軍備競賽,這也必將導致人類的欲望進一步膨脹,世界大戰或星際大戰將瞬間被觸發。
說實話,根據本文的思想,劇作家們完全可以創作出一部好的電影劇本,揭露未來云端科技競爭的殘酷。
重回現實,我不得不說:“大數據”和“云平臺”看上去很美,有人建立“大數據”公司,不知有沒有人建立“真數據”公司和“準數據”公司。沒有真實性的“大數據”是“虛胖”的數據,腳踩棉花的“云平臺”是不踏實的平臺。
霍金說,未來,機器人將戰勝人類。我倒認為,人類將退化于對信息化、數據的盲目崇拜和過度依賴,同時也必將毀滅于對人類共有“源數據”的爭奪與篡改。
人類的“源數據”一旦被篡改,數千年的文明將瞬間歸零。知識將被植入病毒,人類文明將整體攜帶先天性疾病,再也無法根治。
如果現在著手建立的云端是一個未來的戰場,那就讓云時代永遠不要到來,同時讓已經飄在天空的白云早一點“白云依山盡”吧。
(作者單位:中國航天科工集團公司培訓中心)