趙艦波
(西安外事學院,西安 710077)
互聯網以及計算機科學的高速發展產生了大數據產生,隨之而來的是幾乎所有的領域、所有的行業都要面對大數據時代下的轉型。近年來,海量信息處理技術與工具的缺乏,導致全球近1 650家跨國企業在面對商業市場的快速變化中無法及時地做出反應,以及提出有效決策。現今,全社會都進入了大數據時代,企業要想能夠正確地尋找決策支持的知識,就必須以新興的大數據挖掘技術來重塑企業知識管理的業務流程,持續提高組織的決策水平,提升企業的核心競爭力。
大數據挖掘指的是從多數據類型的、迅速變化的和數據價值密度低的海量數據中挖掘出對用戶有價值的信息,提供并服務用戶。大數據挖掘與傳統數據挖掘比較,就技術發展背景、所面臨的數據環境及挖掘的廣度深度而言,大數據挖掘依賴云計算、物聯網、移動互聯網、移動智能終端等技術的蓬勃發展,圍繞大數據的特征,分析現有數據挖掘系統的問題,借助先進技術,對龐雜的數據進行實時處理與多維分析,處理數據的范圍更廣闊,挖掘分析得更加深入和全面。
智能知識管理探討如何利用可能的技術手段,構筑一套系統化方案,使海量駁雜的數據能夠提供知識的智能化個性服務,提升企業對信息的利用能力,最終提高決策者的決策水平。傳統的知識管理從算法、結構、過程等方面入手,研究的對象是“知識管理系統”,不重視知識本身的智能化管理,沒有進行知識管理的系統研究,也沒有對知識整合利用方法的設計,以至于當知識的數量過大,傳統的知識管理平臺就難以完成任務。所以,知識本身也要具有一定的智能,能夠自我管理。
2014年8月,谷歌公司公布了其在建的“知識庫”(Knowledge Vault)。“知識庫”可以使用算法自動在網上搜集信息,利用大數據挖掘把數據轉化成用戶的可用知識。IBM公司使用Hadoop、流計算、智能分析等系統,整合實現了實時數據的管理,完成數據的智能分析等。
在國內,劉益等人提出了基于知識本體的知識結構,這個觀點的形成使用了Perez總結的,建立本體所需的5個基本元語:概念、關系、函數、公理和實例;知識結構將知識本體中除實例之外的概念、關系等抽象要素用知識元、知識關聯和知識推理證明表示,這樣更利于描述知識本體的內在意義。中國人民銀行征信中心與中國科學院虛擬經濟與數據科學研究中心一起合作開發了中國人民銀行的全國個人信用評分系統——中國評分(China Score)等。
1.智能知識管理這一交叉學科的發展落后于其商業應用的現實需求,使用數據挖掘、數據分析等工具,挖掘互聯網和數據庫等知識源,整個過程產生了許多的模式和不同的規則。決策者無法很好地理解如此眾多的潛在模式和規則,在那些能夠為決策提供支持的事情上無法集中注意力和精力。企業需要使用大數據挖掘技術融合知識管理,保證決策者能夠有效使用數據挖掘得到的知識,從而提高決策水平。
2.基于大數據環境,大數據是數據分析的反映,從大數據挖掘出的非結構化知識開始,經過人為主觀處理,將非結構化知識轉化為半結構化知識,再將半結構化知識轉換為結構化知識,最后使得從事結構化決策的決策者無須了解過多的業務知識,也能夠通過獲得的結構化知識做出正確的結構化的決策。
3.研究現有的知識管理框架,在此基礎上逐步完善智能知識管理框架,建立基于大數據挖掘的智能知識管理的理論框架。研究智能知識獲取的機理,探討智能知識獲取的理論,應用新技術,提煉新算法,探索出基于大數據挖掘的智能知識管理與決策的內涵。
1.大數據環境下的智能知識管理與決策結構的改變。(1)知識機理的重新架構。基于大數據的知識發現過程與傳統知識不同,是基于數據信息的知識決策。(2)決策模式的更改。不同于基于因果關系的傳統決策,大數據環境下的決策模式是基于相關數據分析的決策。(3)管理模式的更改。傳統的管理模式是基于業務知識的學習,也是基于實踐經驗的累積;而大數據挖掘是以結構化知識為研究對象的,這類知識的使用促使決策結構的改變,需要研究智能知識管理如何支持更高層次的半結構化決策和非結構化決策。大數據環境下的智能知識管理與決策結構的改變需要重新梳理理論框架,研究新技術、新算法,探討這種改變對管理決策的影響。
2.大數據環境下的智能知識獲取的方法、智能知識獲取的技術。大數據研究的核心價值是從大量駁雜的知識中使用人為主觀知識的轉換,從而得到被管理決策者所使用的結構化知識。這個過程我們需要研究構建評價體系,對不同類型的粗糙知識選擇合適的指標,完成有效性評估;研究如何將主觀知識在大數據挖掘中完成量化、表達,這些主觀知識涵蓋了專家經驗、領域知識、用戶偏好等;研究包括人機交互、定性定量結合的智能知識獲取技術的原理和應用;傳統的數據挖掘挖掘出的是靜態性的知識,探索結合領域知識挖掘模式之間的變換規律,進行深層次的挖掘,使靜態知識挖掘轉變為動態知識挖掘。
3.大數據挖掘時,表現出規則過載和表達解釋困難的問題。大數據挖掘時的知識規則過載主要表現在深度上的過載以及數量上的過載,在深度和數量兩個維度上的過載導致很難找到用戶真正感興趣的知識,從而使得用戶難以獲得可直接用于決策的知識。大數據挖掘時的表達解釋困難表現在知識的理解性差、知識的實用性差,系統或用戶使用不同的數據挖掘算法,挖掘出的知識存在較大差異的表現形式,且數據質量良莠不齊,甚至會產生知識沖突,使得表達起來非常困難。
1.構建基于云計算的大數據挖掘體系結構。云計算作為大數據技術的基礎支撐服務,是一種新型的具備高擴展能力和高彈性的虛擬化的計算模式,主要應用在數據存儲和數據處理方面,這些特性為大數據提供了基礎的存儲服務,提供了高效的數據處理動力。大數據挖掘的體系架構中結合了云計算的分布存儲和分布并行計算,呈現出了云計算/客戶端的結構模式。大數據挖掘結合云計算,使用云計算提供的服務支持,以強大計算能力和海量的存儲能力為核心,整合多種大數據挖掘、分析技術和挖掘、分析算法,形成新的挖掘云,在挖掘云中實現大數據的實時分析與挖掘,并把分析和挖掘的結果以可視化技術呈現給客戶。
2.構建基于Hadoop的大數據挖掘平臺。我們可以構建融合多種技術、功能的Hadoop大數據挖掘平臺,平臺分為數據來源、大數據挖掘平臺和用戶顯示層。數據來源可以是結構化數據,也可以是半結構化數據,甚至是非結構化數據;大數據挖掘平臺是基于Hadoop的實時數據分析、處理平臺,平臺可運用不同的計算模式、計算方法分析和挖掘數據內容;用戶顯示層以可視化的技術向用戶展示數據結果或接受某種請求服務。通過構建基于Hadoop的大數據挖掘平臺,完成大數據的收集、存儲、計算、篩選、分析和展示。
3.研究現有知識管理體系結構,建立智能知識管理理論模型,設計并實現基于大數據挖掘的智能知識管理系統。研究現有的知識管理體系結構,找到知識的源頭。原始知識來自大數據挖掘的結果,結合智能知識管理的理念,讓原始知識具備智能化特點,使之能夠自我更新,并從中發現深層次的知識,以此逐步建設智能知識管理理論模型。最后,以理論模型為基礎使用計算機技術設計,并實現基于大數據挖掘的智能知識管理系統,使之真正能夠服務于用戶。
大數據挖掘和智能知識管理結合,從知識管理的角度,既關注數據挖掘的過程,也關注數據挖掘的結果,從而使知識管理過程找到的是用戶真正感興趣的、可行動的及其現實世界的知識,智能化處理對用戶有用的知識,挖掘、分析出自身具備智能性質的知識,自動管理這些知識的自更新、自應用,在正確的時間,以正確的方式,傳遞正確的知識給正確的人,提高大數據挖掘獲取的知識的實用性,減少信息爆炸,以智能地支持企業有效管理決策,提高知識管理水平。
[1]吳若溪.大數據時代知識管理的新風向[J].學理論,2015,(7).
[2]吳忠.大數據時代下的管理模式創新[J].企業管理,2013,(10).
[3]鄧仲華,劉偉偉.基于云計算的大數據挖掘內涵及解決方案研究[J].情報理論與實踐,2015,(7).
[4]石勇,張玲玲,陳懿冰.智能知識管理發展研究[C]//2012—2013年管理科學與工程學科發展報告,2014.
[5]吳澤.大數據時代知識管理的作用和方法創新[J].圖書情報導刊,2016,(1).
[6]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數據時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[7]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,(1).