穆俊
基于本體的數據挖掘技術應用于商務智能中的實際應用
穆俊
首先闡述了挖掘技術與商務智能的含義,指出了數據挖掘技術應用在商務智能中的意義,結合新時期我國各大企業的發展實際,對基于本體的數據挖掘技術應用在商務智能中的實際情況進行了分析,旨在利用數據挖掘技術,發揮出企業商務智能系統的優勢,提高企業核心競爭力,促進企業長遠發展。
本體;數據挖掘;商務智能
數據挖掘技術作為一種新興技術在企業的生存發展具有重要意義,尤其是在商務智能中的作用更加凸顯,因而越來越被廣泛應用。隨著企業規模的擴大,海量的數據信息增加了企業管理者決策難度。在新時期,在信息處理過程中若依然采用傳統的方式,已經不能更好地滿足現代企業的實際發展需求,企業要想獲得長足發展,提高自身競爭實力,企業管理者亟需采用一種可實現自動收集、自動分析與自動描述的新型數據挖掘技術,從而準確預測出企業發展趨勢,促進企業良性發展。
1.1 本體
本體一詞最早源于哲學,隨著科學技術的快速發展,本體被賦予了新的含義。在智能領域,本體則是數字模型與資源共享的體現,它是一種形式上的規范說明,從而更加明確、具體闡述了多種概念與概念之間較為復雜的關系,由于本體有著較強且健全的約束力,因而在本體思想下,各種數據集成和相關軟件的應用更加容易實現[1]。把本體知識融入到現代網絡知識的管理中,能夠使知識、信息更加對象化,利于知識集成的實現。同時,通過對知識對象的之間的相互匹配,能夠使匹配知識對象之間的關系更加明確,利于清晰的對各種關系進行有效描述。利用各種知識關系之間的屬性,可以使用戶在短時間內獲取到自己需要的知識信息內容,從而避免了在盲目狀態下,獲取大量不必要的信息數據,從而節省了工作時間,提高了工作效率,并且較為清晰、準確的數據更加有利于用戶進行決策。
1.2 數據庫技術
數據挖掘是科學技術水平進步的重要體現,數據挖掘主要是指從具有噪音、不夠完全和較為模糊的大量信息中隨機挖掘出其中所隱含的重要信息。數據挖掘實現的過程需要經歷信息收集、數據集成、數據規約、數據清理、數據變換、數據挖掘實施過程、模式評估和知識表示8個過程。數據挖掘主要完成關聯分析、聚類分析、分類、預測、時序模式和偏差分析等任務[2]。經濟的快速發展,各個行業的業務規模出現了大幅度擴大的趨勢,隨之而來的就是信息數據的急劇增多,為了提高提高工作效率,確保各項工作的完成質量,眾多領域的業務工作都需要借助數據倉庫或者數據庫技術來完成。與此同時,相關領域的工作人員加強了對數據挖掘技術的研究,使數據挖掘技術的縱向與橫向得到了深入發展。隨著人們對數據挖掘技術重視度的提升,到目前為止,數據庫挖挖掘軟件已經經歷了四代的研究與發展,由此可以判斷,數據挖掘技術系統與倉庫技術的結合是信息科技時代發展的必然產物。
早在1989年,美國加特納公司(GartherGroup)中的高級分析師Howard Dresner率先提出了Business Intelligence即“商務智能”這一概念[3]。利用商務智能來更好的幫助企業進行科學決策、實現企業利潤目標。商務智能聚集了源于機械工具學習、信息模式識別、統計學、信息學、數據庫等多方面知識,把現代企業管理理論作為了基礎,把現代信息技術作為了核心技術,形成科學化的數據系統,輔助商業系統來制定科學決策。詳細內容如圖1所示:

圖1 商務智能系統模塊
商務智能工作的過程主要是實現對相關數據信息流動與儲存的過程,商務智能系統通常主要有以下幾個模塊組成:
(1)數據獲取
在這個過程中,主要實現對信息數據的采集、選擇、轉換、整理以及儲存。
(2)數據管理
利用數據挖掘技術,對組織數據進行管理和維護。主要進行數據儲存、維護數據、分發數據、提取數據、轉換數據以及維護數據庫的安全[4]。通過對數據庫的管理,能夠對眾多的數據信息進行提取與凈化,實現數據信息的標準化。
(3)數據分析
商務智能系統是在這個階段真正實現了智能化,因而數據分析模塊在商務智能系統中的作用不可忽視。
(4)信息呈現
在這個模塊可以實現全體信息的匯總,從而為企業管理與用戶決策提供依據。
隨著業務規模的擴大,數據庫中儲存的信息數據量呈現了急劇增加的趨勢,即:超指數上升的趨勢,因而使得多種數據理解與產出之間的距離越來越高[5]。此時數據挖掘技術應運而生。這種新型的數據分析技術能夠有效解決眾多數據之間出現的矛盾,因而,具有被應用的頻率越來越大。數據挖掘技術能夠從數量龐大的數據庫系統中提取出一些被隱藏的信息,由于這些信息具有一定的預測性,因而將其挖掘出具有重大意義。通過應用數據挖掘技術,可以把這些被用戶忽略掉的信息挖掘出來,并且以一種易于被理解和接受的形式反饋到用戶,從而為企業的決策與發展戰略制定提供有預見性的參考意見,利于企業發展目標的實現。
3.1 數據挖掘技術與智能商務系統
要想使企業在運作過程中的大量流動商業數據能夠發揮出更大的作用與功效,各個企業在發展運行中應用的商務智能系統需要采用數據挖掘技術,進而才能使各種商務信息發揮出功效。數據挖掘技術可以從大量的數據中,挖掘出具有隱性的、未知的、有價值并且用戶較為感興趣的知識與數據信息。在采用數據挖掘技術的過程中,主要憑借聚類與分類的手段來完成任務。它把大規模的異種類別數據按照某種特定的屬性來劃分成較為相似的子集,這樣有利于縮小數據處理規模,減少數據處理時間,簡化了數據模型建造與分析的復雜性[6]。數據挖掘在商務智能系統中的位置圖如圖2所示:

圖2 數據挖掘在商務智能系統中的位置
通常情況下,可以按照以下方式對工作原理進行說明。
(a)根據用戶的實際要求,可以對與之相關的數據進行選取,接下來數據挖掘(DM)再從這些數據中篩選出符合要求的數據[7];
(b)根據企業的實際需要,數據挖掘選取最為合適的數據開采方式與計算方式,同時還不能忽略了對數據參數與數據模型的選取[8]。一般情況下,要在數據庫中選取較為感興趣的數據模型,并且用特定的標準與方式將其表達成人們易于理解與接受的形式。
(c)需要對模型的選擇進行解釋,并要做出相應評估,在必要的情況下,還需要返回到前面處理過的頁面,對某些數據信息進行重新提取與應用。
(d)通過數據知識評估,可以通過用戶最易于理解的方式把發現的知識和數據信息提供給用戶,使用戶對這些數據信息充分利用。
3.2 數據挖掘技術的影響因素
縱觀當前各大企業的知識管理,普遍都存在一定問題,對數據挖掘過程造成了阻礙,從而影響了商務智能系統的正常工作。
(a)很多企業在管理過程中,由于缺乏較為統一的知識管理模型,因而很容易使系統對同一個類型的知識描述出現不相同的情況,進而會致使用戶對知識的理解產生偏差,不能正確領會知識的真正含義,最終不能真正實現知識信息資源的有效共享。
(b)企業在管理中,尤其是在知識儲存模塊,由于對知識儲存沒有做出嚴格規定,缺乏統一的存儲形式,導致在知識的存儲環節會呈現出不同形式,對用戶知識使用造成了影響,妨礙了人們的知識交流,沒能真正發揮出知識資源的優勢[9]。
3.3 引入本體
為了更好的解決上述問題對商務智能系統造成的影響,引入了本體。根據企業的實際發展情況,可以建立起某個領域的本體,把這個本體作為出發點,引導數據庫技術的應用,可以對數據挖掘過程進行完善,進而挖掘出質量更好、價值更好的數據信息。因此,本文提出了一種新的數據挖掘方法,該方法是建立在本體基礎之上,數據挖掘方法的詳細描述如圖3所示:

圖3 基于本體的數據挖掘
第一,憑借本體知識或相關背景性知識,在高層次建立數據挖掘,接下來會相應的產生高層次或多層次規則。在特殊情況下甚至還會產生具有語義性意義的一些規則,通常情況下,這些規則是由具有抽象性的高層次概念所組成。第二,該商務智能系統可以實現數據的自動化挖掘,通過本體對數據進行預處理以及后處理。
3.4 高層次規則處理的優勢
通過對高層次數據挖掘規則與低層次數據挖掘規則進行比較,可以清晰發現,在高層次規則引導下進行的數據挖掘具有明顯優勢:
(a)高層次規則能夠清晰準確的對所提供的數據進行概括與總結。在常規數據處理中,數據挖掘系統對相關數據信息進行概括與輸出都是采用低層次形式。當出現某些特殊情況下,也可能會產生許多形式和內容相近的低層規則,此時采用高層次規則方法進行提取的作用就更加凸顯,可以發揮出高層次的獨特作用。
(b)由于采用高層次的數據抽取時假定使用了具有相關性的搜索方略,因而與低層次數據挖掘相比,數據規則的數量就會減少。當低層概念轉化為高層概念時,相應的就會得到少數的規則,同樣,單個高層次規則也會替代掉形式與內容較為形似的低層次規則。
4.1 系統管理
在采用數據庫挖掘技術的商務智能系統中,通過系統管理員的操作,能夠實現對相關用戶系統的管理,并能夠對用戶的權限進行設置。用戶可以扮演不同的角色,但是不同的角色有著不同的權限。有些用戶擁有管理權限,進而可以對用戶權限進行分配。在系統管理中,提供了日志管理和密碼修改等功能,管理員能夠提供權限的管理接口,當其他窗口模塊在進行內部的初始化運行時,可以通過此端口來進行驗證。
4.2 信息查詢
在使用商務智能系統時,為了能夠根據實際需要對各個模塊的信息進行查詢。因而在采用數據挖掘技術設計時,提供了查詢平臺,可以實現企業產業鏈平臺中的各項查詢功能,從而有效避免了由于系統功能切換或者是內部系統升級而給用戶造成的麻煩。系統的管理功能也是依托企業產業鏈的平臺板塊來實現。
4.3 商務智能系統結構
從整體商務智能流程看,可將每個流程和步驟視為一個服務客體,而從整體流程執行過程轉變為相關執行體系(SOA)。例如,針對1個典型性數據挖掘進程,通過數據庫集成,對服務方法進行訪問[10]。這樣不僅能夠使企業內部相關系統獲得數據交互能力,也可使企業合作伙伴獲得相應利益。如果將數據挖掘整個過程視為服務組件,企業其他相關系統內容則無需開發和建設自身數據庫和程序,需要對數據進行分析時,可直接調取對應數據服務。實際上,這種方法對企業非常有利。數據挖掘需要大量計算過程,企業若想實現數據模型建設,往往需要購買價格昂貴的服務器進行數據處理和分析。實踐經驗表明,應用標準化 Web資源服務體系和框架,能夠將企業擱置計算資源充分利用起來,進而降低商務智能系統建設資金投入。隨著企業規模的擴大,企業對商業中數據信息的反饋速度與質量要求越來越高,需要在Internet網絡或者其他平臺上等任何一個環境中都可以很好的實現商務智能的對接,而且這種需求的呼聲越來越強烈。因而,在商務智能系統設計時,一定要多多應用數據挖掘這種新型的信息技術,通過構建SOA方式的智能系統,不要安裝服務器相關的客戶組件就能夠訪問與實現商務智能的功能。商務智能系統的體系結構如圖4所示:

圖4 商務智能系統結構
由于數據挖掘技術的功能優勢較為明顯,因而把數據挖掘技術應用在智能商務系統設計中,能夠為企業在日常經營與管理提供便利,通過對隱藏的且具有價值性的信息進行挖掘,可以實現各種信息的流通與共享,為企業決策提供數據參考。
基于本體的數據挖掘技術對于各個領域的發展具有重大意義,因而具有廣闊的應用前景。我們需要立足企業發展實際,認真分析數據庫技術的特點,加強對數據庫挖掘技術的研究與應用,實現人機交互智能化,促進企業商務智能系統的設計,提高企業決策科學性,從而更好的促進企業發展。
[1] 宋遠芳,盧明月,趙海燕.基于本體的數據挖掘技術在商務智能中的應用[J].計算機技術與發展,2013,12(01):101-102.
[2] 韓家煒,坎伯范明.數據挖掘概念與技術[M].北京:機械工業出版社, 2011,09(12):13-14.
[3] Kantardzic M.數據挖掘概念、模型、方法和算法[M].北京:清華大學出版社,2013,12(02):5-6.
[4] 盧美律,謝明亮,李明明.數據庫里的知識發現[J].中國人民大學圖書館復印報刊資料,2012,13(02):127-130.
[5] 吳曉雷.基于Ontology的內容分析法的研究[D].南京:南京理工大學, 2011,14(09):12-13.
[6] 胡敏覺,劉大洋,王剛.云計算技術在景區商務智能中的應用研究[J].合肥工業大學學報, 2013,04(11):15-19.
[7] 劉平峰.基于知識網格的電子商務智能推薦理論方法研究[J].武漢理工大學學報,2012,10(09):17-18.
[8] 李健康,張春輝,孟曉花.本體研究及其應用進展[J].圖書館論壇,2012,13(12):80-86.
[9] 李水平,張明亮,王海青.數據采掘技術回顧[J].小型微型計算機系統,2011,15(04):74-81.
[10] 路耀華,張勁松.建立整合性商務智能系統的思考[J].經濟縱橫.2012,(12):17-18.
Based on Ontology of Data Mining Technology Applied in the Practical Application of Business Intelligence
Mu Jun
(Department of Information Science and Technology ,LincangTeachers’College,Lincang, Yunnan 677000,China)
This paper first expounds the definition of mining technology and the business intelligence, pointing out that the significance of data mining technology application in business intelligence, according to the actual development of the big coporations of our country in the new era , data mining technology application’s case based on ontology is analyzed. It aims to take advantage of corporation’s business intelligence system with data mining technology, so as to improve company’s core competitiveness and promote long-term development.
Ontology; Data Mining; Business Intelligence
TP311.13
A
2014.10.28)
1007-757X(2014)12-0048-03
云南省教育廳科學研究基金重點項目(2014Z137)
穆 俊(1979-),男,臨滄師范高等專科學校,信息科學與技術系,講師,碩士,研究方向:計算機應用技術和軟件理論及數據挖掘,臨滄 ,677000