摘要:近些年來,我國綜合國力發展迅速,在全球經濟發展中發揮著重要的作用,這得益于我國政府的宏觀調控以及各大企業的積極響應。其中,企業信用評估工作是保障我國經濟發展的一個重要因素,有助于切實提高我國經濟發展的速率。但是在開展數據采集工作的時候,由于有關企業信息的隱私保護工作不到位,導致企業內部信息的泄露,進而對企業的實際發展產生一定的影響。所以,需要通過技術拓展,利用分布式隱私保護數據挖掘結構開展相應的信用評估工作,從而確保企業在接受信用評估的過程中信息不會泄露。本文主要介紹數據挖掘工作的主要內容,以及分布式隱私保護架構的原理和具體實施的流程。
關鍵詞:企業信用評估;分布式隱私保護;數據挖掘
引言:
資源信息共享是推動我國有效發展的主要因素之一。在我國主要的幾個經濟大省中,政府主管財務的部門,以及相應的職能部門和企業存儲了大量的數據資源,但是各個部門之間卻并沒有很好的利用相應的信息資源,從而無法從其中提取出有助于推動整個城市發展的信息和知識。所以,為了滿足城市發展的需求,數據挖掘應運而生。通過對大量的經濟數據進行系統的分析工作,發掘出其中潛在的、有用的信息,最終可以為企業制定發展戰略的時候提供強有力的數據支持。在實際開展數據挖掘工作的時候,要注重對各個部門信息隱私的保護,進而打消其顧慮,使其愿意和其他部門進行資源共享。
一、重要性淺析
對數據挖掘進行隱私保護可以切實提高整個數據挖掘工作的效率以及數據挖掘工作的普及范圍,對企業而言,隱私保護數據挖掘可以將企業內部所有部門有價值的數據信息進行整合,從而為企業制定發展方案提供理論依據。對我國整體經濟發展而言,可以有效的推動國家經濟的發展。在全球化大背景下,只有做好相應的隱私保護數據挖掘才能順應時代的發展。
二、隱私保護數據挖掘簡介
(一)主要內容簡介
目前大多數企業內部部門之間以及企業和企業之間不愿意將自己獨有的數據分享出來,主要的原因還是出于對自身隱私的保護,尤其是對于一些帶有敏感信息的部門而言,一旦相應的敏感信息泄露,就會對整個企業的發展造成極大的影響。而數據挖掘對推動企業發展以及金融詐騙分析,乃至我國經濟發展具有十分重要的戰略意義,所以,要通過大力開發隱私保護體系,進而調動企業內部數據共享的積極性。隱私保護數據挖掘主要是通過對知識庫中的所有數據進行加密,或者通過算法將相應的數據進行轉化,實現對用戶信息的保護功能。通過使用隱私保護數據挖掘,可以在進行數據挖掘的同時保障每位用戶信息的安全,確保敏感信息不會泄露。
(二)衡量隱私保護質量的主要指標
1.安全性
安全性是衡量隱私保護數據挖掘構架的重要指標之一。只有確保每位用戶的數據信息不會在挖掘期間泄露出去,才能促使用戶愿意將數據共享出來。安全性是開展數據挖掘工作的前提,如果無法保障用戶的隱私,則后續的工作是沒有任何意義的。
2.準確性
前文提到過,數據挖掘只有在一定基數數據基礎上進行才有意義,但是數據的基數越大,挖掘工作的難度也就越大。而且在整個數據群中,大部分的數據是沒有任何意義的。所以,在注重隱私保護數據挖掘安全性的同時,還要從隱私保護數據挖掘架構的準確性考慮,要對構架進行優化,從而提高所挖掘出來的數據的價值。
3.效率
效率是衡量隱私保護數據挖掘的指標之一,主要通過優化算法以及硬件設施提高整個數據挖掘構架的效率。在實際開展隱私保護數據挖掘工作的過程中,對數據的計算、篩選,對有用數據的提取,以及對所有數據的加密,都需要花費大量的時間進行。但是金融市場瞬息萬變,效率較低的隱私保護數據挖掘構架顯然無法滿足現實需求,所以就要通過優化構架提高整個挖掘工作的效率。
三、Agrent淺析
Agent技術是搭建數據挖掘構架使用的技術手段之一。在實際應用的過程中,首先Agent技術沒有中心控制,所有子網絡的數據都會直接上傳到知識庫中,從而有效的提高了整個數據挖掘工作的效率;其次,基于Agent技術搭建的系統具有動態性的特點,在數據挖掘工作開展的過程中可以根據企業的需求,通過技術手段對整個架構做出相應的調整;最后,基于Agent技術的隱私保護數據挖掘架構實現透明化的特定。除此以外,Agent技術采取的是局部通信的方式進行數據挖掘,這一通信模式進一步提高了企業內部各個用戶隱私的安全系數。如圖1 所示,即為基于Agent技術的模型圖:
四、實施方案
分布式架構主要利用了安全多方計算技術,該技術主要將局域網劃分成多個子網絡,各個子網絡之間的信息不會傳遞,每位用戶都有一個獨立的子網絡用于上傳數據,每位用戶將數據上傳完畢后,相應的數據信息會直接上傳到局域網中,其他用戶無法訪問或者下載,也就保障了每位用戶的隱私安全。但是隨著計算基數的發展,安全多方技術的缺點也逐漸暴露了出來。由于只有在所有用戶將數據信息上傳完畢后,分布式構架才能進行數據挖掘,整個計算的流程過于復雜,導致整個數據挖掘工作的效率較低,所以,通過對安全多方技術的改造升級研發出了效率更高的挖掘算法,該組件可以有效的提高數據挖掘工作的隱私保護效果,以及整個數據挖掘工作的效率。而且整個組件較為靈活,可以根據企業的實際情況制定出具有一定針對性的企業信用評估模型。
如下圖所示,即為隱私保護數據挖掘架構的模型和實際實施流程。
1.基于Agent技術,構建數據挖掘架構,該架構可以滿足企業信用評估工作開展的時候對分布式數據處理的需求。在搭建架構的時候,要注意對企業進行系統、深入的分析工作,對原有的架構進行一定的調整,使整個架構更具有針對性。
2.基于安全多方計算技術以及數字信息安全防護技術,設計出能夠切實保障企業內部各個部門信息的安全。在此基礎上,將企業內部所有用戶的信息匯總,并上傳到知識庫中。
3.根據“問題定義”和“數據收集”,并咨詢有關專家的意見建立一個模型庫,將知識庫中的信息按照模型庫的格式進行挖掘整理,對于沒有價值的信息則自動進行加密處理。
4.在挖掘數據后,知識庫將挖掘完成的信息上傳到信用評估系統中,由系統對相應的數據信息進行分析,最終生成相應的信用評估結果。
參考文獻
[1]王金龍. 面向企業信用評估的分布式隱私保護數據挖掘[J]. journal6,2006,44(35):243-245.
[2]蔣云良,徐從富,王金龍,et al. 基于分布式隱私保護數據挖掘的企業信用評估方法:.
[3]葛新景,朱建明. 基于博弈論的隱私保護分布式數據挖掘[J]. 計算機科學,2011,38(11):161-166.
[4]劉英超. 面向分布式的數據挖掘隱私保護方法研究[D]. 哈爾濱工程大學.
作者簡介:徐志高,1959年8月,男,漢,碩士,首冠信用評估有限公司全國市場開發與管理總監,中國國際經濟合作學會商務誠信工作委員會副秘書長,高級信用管理師,高級信用評估師,電氣工程師,英國商報FT中文網特邀嘉賓,IBM年度嘉賓;國際人力資本網發言嘉賓、ISO9001認證復檢專家、信用行業管理帶頭人、國家級雜志發表過多篇論文、中國LED工程聯盟專家組成員、北大EMBA同學會“一帶一路”信用課程應邀講師、商場銷售管理銷售技巧全程講師;集建筑、工業、商業、教育、商貿于一身的綜合型高級管理人才。
(作者單位:首冠信用評估有限公司)