舒煜



摘要:互聯網產業作為數據爆炸時代的典型代表,其在數據獲取、處理及利用方面存在天然性的優勢,而如今看來數據本身其實是可以隱匿的,隱匿的數據與顯性的企業運作系統之間存在著很大的關聯,這些關聯如何挖出是在現下的技術手段中是可以解決的,關鍵問題在于企業或者說行業內可否發現這些數據匿藏點并加以處理。這些問題在成熟的解決辦法出來之前,一直會是研究者們探討和研究的重點。
關鍵詞:互聯網產業;系統域;隱匿數據;存留機制
中圖分類號:TP3-05 文獻標識碼:A
文章編號:1009-3044(2020)14-0058-02
1引言
當前產業互聯網促進各行業協同發展及轉型升級,同時帶動了各企業信息化系統的高度建設,這里信息化系統并非單純指的是操作及工作系統,而是指包括了企業內部用于協同辦公的各組織性子系統集合及對外開放式的移動(或非移動)應用端的整合體系。以目前在產業趨向于網絡生態化的角度來看,“大”系統(或者“大”整合)的概念已經成為主流,在這大趨勢下的產業面向用戶分析也勢必會帶來新的突破和挑戰,傳統信息分析方式和分析點是否能夠支撐現行用戶需求,能否成為以大數據為代表的決策支撐點都是有待考究,所以本文就以互聯網產業為代表性行業,針對其整個內外系統中是否存在隱匿用戶信息及信息獲取機制做出一定的分析,也是從數據整合角度出發對該類型問題做出探索。
2隱匿點獲取源分析
2.1企業內部系統的可拓數據
由于互聯網產業存在特殊性,對信息數據的記錄及細節點都十分完善,各個環節的信息內容都是存儲在相應的數據庫之中。就一般性的互聯網企業而言,其類BSS-CRM系統域中的產品及“套餐”系統(PPM系統)、客戶管理系統、VIP客戶系統、互動服務系統及線上營銷系統等都存在詳實的用戶數據信息,但是有些信息可能需要挖掘技術方可轉換成價值信息。此外,在該類型企業的計費系統域中,在線費用計算系統、經費管理包及賬務余額統計系統(ABM系統)也可以為企業提供用戶信息的隱匿內容,這種隱藏著的信息挖掘其實是在以大數據應用為代表的技術手段的實現。
比如,在互動服務系統中的用戶產品咨詢或故障報修率可以作為用戶是否具有產品脫離傾向的判斷和依據;客戶管理系統和VIP客戶系統中消費能力可以作為定制化或一般化產品推薦的有力指向等,也就是說,這種企業內部系統數據的挖掘程度越高,潛在的用戶信息就呈現得越明顯,見圖1所示。
2.2對外平臺系統的可拓信息
當前網絡平臺的呈現樣式不外乎三大類:企業常規網站、企業移動平臺(App應用端)及企業微平臺(企業微信及微博等),在此前關于企業網絡移動平臺的調研數據就顯示86%的用戶對App應用端存在“針對性使用”,即用戶使用存在針對性和有效性,那么企業通過對App應用端的分析以此來預測用戶心理也是具備針對性和有效性,由此可知,其不僅是外界與互聯網企業重要的交互窗口,更是可以來抓取用戶消費心理的重要渠道,評論區、者留言板塊及聊天記錄中都存在隱匿的數據,整合有效信息整理及處理冗余數據并加以分析可以從一定程度上對互聯網產品在用戶心里的重要程度及改進內容做出相應的指向。特別是根據App移動端的用戶下載量、退定量及更新比例等網絡平臺數據,可以很好地預測用戶對于產品的依賴程度,見圖1所示。
3隱匿數據過濾處理
3.1系統域數據存留機制
當前系統數據對于企業來說,本身是可以做到海量保存。但是運用數據做分析時就必須得做到有效性,而有效的數據存留在龐大的數據庫中就得實時做數據庫的壓縮處理,即對與“敏感數據”(企業想要得到的信息關鍵詞)關聯度較高的數據內容進行數據庫的壓縮,清理出冗余、無效的“脫敏數據”,以此在為數據做進一步分析前清理出計算空間。同時,根據企業想要得到的有價值信息內容的不同,可以建立N個關聯詞設置,以將相應匹配值較高的敏感數據進行分類,建立N個有效數據庫,以備進一步挖掘之用。見圖2所示。
3.2隱匿數據過濾流程分析
由上述分析可知,通過有效數據庫的建立可以大大減少冗余、無效或脫敏數據的干擾,但是并不意味著有效數據就一定可以用做分析,因為數據分析還存在時效性和選擇性的問題,N個有效數據庫在不同的研究對象前可以是單獨的抓取,也可能是混合交叉抓取。所以在各個有效數據庫的信息數據大規模集中的同時,由于有效數據庫中也有可能存在相似或者時效性等問題,比如企業App應用端和微平臺中存在相似的用戶操作記錄、留言信息或用戶繳費數據等,故還需要對敏感數據進行精簡和處理。
因對隱匿數據中各部分的原始數據已經弱化數量、提高質量,故數據的價值性有所提高,那么對于用戶潛在信息挖掘的程度也近一步增強。通過整合BSS-CRM系統域和對外平臺端系統的分布式數據挖掘,采取BI軟件技術等過濾及整合方式分析出用戶在產品方面的各種消費行為或產品本身質量問題等,進而對企業在市場決策中起到關鍵作用。見圖3所示。
4結語
對于互聯網產業來說系統域本身就是一個載體,其承載的不僅是顯性數據資源及用戶信息,更重要的是讓其成為企業在挖掘用戶潛在價值信息及重要數據的支撐點,系統集成而帶來的內部和外部子系統的可運用價值也會越來越高。數據本身其實是“靜止”的,不經過濾和分析,其價值性可能無法直接體現出來,而信息的價值就是在于幫助行業來做相應的決策,所以在以當前產業互聯網帶動各領域轉型升級的趨勢來看,隱匿數據的挖掘和分析已經成為各行業的重點技術手段并以此帶來更多的應用價值。