倪迎花
摘 要
隨著社會的進步與科技水平的提高,互聯網在各個領域被廣泛的使用,為了實現更好的組織決策和服務,互聯網管理人員對大數據的重視程度越來越高,對大數據進行了詳細的獲取、應用以及分析的深入研究。就目前而言,手機使用率與普及程度已經達到了很高的程度,移動互聯網APP的用戶也在不斷的增加。為了有效的開發和改良APP軟件,時其可以更好的服務于客戶,相關的APP管理人與開發人員需要針對用戶群體進行高度分析與調查,認識客戶的需求,如此大量的數據分析也就需要構建相應移動互聯網APP數據倉庫,開發人員也需要對這項工作高度的重視。本文通過分析移動互聯網APP數據倉庫的應用,提出有效的具體策略,以供開發者參考與借鑒。
【關鍵詞】移動互聯網 APP 數據倉庫 應用分析
網絡信息技術如今正處于高速發展的階段,大數據逐漸被社會各界重視起來,數據倉庫作為數據挖掘和分析的重要平臺,在各個行業中被廣泛的使用。數據倉庫可以記錄每一個人網絡中進行的操作與行為,并以數據的形式存儲起來,為開發者與管理者提供了大量的數據信息,穩定了數據來源。移動互聯網APP自身具備便捷、用戶流量較小、數據變化快速等特點,對于此特點使用現有的大型數據倉庫并不合適,可以針對移動互聯網APP的特點開發適用于其的數據倉庫,對移動互聯網的用戶行為與需求進行有效的收集和存儲。
1 建立適用于移動互聯網數據倉庫的必要性
數據挖掘與分析是目前人工智能與數據倉庫的熱門要點,目前這樣的數據處理技術是通過數據庫,將其中的有價值的、隱藏的數據抽離出來,為開發者與管理者策略提供相應的線索。數據倉庫則是實現這一技術的重要平臺,其通過將用戶的行為與需求已數據的形式進行記錄,建立龐大的數據集合,為開發者與管理者提供有效的信息。
目前,智能手機的普及程度在不斷的上升,移動互聯網的用戶也在不斷的增加,可以說現在每一個人都可以使用手機在互聯網上進行活動,已經成為了人們日常生活當中不可缺少的必須品。手機具有通信、娛樂、購物等眾多的功能,占據了人們日常生活的大部分空間與時間。為了跟隨時代的腳步,更好的為手機用戶提供服務,移動互聯網的開發者開始著手于對數據倉庫的建設,利用先進的數據技術,對用用戶的需求進行詳細的分析與研究,就手機用戶流量小、數據變動較快、數據復雜的特點而言,構建適用于移動互聯網的數據倉庫迎合了時代的腳步又滿足了用戶的需求,是十分必要的。
2 移動互聯網APP數據倉庫的應用需求
關于移動互聯網APP的數據挖掘與分析,其自身具有一定的用戶使用的規律與特點,因此要構建適合移動互聯網APP的數據倉庫。首先,移動互聯網APP其自身的數據規模并不是很大,由此可見數據倉庫的構建并不需要大型的,要更加的靈巧、便捷,并且不會占用大量的儲存空間,能夠及時的反應用戶的行為。再者,移動互聯網APP的數據是在時刻變動的,沒有相應的規律可循,這就需要數據庫頻繁的上傳數據,盡快對實時的用戶數據進行分析和處理,為開發者和管理者留有充裕的時間做出決策。最后,數據倉庫要具有一定的安全性與有效性,避免數據丟失與遺漏的情況出現,為移動互聯網APP開發者上傳有效可觀的數據資料,保持其數據、信息與參數的高度統一,確保數據的準確性與可行性。
3 移動互聯網APP數據倉庫的設計思慮
在滿足移動互聯網APP數據倉庫的需求之后,開發者對數據倉庫的設計思路只要符合移動互聯網APP的特點與數據的規律就可以初步實現。構建移動互聯網APP數據倉庫包括以下幾個方面:首先,需要明確用戶在使用APP的時候所展現的形態,這種形態表現為關系型的數據聯系,其中包括了:個性信息、粉絲群體以及與其他用戶的互動行為,以及用戶自身的登錄時間規律等。因此關于數據的分析與記錄的工作,需要從數據之間的兼容性以及數據看的從屬關系入手,將數據自動同步到數據倉庫之中。再者,用戶在使用移動互聯網APP的時候,所產生操作數據,可以及時的在服務器上產生相應的日志。這些日志一般都是以文件的方式儲存而來的,規模較大、內容較為隨意。對于這樣的數據我們需要做的就是在規律性的時間內對這些數據進行整理并錄入到數據倉庫當中,在轉化這些數據的時候,需要保證數據的安全性與有效性,避免對數據進行改變。其次,客戶端產生的數據,以及數據的形式都不具備規律性擁有較大的隨機性,但是這些數據往往反映了用戶對APP的使用情況。這類信息的存儲要保證一定的完整性,以便管理者與開發者可以有效的分析用戶的行為規則,探索用戶實際的操作行為。最后,對于前端數據的錄入到數據倉庫之中,首先需要對這些數據進行檢驗,確保數據的一致性,排除多余參數與無效格式(如圖1)。
4 移動互聯網APP數據倉庫應用實踐
4.1 移動互聯網APP數據庫收集的數據情況
在互聯網APP投入使用的過程當中,原始數據和變遷數據的表現形式主要變現為以下三個方面:
(1)同步到繼承前端數據倉庫中的數據,這一類數據,是未經過加工的數據,具有較好的即時性,以及自我同步與可隨時查閱的特性。由于這些數據沒有經過處理,因此這一類的數據不利于整合與分析,更適合作為即時信息進行查閱。
(2)通過服務器手機的數據,這些數據是經過格式化處理的信息,被收錄在數據倉庫已經建立的好的數據表格當中。但是由于用戶的行為不斷的變動所以日志的內容也在不斷的增加與更行的,因此對于這一類的信息,通常需要經過固定時間來進行收集。在收集記錄這些數據的時候,系統會對于之前的信息進行切斷性的總結,避免數據出現丟失與損失。日志數據要比前一個數據占有更多的空間,對此,這部分數據需要比之前的要大10倍,同時采用階段式的數據收集方式,避免別前端數據的影響。
(3)來自客戶端的集成日志。來自客戶端的操作日志,具備有序性、不完整性,它們是非格式化的數據。為保證其完整和規范,需要在導入到數據倉庫前,集中對其進行格式化的操作。首先,需要進行數據清理和補齊。因為這部分數據在收錄過程中會收錄到系統自動生成的日志或者機器人操作產生的日志,因此,需要根據 APP 自身的特點,進行數據清理。而部分數據會有缺失字段的現象,通過設置,可以對發生字段缺失的數據進行補齊。然后,對數據進行格式化處理,將所有字段進行整理,形成統一完整的文本。最后,在數據倉庫中建立好與格式相匹配的數據表,將格式化后的數據信息導入到數據倉庫中。
4.2 實際應用與數據倉庫的管理
移動互聯網APP數據倉庫的具體管理方式對應其表現的數據形式,這一部分是數據倉庫運行的關鍵。移動互聯網APP數據倉庫的具體管理方式為一下這三個方面:
4.2.1 利用關系數據庫系統
海量的數據存儲,要保證其有序可操作行,就必須利用關系數據庫系統,通過大量的時間積累,數據在不斷的增加,關系數據庫可以保證這些數據有序的運行并且依然具備可操作性。
4.2.2 并發操作技術的應用
對于APP而言其用戶的訪問量較而且較為集中,數據之間常處于并行狀態,這就需要采用并行操作,將用戶的需求都可均勻的滿足,不會出現網絡擁堵的狀態。此外關于整體數據的處理,并行操作還可以對所有的數據進行查詢和分解,使得數據擁有高利用率。
4.2.3 優化支持查詢
移動互聯網APP數據倉庫的關系數據對于決策的查詢功能還不完善。但是結合優化過后的查詢其等技術,可以使得決策的查詢處于合理化有效化(見圖2)。
數據倉庫最主要的功能就是對數據的表現以及分析,其可以有效的反應數據的具體情況,為開發者與管理者提供相應的對策。如今的移動互聯網APP數據倉庫對數據的表現形式主要集中在多想數據的挖掘以及分析上面。在數據倉庫的運用當中,多為分析起到了重要的作用,可以幫助開發者與管理者從多個元度進行比較,數據統計的方式已經被廣泛的運用,并且其收益十分之高。
5 結語
移動互聯網APP數據倉庫的使用可以為APP開發人員提供海量的參考信息,可以更加便捷快速的了解用戶的需求與滿意程度。數據倉庫的應用在數據挖掘中具有很高的使用價值和更高的性能,此外,數據倉庫的投入較少,性價比極高。其在大數據挖掘、分析以及移動互聯網APP領域有著較高的發展空間。要開發者更深入的進行了解與創新,使數據倉庫發揮自身的價值與潛能,為開發者提供更為有效的信息。
參考文獻
[1]黃國賢.移動互聯網APP數據倉庫的應用實踐研究[J].科技傳播,2016,8(03):67,75.
[2]沈偉,汪海航.移動互聯網APP數據倉庫的實現與應用[J].科技風,2015(06):93-94.
[3]賈慶華.移動互聯網APP數據倉庫的應用實踐研究[J].通訊世界,2016(09):30-30.
[4]王恂.大數據背景下基于Hbase技術的移動統計平臺研究[J].無線互聯科技,2015(13):47-48.
作者單位
江蘇省鎮江市高等職業技術學校 江蘇省鎮江市 212000