張競賢
一、引言
目前已有基于通話基站的區域化模型可以實現中國移動手機用戶的粗略定位,就是先找出該住宅小區附近的網絡基站,然后找出在該網絡基站下面經常通話的用戶就判斷為該小區用戶,但是因為基站不可能只覆蓋一個住宅小區,這種方法勢必會把在該基站下面通話但是只是居住在附近不是該小區的用戶歸到該小區,誤差較大。所以迫切需要一種新的算法可以實現住宅小區用戶的精確定位。
二、解決方案
2.1 解決方案概述
同一住宅的小區會有一些共性的通話行為,比如會跟同一個物業電話進行聯系,通過分析小區用戶的撥打行為,通過加權判分最后排序篩選的方法找出該小區的類似物業電話的具有很強小區內部屬性的電話,再反推出本小區用戶的方法,可以更精準的判斷同一小區歸屬,更具有現實的準確性。
2.2 具體解決方案
步驟一,提取出通信運營商經營分析系統中的數據倉庫中用戶的通話信息,包括用戶號碼、通話時間、通話地點等信息;步驟二,確定用戶的歸屬基站,以用戶晚上的最后一次通話基站確定為其歸屬基站,從而將所有用戶按照基站分好類;步驟三,由于同一小區客戶一般都撥打過具有很強小區內部屬性的電話,如該小區的物業電話,后期維修電話等,所以查詢同一基站下面用戶的話單,都撥打過某一具有很強小區內部屬性的電話的可確定為同一小區用戶。下面關鍵是如何確定小區內部屬性電話。我們以基站為最小單位統計該基站下面所有用戶的通話,按照撥打過某一對端號碼的人數占基站總人數的百分比進行降序排列;步驟四,對于超過50個基站下面的用戶共同撥打過的號碼是10086、114等公共電話,予以剔除后,取前10個號碼為疑似小區內部屬性電話,并且對前10的號碼按照斐波那契數列進行打分處理,前十名得分分別為:89,55,34,21,13,8,5,3,2,1;步驟五,將全區所有基站下面的號碼的分值相加,分數超過1000分的說明有很多小區的用戶會經常打該電話,分數低于10分的說明很少有用戶打這一電話,都不能作為區分小區的標識,刪除這些號碼后重新執行步驟四,選出前十號碼,再執行步驟五,一直循環執行,直到號碼全區累加的分數都在10-1000之間。步驟六,A基站排名第一的號碼可確定為該小區的內部屬性電話,與該號碼有通話行為的可確定為同一小區用戶。如果B基站下面的用戶也有與該號碼通話并且兩個基站的歸屬用戶有不少有在對方基站通話的經歷并且基站經緯度表中二者距離較近,可確定兩個基站用戶為同一小區,將B基站下與A基站排名第一號碼通話的確定同一小區用戶。以此類推,可將不同基站劃分為同一小區;步驟七,上面確定了該小區撥打過小區內部屬性電話的用戶,同一個家庭可能只有一個人撥打該電話,對于其他家庭成員的確定可通過家庭網、互相通話和交往圈重合度來確定,可以按照每月通話20次以上,通話次數排名前10,非上班時間通話天數,非上班時間通話次數均在前3的條件來計算家庭交往圈,并且使用已知集團用戶或家庭用戶關系的其中一方除已知關系外的所有關系作為反例,產生訓練集來交叉驗證; 步驟八,通過以上步驟可以將全區的移動用戶分到一個個的小區,而小區名字的確定,一是可以通過網絡部基站和小區的對應關系來確定,二是辦理過移動或者鐵通寬帶的用戶都需要錄入小區名稱和地址,可以從數據倉庫中取得小區名稱。至此,通過數據倉庫找到具有小區內部屬性的電話從而確定小區用戶的流程結束。
三、實驗結果
對這一模型,采用了外呼驗證的方法進行驗證,通過客戶服務中心組織向隨即抽取的1000位模型識別客戶進行外呼,獲得有效答復876個,結果顯示小區屬性識別率為73%。綜合評定:本發明彌補了現有的通過基站只能粗略的判定該用戶在該小區附近,會把在該基站下面通話但是只是居住在附近不是該小區的用戶歸到該小區,可以更精準的判斷同一小區歸屬,有利于針對小區用戶的精細化營銷的實現。
四、結論
本成果,通過經分系統對話單、信令的大數據的處理能力,基于數據倉庫,實現了對中國移動手機用戶住宅小區的精準定位,并通過異網交往圈判定,準確定位了聯通和電信用戶,準確率達到70%,構成了完整的寬帶精確營銷目標用戶分析支撐體系。
本成果解決的上述問題,傳統的人工方式和普通的技術手段均無法解決,填補了中國移動精準營銷領域的空白。另外,該成果使用的分析模型和算法估計可在較長時間內保持穩定。本成果得到的目標客戶清單是企業寶貴的無形資產,且除了可用于寬帶精準營銷這一成果外,完全可推廣于其它需要客戶精細畫像的領域,具有很高的應用價值。
?地址,改成石家莊維明大街南二環中華城2107,趙雪收13582041882