陳娜 張金娟 劉智瓊



摘要:為了解決電信資費手動配置周期長、復雜易出錯的問題,研究了以HNC理論為基礎的電信資費規則自動化配置方法。通過結合電信資費規則描述的主流模式,用HNC的方法論證了資費規則自動化配置的可行性,構建了電信資費描述的知識庫并進行驗證。最后,結合業務規則引擎給出了進一步的展望。
關鍵詞:HNC 資費規則 自動化配置
1 引言
目前,電信行業各運營商進入了全業務運營的時代,在激烈競爭的局勢下,企業提高自身競爭力的有效手段是更好更快地向客戶提供豐富優質的產品和服務。而產品面向廣大客戶最直觀的感受就是資費,因此如何設計覆蓋多層次用戶、結構好且吸引客戶的產品資費,成為運營商的重要戰略之一。
隨著業務的不斷發展,運營商越來越多采用打包捆綁的套餐方式進行資費定義,這樣內容復雜、種類繁多的套餐給了消費者足夠的選擇空間,可以獲得更大的消費者福利,但從IT實現的角度看也增加了系統實施的復雜度。由于IT內部的數據模型不便于市場前端人員理解,在實現資費規則配置即“業務語言”向“系統語言”翻譯的過程中需要增加大量的溝通成本,不管是在前臺使用讓人眼花繚亂的界面還是后臺靠人工寫復雜腳本導入的方式,都存在效率低、易出錯等局限性。
那么,能否不依靠人工進行資費規則的“翻譯”工作而由計算機完成自動化配置呢?本文試圖解決這一問題。首先描述目前電信資費的主要模式;然后介紹基于語義的自然語言理解體系HNC(Hierarchical Network of Concepts,概念層次網絡);再以HNC為理論基礎對電信資費描述進行句類分析,結合電信資費的特點,形成行業知識庫;最后結合業務規則引擎進行展望。
2 電信資費的主要模式
電信資費模式是指電信資費的結構模型,一般包括線性定價、二部定價、三部定價和捆綁定價等[1-2]。
(1)線性定價:顧名思義,價格曲線是一條直線,典型的如包月制和按使用量直接計算費用。
(2)二部定價:定價方案由兩部分構成,一是與通信時間無關的基本費,如“月租費”;二是按通信時間支付的使用費。早期的固話一般是這種定價模式,既有月租費也有通話費。
(3)三部定價:是在二部定價基礎上的一種變形,用一筆固定費用支付一定的業務消費量。一個典型的三部定價如“20元包80分鐘國內通話”,這20元既包含月租也包含80分鐘的國內通話費用[3-4]。
(4)捆綁定價:一般是上述定價模式的打包,即目前用戶常用的資費套餐。其優勢如下:
◆產品組合模式多樣,覆蓋多層次用戶,使用戶有更多選擇;
◆按照三部定價的高低設定資費檔次,固定收取的月租費可以幫助運營商穩定收入;
◆價格隱蔽性更強,普通用戶不容易在運營商之間做橫向比較;
◆合約制約束了客戶的在網時長,有效降低了客戶流失率[5]。
3 概念層次網絡(HNC)理論
HNC理論是針對漢語的特點提出的一種用于自然語言理解的理論。它將自然語言用抽象的符號體系表達,包括表達類別和層次特征的局部聯想脈絡、表示語義塊的句類和類別特征的全局聯想脈絡。全局聯想脈絡可以簡單理解為從句子的整體結構和上下文語境來理解一個具體的句子。
HNC理論歸納總結了7個基本句類和57個基本子句類,并通過大量語料考察發現,任何句子均可以通過這些句類(包括子類)或者這些句類的混合來表示,從而為計算機自動處理語言提供了嚴格的形式規范。
HNC理論將句子的下一級單位定義為語義塊,指出句子是由4種主語義塊和7種輔語義塊構成的。語義塊是句子的語義構成單位,形式上可以是一個詞、一個短語或一個句子。主語義塊構成句子的主體,形成句子的核心意義;而輔語義塊既不依賴于句類,也不對句子的整體意義構成實質性影響,它們由通常意義下的一部分狀語組成。自然語言的主語義塊有4種:特征E、作用者A、對象B和內容C;輔語義塊有7種:條件Cn(Condition)、手段Ms(Means)、工具In(Instrument)、途徑Wy(Way)、參照Re(Refer)、因Pr(Premise)、果Rt(Result)[6-9]。
本文主要借鑒了全局聯想脈絡中的語義塊思想來分析電信的資費描述,以期達到自動化配置的目標。
4 電信資費的句類分析及自動化配置設計
廣義的電信資費是電信產品的整體定價方案,包括資費描述和優惠兩方面的內容。資費描述是向客戶收取通信費用的基礎,而優惠則是對資費的調整或修正,依賴一定的資費而存在。典型的資費描述如“本地通話費0.2元/分鐘”,優惠如“如果總話費超過100元,則對長話費打8折”。由于電信資費更多描述的是領域內的專業術語,因此不用過于關注抽象概念的表達,更多應關注于如何理解句子。下面將分別對資費描述和優惠的不同情況展開句類分析。
4.1 資費描述分析
隨著全業務的不斷發展,運營商的資費描述框架逐步趨于穩定,一般采用上文中提到的捆綁定價方式,表1提供了一個樣例。
從表1可以看出,市場人員在描述資費時采用的是自然語言,導致資費配置工作對人員要求高,既要精通業務也要理解系統的數據模型。這種對自然語言的理解由于不同配置人員的素質不同或者與市場人員溝通不暢,很容易造成配置錯誤。其根本就在于這種自然語言的描述方式省略了大量“默認”信息,如表1中提到的“其他按照標準資費執行”,這里的“其他”、“標準資費”都是沒有明確的模糊信息。
對于資費描述來說,其核心就是某種產品在單位時間內的單價是多少,因此可以將復雜規則按照不同情況進行分解:
(1)當一條規則包含多個事件類型時,根據不同事件類型組可轉換成一組具有相同結果且格式一致的規則。例如:
規則1:套餐外,本地、國內長途、省內漫游主叫0.15元/分鐘;
規則2:套餐外,本地0.15元/分鐘;
規則3:套餐外,國內長途0.15元/分鐘;
規則4:套餐外,省內漫游主叫0.15元/分鐘。
規則1可以等價分解為規則2、規則3和規則4。
(2)當一條規則包含多個產品類型時,根據不同產品類型組可轉換成一組具有相同結果且格式一致的規則。例如:
規則5:套餐內包含天翼Live和189郵箱;
規則6:套餐內包含天翼Live;
規則7:套餐內包含189郵箱。
規則5可以等價分解為規則6和規則7。
基于以上分析可知,對于復雜的規則,通過上述方式的分解均可生成對應的一組單一形式的規則。對于這種單一規則,可以將其簡化為如下一般性表示:
資費描述=“誰的”+“什么費用”+“怎么計費”
(1)
借鑒HNC句類分析的思想,筆者將資費描述的一般性描述(式1)再進一步細化,得到了資費描述規則的六類“語義塊”,包括對象、事件類型組、事件類別補充信息、客戶相關特征、客戶消費情況和價格信息。其與HNC語義塊的對應關系如表2所示:
這六類“資費描述語義塊”中,對象、事件類型組和價格信息這三個主語義塊是不可或缺的,而事件類別補充信息、客戶相關特征和客戶消費情況這三個輔語義塊則允許省略。如圖1所示。
這樣通用的資費描述表示層可以寫成:
資費描述 ::= <資費名稱><資費描述段1>[資費描述段2]…[資費描述段n]
資費名稱 ::= <定價方案名稱>“。”
資費描述段1 ::= [對象{ “、”對象}<空格>]<資費描述句>“。”
資費描述句 ::= [{事件類別補充信息“、”}事件類別補充信息<空格>]
<事件類型組><空格>
[{相關特征“、”}相關特征<空格>]
[{客戶消費情況“、”}客戶消費情況<空格>]
<價格信息>
關鍵字描述為:
<對象> “的” [事件類別補充信息] <事件類型組>
[“當” [相關特征] [客戶消費情況] “時”] <價格信息>
其中,價格信息分為資費計算和優惠計算兩種情況,具體如下:
(1)資費計算:
“按”
(2)優惠計算
“按”<計算對象>“的”<計算帳目項> <計算方法>
再次回顧表1中的資費描述,按照上述“語義塊”定義進行句類分析及翻譯轉換后,得到了如下系統易于進行信息抽取的描述:
79元檔套餐定價:
寬帶的上網話單按0元每分鐘計算以上網費收取。
手機的國內非漫游主叫話單:當手機的通話時長不大于200分鐘時,按0元每分鐘累加分鐘;當手機的通話時長大于200分鐘時,按0.15元每分鐘計算以通話費收取。
手機的上網話單:當手機的上網流量不大于30 MB時,按0元每kB累加流量。手機的國內被叫話單按0元每分鐘計算,手機的天翼Live點對點短信話單按0元每條計算以短信費收取。
手機的省內漫游主叫話單按0.15元每分鐘計算以漫游通信費收取,手機的省際漫游主叫話單按0.29元每分鐘計算以漫游通信費收取,手機的WLAN上網話單按0.05元每分鐘計算以WLAN上網費收取,手機的WLAN上網話單按手機的WLAN上網費封頂500元生成手機的 WLAN上網費。
至此,表1中的大部分內容已經完成了翻譯轉換,但是“其他按照標準資費執行”這種隱含信息還未展示出來。對于這種隱含的信息,處理方式如下:
(1)程序處理時可以事先將所有的產品標準資費進行配置,一旦套餐中沒有定義某產品的資費,則可以使用默認資費。
(2)按照翻譯轉換的格式對“其他”的產品資費進行補充描述,如表1中沒有明確的普通點對點短信資費和WAP上網資費等。
4.2 優惠描述分析
優惠和狹義的資費是相對的,是對資費的調整或修正。常見的資費和優惠以二部定價、三部定價居多,可以總結為9種價格曲線,如圖2所示:
上述9種價格曲線可以在資費描述第六類語義塊的“價格信息”中進一步細化,得到如下模式:
價格曲線1:F(x)(y)X元包打Y元或Y單位使用量模式;
價格曲線2:B(x)包月模式(x元包月);
價格曲線3:F(x)保底模式(x元保底)+D(x)打折模式(打x折);
價格曲線4:F(x)保底模式(x元保底)+J(x)按使用量直接計算;
價格曲線5:J(x)按使用量直接計算+I(x)封頂模式(x元封頂);
價格曲線6:D(x)打折模式(打x折);
價格曲線7:J(x)按使用量直接計算;
價格曲線8:F(0)(y)(0元包Y單位使用量)+J(x)按使用量直接計算+I(x)封頂模式(x元封頂);
價格曲線9:F(0)(y)(0元包Y單位使用量)+J(x)按使用量直接計算。
進一步的,在描述優惠時,一般會有“客戶相關特征”和“客戶消費情況”等語義塊表示相關條件,如“閑時國內長途打9折”里的“閑時”或“如果總話費超過100元,則對長話費打8折”里的“總話費超過100元”。
4.3 電信資費描述知識庫
在明確了資費和優惠的分析、轉換方法后,六類“語義塊”的提出為建立電信資費描述知識庫奠定了基礎。這個知識庫的功能不同于一般語義知識庫,它提供知識、規則和推理三方面的信息,這樣轉換程序可以向該知識庫發出詢問,然后取得答案。表3給出了一個語義塊知識的例子。
表4給出了一個語義塊推理的例子,表達了從業務原語1到業務原語2的映射關系:
5 結束語
本文參考HNC的句類分析和語義塊的思想,論證了基于自然語言進行電信資費自動化配置的可行性,并結合資費描述的特點,構建了相關領域知識庫,為資費配置自動化設計提供參考。該自動化配置方案在某省進行試點后,已驗證能涵蓋80%的資費配置,大大減少了人工配置的工作量以及配置錯誤率。將文中構建的配置知識庫與業務規則引擎中的規則庫有效結合起來,能夠滿足復雜場景下多業務規則的沖突檢測、優先級判斷等需要,可以成為后續研究的一個方向[10]。
參考文獻:
[1] 唐守廉,張靜. 電信資費及其管制[J]. 電信科學, 2000,16(11): 1-4.
[2] William W Sharkey, David S Sibley. Optimal Non-linear Pricing with Regulatory Preference over Customer Types[J]. Bell Core Economics Discussion Paper, Bell Communication Research, 1992,50(2): 197-229.
[3] 姜正新. 電信資費模式研究[J]. 經濟理論與經濟管理, 2005(11): 39-44.
[4] 屈雪蓮. 我國電信資費套餐的制定策略研究[J]. 價格理論與實踐, 2010(5): 71-72.
[5] 鄭裕. 電信運營商套餐體系優化與價值評估模型研究[D]. 北京: 北京郵電大學, 2013.
[6] 黃曾陽. HNC(概念層次網絡)理論——計算機理解語言研究的新思路[M]. 北京: 清華大學出版社, 1998.
[7] 劉志文,郝惠寧,肖友芙,等. 自然語言語句的HNC表示[J]. 語言文字應用, 1998(2): 91-94.
[8] 晉耀紅. 基于HNC理論的句類分析系統的設計與實現[D]. 北京: 中國科學院聲學研究所, 1998.
[9] 黃友榮,徐向陽,吳霞,等. 一種提高自然語言文本水印容量的算法[J]. 計算機應用與軟件, 2007,24(8): 180-182.
[10] 肖剛,徐俊,張元鳴,等. 基于軟件配置模型的構件化領域框架研究[J]. 計算機應用與軟件, 2008,25(5): 90-92.★