王 倩,周鴻屹,孫欽東,羅作民
(1. 西安理工大學 研究院,西安 710048;2. 西安理工大學 計算機科學與工程學院,西安 710048)
餐飲行業作為促進國民經濟增長的重要支柱產業,一直以來都得到了社會各界的廣泛關注。近年來,我國餐飲行業發展迅速,從巨型連鎖企業到小型門店餐館眾多餐飲企業不斷涌現。行業發展的同時,產業規模和經營領域的擴大也使得企業之間的競爭狀況日趨激烈,再加上食品原材料成本、勞動力成本提升,管理人才匱乏等多方面問題,導致餐飲行業凈利潤率大幅下降。僅通過擴大經營規模,所取得的利潤效益不會有質的改變,企業的核心競爭力已經從規模競爭轉向運營競爭,忽略運營過程中的非必要損耗會對餐飲企業發展帶來極大的負面影響[1]。因此,建立完善的餐飲業防損管理系統,不僅可以規范餐飲企業服務行為,提高管理效率和內控機制,降低企業運營成本,增強企業競爭力,而且能夠在降低企業不必要損失的同時增加營業收入,這對企業可持續發展有重要意義。
目前針對防損相關的研究,大多都是通過管理者多年的管理經驗,或者大量的調研和統計分析進行的。Eriksson等人對瑞典零售店的食品浪費模式進行研究,通過建立合理的存儲記錄來減少和預防零售食品的浪費[2]。Lebersorger等人研究的是食品零售業防損,對食品損失潛在的影響因素和原因進行調查研究,為食品損失預防措施的制定提供依據[3]。童光森等人就連鎖超市防損管理的重點與難點入手,從防損區域的劃分、分流管理等環節闡述了對損耗的控制與管理工作,并介紹了各崗位控制損耗的具體工作內容[4]。
而餐飲行業由于其屬于勞動密集型產業,其內容和經營方式都具有多樣化的特征,針對餐飲業的防損研究少之又少。本文提出的餐飲業防損管理系統,可以從“節流”角度減少企業內部由于管理缺失,規章制度不完整等因素造成的損失。通過分析企業運營數據,從服務、經營過程發現各類異常事件并建立相應的異常事件識別模型。同時為了保障模型識別的準確性,方便管理者的調查,我們采取異常事件關聯定位,視頻回放驗證等方法盡可能地還原損失發生的場景,讓管理者隨時隨地獲取損失數據,查看損失情況,減少管理者審計流水數據的工作量,降低管理成本,間接地增加營業額和利潤,促進企業健康發展。
餐飲企業中,客戶的賬單數據和內部計件數據包含大量反映企業經濟狀況的重要信息。本文所使用的相關研究數據都來源于2016年3月1日到2016年10月31日某連鎖餐飲企業的具體運營數據,其中包括的所有賬單流水,付款流水,服務員詳細計件數據,視頻監控數據等。
防損管理系統基于企業運營期間的各種數據,針對目前企業服務不規范導致的企業非正常利潤損失問題,首先對餐飲數據非結構化、形式多樣的數據進行預處理,其次在優化處理后的數據基礎上研究企業服務流程,分析服務過程各類異常事件產生的原因,建立異常事件識別模型,最后再通過視頻監控回溯的方法對異常事件的場景進行定位回放,查看當時的損失具體情況,為管理者對運營過程中的異常處理提供可靠的證據支持。系統框架如圖 1所示。
通過仔細審閱門店人工稽查確認的異常賬單數據和服務員計件數據,并與相關經理人員討論后,我們總結了以下三種類型異常事件:
(1)漏記油碗:油碗是火鍋中重要的調味品。由于自助油碗的存在,用餐時油碗的數量是需要服務員來記錄的。當就餐人數較多,服務員可能會漏記中途新來的顧客或者口述不需要油碗但依然使用的顧客。

圖1 防損管理系統框架Fig.1 Framework of the loss prevention management system
(2)優惠吃單:打折和優惠是餐飲企業常用的促銷手段。但是在具體實施過程中,有的服務員會利用自己的權限以及結賬流程中的一些漏洞,將本應該優惠給顧客的利益據為己有。
(3)虛增計件:員工工資的一部分是按工作量來計算的。餐飲企業運營過程中,有一些工作量是通過員工自行打卡統計的,比如傳菜次數,服務次數,洗碗時間,參與活動次數等。因此會出現員工為牟取更多工資而虛增自己的工作量。
根據業務流程和異常事件以下列出了一些異常事件的真實案例說明。漏記油碗常發生于顧客就餐時期,最典型的案例就是,起初只有兩位顧客用餐,中途又來了兩位顧客,由于服務員工作失誤,忘記增加新來顧客的自助油碗費用,結果導致餐飲利潤損失。虛增計件,大多表現為服務員會自行虛報就餐人數以及服務次數,從而增加自己的工作量。優惠吃單異常事件常發生于餐后,不同服務員擁有不同的優惠權限,若顧客看完預結賬賬單后將錢交給服務員后匆匆離開,服務員便有可趁之機,使用自己的優惠權限對賬單進行優惠后再去結賬臺結賬,將本應該是顧客享受的優惠金額納為己有。
通過對業務流程的分析是為了更加深刻地理解三種異常事件產生的原因和時期,有助于熟悉應用場景和特征選擇。用于數據分析的原始數據可能包含十幾項屬性,其中一些屬性與分析不相關,遺漏相關屬性或留下不相關屬性都是有害的,通過刪除不相關的屬性即特征選擇過程[5]。特征選擇不僅可以減少特征數量,使模型泛化能力更強,減少過擬合,而且好的特征選擇能夠提升模型的性能,更能增強我們對特征和特征值之間的理解。特征選擇過程如圖2所示。具體步驟如下:

圖2 特征選擇過程Fig.2 Featur e selection process
(1)初步預處理原始數據后,根據餐廳經理提供的先驗知識和與數據屬性,可通過人工篩選得到一組特征全集。
(2)從特征全集中產生出一個特征子集,然后用評價函數對該特征子集進行評價,評價的結果與停止準則進行比較,若評價結果比停止準則好則停止,否則就繼續產生下一組特征子集,繼續進行特征選擇,直到選出最佳特征集為止。選出來的特征子集一般還要驗證其有效性。
一個最優的特征屬性子集會為后續的評價過程提供良好的基礎。搜索的算法分為完全搜索,啟發式搜索,隨機搜索3大類。完全搜索包括廣度優先搜索(BFS),分支限界搜索(BAB)[6],定向搜索(BS),最優優先搜索(BFS)[7]等;啟發式搜索包括序列前向選擇(SFS),序列后向選擇(SBS),雙向搜索(BDS),增L去R選擇算法(LRS),序列浮動選擇(SeqFS),決策樹(DTM)等;隨機算法包括隨機產生序列選擇算法(RGSS),模擬退火算法(SA),遺傳算法(GS)[8]等。評估函數一般分為五類:相關性,距離,信息增益,一致性和分類錯誤率。常用的有平方距離、歐式距離、非線性測量、Minkowski距離、信息增益[9]、最小描述長度、互信息[10]、一致性度量、分類錯誤率、分類正確率等。根據需求,本文目前所使用的搜索算法是最優優先搜索(Best First Search),也就是回溯的貪婪搜索算法進行特征子集的選擇。評估函數則通過相關性度量,綜合考慮每一個屬性的預測能力和他們之間的關聯性進行評估。
特征選擇結果對后續的異常事件識別至關重要。根據前面提出的特征選擇方法,針對每一種異常事件,我們篩選的最終特征集如表1所示。由表中可以看出,最終特征集中的特征都來自于原始數據屬性或者他們的組合。

表1 不同異常事件的特征集Tab.1 Features of each exceptional event
選擇好合適的特征之后,要挑選適當的分類模型來識別具體的異常事件。不同的分類模型適用于不同的數據情況和應用場景,有不同的優缺點。比如決策樹易于理解和解釋,它能夠在相對短的時間內對大型數據源做出可行且效果良好的結果,但是對于各類別樣本數量不一致的數據,信息增益的結果偏向于具有更多數值的特征[11];人工神經網絡分類的準確度高,并行分布處理能力強,而且能充分逼近復雜的非線性關系,具備聯想記憶的功能,但大量的調參工作會影響到結果的可信度[12];SVM(支持向量機)可以解決小樣本情況下的機器學習問題,可以解決高維問題,但它對缺失數據很敏感[13-14];樸素貝葉斯發源于古典數學理論,有堅實的數學基礎和穩定的分類效率,它的優點需要設定的參數很少,對缺失數據不太敏感,算法也易于理解[15];KNN算法簡單有效,重新訓練的代價較低,對類域的交叉或重疊較多的待分樣本集來說,較其他方法更為合適,但不適用于樣本容量較小的類域[16]。集成學習是對多種分類方法的融合,它通過連續調用單個學習算法,獲得不同的基學習器,然后根據規則組合這些學習器來解決問題,這需要分配合適的權值[17-18]。通過對比多種分類算法,本文選擇使用樸素貝葉斯模型。
進行了多組對比實驗來說明樸素貝葉斯方法的合理性,表2是樸素貝葉斯方法與其他分類模型的實驗比較結果。由實驗結果可看出,樸素貝葉斯模型分類效果比其他分類模型更好。在數據規模不是特別大的場景下,該分類模型準確率較高而且對異常值不敏感。因此,采用樸素貝葉斯模型來識別異常事件。

表2 樸素貝葉斯與其他分類模型的實驗比較結果Tab.2 Comparison between different methods
合理的防損查證方法是防損管理系統中的關鍵環節,在建立好防損模型以后,對經營數據進行實時處理,通過防損管理系統對異常事件進行預警,管理者在需要確認損失是否發生時通過關聯數據的源頭視頻,查看任意時間段經營視頻,驗證防損預警的真實性,保障企業以及服務人員合理利益。防損查證主要包括三方面內容:
(1)異常預警機制。通過防損建模過程對經營數據進行定量分析,通過消息提醒、信息推送等多種方式,對企業運營過程中產生的異常事件進行預測并向管理者發出預警信息。
(2)異常事件定位與處理。根據模型識別出的異常事件,將處理后的數據與產生損失場景模型進行比較,匹配實際損失數據,快速定位異常事件場景。
(3)回溯驗證方法。為了驗證拋出的異常事件確實造成企業經營損失,利用基于自適應流媒體技術視頻監控系統,通過關聯數據的源頭視頻,對產生損失的場景進行視頻回放,實現異常事件有源可查。
目前,各類餐飲企業門店都安裝有視頻監控系統,由于視頻內容的文件大小等原因,具有快速回溯功能的查證方法是防損系統的關鍵。現有基于像素域的關鍵幀提取方法大多建立在視頻完全解壓的前提下,計算量較大,效率較低,難以滿足實時性。
為了保證在任意網絡環境下取證視頻的清晰播放,基于H.264對實時視頻播放質量進行改善[19],在保證播放流暢性與準確性的前提下解決網絡情況較差情況的視頻播放問題。本文采用基于鄰近 I幀DC圖像相似度的壓縮域關鍵幀提取方法,可以快速準確地完成網絡視頻關鍵幀提取過程,解決現有關鍵幀提取方法存在的只能處理單一視頻標準的缺點,有效減少視頻處理的數據量,降低計算的時空復雜度,提高視頻內容分析的效率[20]。圖3為關鍵幀提取流程。

圖3 關鍵幀提取流程圖Fig.3 Flowchart of the key frame extraction
本方法在壓縮域上直接進行關鍵幀提取,根據相鄰 DC圖像之間的相似度,將圖像聚類成不同的簇 Class(簇內相似度接近,簇間差異較大),隨機提取簇內任意幀組成關鍵幀序列。能夠提高視頻內容分析的速度,可以快速完成網絡視頻關鍵幀提取過程,并保證結果的有效性和準確性。
防損管理系統主要分為三大部分:
(1)異常事件判斷。主要功能為系統將收到的事件數據根據模型進行篩選,當事件被識別為異常時,將該異常事件拋出;
(2)異常事件數據接收。主要功能為實時接收拋出的異常事件數據,進行存貯,這些數據能夠按照不同時間、類型選擇進行統計展示;
(3)異常事件產生時對應的視頻數據。主要功能為當稽查人員對異常事件進行分析時,系統能夠將對應信息的視頻數據進行回放取證。
圖4為店面總覽頁面,此頁面可以實時查看各店交易事件和異常事件的狀態,分店連接狀態等。
圖5為分店巡視頁面。此頁面可以查看指定異常事件以及對應的處理情況,并且可以按時間或事
件對指定異常事件進行影像回放,也具有支持畫面截圖功能。

圖4 店面總覽頁面Fig.4 Page of store overview

圖5 分店巡視頁面Fig.5 Monitor page of individual store
圖6 為統計分析頁面,以圖形化或報表方式展示各種統計數據,支持用戶自定義統計類型,方便管理者的分析使用。
未來餐飲行業發展趨勢要求中提高企業管理水平與競爭力,借助信息化技術提高人員效率、降低企業運營成本以及標準化、規模化發展是企業未來發展過程中的核心要求。本文實現的餐飲業防損管理系統,可以幫助餐飲行業的管理者及時發現異常事件,盡可能地還原損失發生的場景,并通過視頻查證的方法定位損失的具體內容,讓管理者隨時隨地獲取損失數據,查看損失情況,減少管理者審計流水數據的工作量,降低管理成本,間接地增加營業額和利潤,促進企業健康發展。

圖6 統計分析頁面Fig.6 Page of statistical analysis
[1] Zhang L. Model projections and policy reviews for energy saving in China's service sector[J]. Energy Policy, 2013, 59:312-320.
[2] Eriksson M, Strid I, Hansson P A. Food losses in six Swedish retail stores: Wastage of fruit and vegetables in relation to quantities delivered[J]. Resources, Conservation and Recycling,2012, 68: 14-20.
[3] Lebersorger S, Schneider F. Food loss rates at the food retail,influencing factors and reasons as a basis for waste prevention measures[J]. Waste Management, 2014, 34(11):1911-1919.
[4] 童光森, 肖威. 連鎖超市防損分區與分流管理淺析[J]. 商場現代化, 2014(7): 93-93.
[5] 毛勇, 周曉波, 夏錚, 等. 特征選擇算法研究綜述[J]. 模式識別與人工智能, 2007, 20(2): 211-218.
[6] 王春梅. 分支限界算法的研究與實現[J]. 現代電子技術,2011, 34(9): 121-123.
[7] Dechter R, Pearl J. Generalized best-first search strategies and the optimality of A*[J]. Journal of the Acm, 1985, 32(3):505-536.
[8] 吉根林. 遺傳算法研究綜述[J]. 計算機應用與軟件, 2004,21(2): 69-73.
[9] 鐘寧, 尹旭日, 陳世福. 基于信息增益的最佳屬性集發現方法[J]. 小型微型計算機系統, 2002, 23(4): 444-446.
[10] 徐峻嶺, 周毓明, 陳林, 等. 基于互信息的無監督特征選擇[J]. 計算機研究與發展, 2012, 49(2):372-382.
[11] 王小巍, 蔣玉明. 決策樹ID3算法的分析與改進[J]. 計算機工程與設計, 2011, 32(9): 3069-3072.
[12] 毛健, 趙紅東, 姚婧婧. 人工神經網絡的發展及應用[J].電子設計工程, 2011, 19(24): 62-65.
[13] 丁世飛, 齊丙娟, 譚紅艷. 支持向量機理論與算法研究綜述[J]. 電子科技大學學報, 2011, 40(1): 2-10.
[14] Xiao xiao, Xu Qihua. A Comparative Research on the Classification and Regression Based on SVM and BP[J]. The Journal of New Industrialization, 2014, 4(5): 48-53.
[15] 王國才. 樸素貝葉斯分類器的研究與應用[D]. 重慶交通大學, 2010.
[16] 閉小梅, 閉瑞華. KNN算法綜述[J]. 科技創新導報,2009(14): 31-31.
[17] Polikar R. Ensemble Learning[J]. Scholarpedia, 2012, 4(1):1-34.
[18] 王兵. AdaBoost 分類算法的數學分析[J]. 軟件, 2014,35(3): 96-97.
[19] 蔣敏, 周亞建, 張斌. 一種基于量化的H.264視頻水印算法[J]. 軟件, 2013, 34(8): 46-51.
[20] 孫欽東, 王倩, 郭曉軍等. 基于鄰近I幀DC圖像相似度的壓縮域關鍵幀提取方法[P]. 中國, ZL200910022941.4, 2011.