張永勐 李紅偉 周榮培 潘偉
ZHANG Yongmeng1 LI Hongwei2 ZHOU Rongpei1 PAN Wei1
1.美的集團IoT 廣東佛山 528311;2.中國家用電器研究院 北京 100176
自1999年物聯網(Internet of Things,IoT)概念首次出現以后,作為一個應用概念,其將傳統網絡的概念擴展到了包括智能家居在內的眾多領域,從而產生了驚人的應用可能[1]。隨著家電網絡化,App遙控、定時[2]等遠程控制能力的逐步實現,智能家電已步入物聯網時代,艾瑞咨詢研究院自主研究表明,智能家電整體規模預計2022年突破4200億,智能家居行業已進入AIoT賦能期。
伴隨物聯網技術的演進,用戶從手動操作家電,演變為可以通過手機App遠程控制,甚至是多品類家電的場景自動聯動觸發。家電聯網、App、云計算等領域的技術發展給質量評價帶來新機遇的同時,質量改善也面臨前所未有的新挑戰。
對于物聯網的質量管理,很多學者進行了相關研究,李紅偉[3]對智能家電App軟件質量測評方案進行了研究,主要從用戶使用角度出發,以黑盒測試為主要方法,從App軟件產品質量和使用質量兩個方面發現質量問題。王文斌[4]建立了一個多層次的物聯網質量測評體系,從最初供應商開始直至最終用戶為止的整個流程提高客戶的滿意度。對于傳統行業的硬件質量改善,很多學者也進行了相關研究,余瑾[5]通過研究形成了一套較為完整的質量改善方法,建立了質量改善項目管理流程和項目管理制度,將質量改善形成了標準化的作業。朱玉杰[6]為了更好地適用質量改善項目實施的優先級排序,FMEA的一些術語需要進行適當的重新界定,基于模糊集理論,采用模糊語言對改善主題進行評價,并且使用熵權法客觀賦權,考慮了主、客觀綜合權重。
隨著智能家居產品走進千家萬戶,質量改善也變得越來越重要,雖然學者們對物聯網質量有很多深入的研究,但逆向的質量改善研究較少,尤其是基于大數據質量分析與應用研究更少,因此本文研究基于用戶大數據分析的物聯網家電質量改善模型,融合家電行業傳統質量分析方法和互聯網的大數據分析方法,并研發相關的物聯網質量管理平臺,使質量人員可以實現物聯網家電質量數據的精準定位、量化評價、監控預警和閉環改善,最終實現物聯網家電質量的全面改善。
家電物聯網化的根本目的是向用戶提供整套的產品與服務,物聯網家電的硬件和軟件質量對于用戶體驗的影響同等重要。現階段傳統的家電質量改善方法主要存在以下三個問題:
(1)傳統質量改善方法側重硬件本身,缺少對全鏈路問題的分析
物聯網雖然已發展多年,但大多的質量人員將更多的關注點放在了家電產品終端側,前期的質量改善更多以硬件為主,并基于市場維修的外退故障件進行失效分析,定位具體的元器件問題,進行專項改善;而物聯網的質量改善需要軟硬兼施的全鏈路、全流程的質量改善。
(2)傳統質量改善方法更多是基于被動收集用戶問題
傳統的質量改善方法,主要是基于市場維修率、退換貨、電商差評率等被動的方式收集用戶投訴的市場問題,從而進行分析改善,缺少主動收集用戶不良問題的機制與能力,同時缺少海量的用戶大數據行為分析,更多是基于分析用戶已知、可視的問題,缺少行為的大數據分析預測及改善。
(3)傳統質量改善周期長,閉環難度大
傳統的質量改善涉及硬件的分析改善,從上層的家電產品,定位到零部件甚至原材料的問題,最終到備貨、排產及實物的切換,周期較長;同時從原材料的備貨、零部件的切換到總裝車間的排產以及最終市場的銷售庫存清理,最終到用戶手上需要近半年的時間,再加上其他可靠性的問題,最終改善后的效果及獲得市場數據的反饋需一年或更久;傳統的質量改善無論整改切換的周期,還是問題閉環數據的反饋周期都是非常長的,對于用戶體驗的改善效果往往無法及時反饋。
隨著越來越多的家電互聯,匯聚到云端的數據也越來越多,進而形成家電物聯網大數據。離開了大數據的存儲和處理能力,物聯網家電的場景化服務能力將被嚴重削弱,價值不能得到充分發揮;而大數據離開了物聯網家電,就如傳統的信息系統因為無法及時地獲取物理世界中的信息和狀態,進而無法進行及時反饋,使得數字化的效率大幅降低。家電借助物聯網大數據,則可高效的在數字世界中刻畫和描述物理世界,并評估、指導管理、決策,使物理世界更加有序的運行。智能家居億級設備的大數據已然存在,借助物聯網大數據來反向實現家電產品和服務質量改善將有效解決上述傳統家電質量改善方法存在的問題。
從傳統的家電質量改善方法升級到物聯網質量改善方法,關鍵是能實現全鏈路問題的分析,首先要在現有傳統硬件質量改善基礎上重新建立一套全新的質量數據評價模型,并根據模型建立一套主動收集和定位用戶問題的方法,覆蓋用戶在智能家電使用過程中的各個環節;其次通過大數據的專業分析方法進行問題量化評價及監控預警;最后通過一個整體的物聯網質量平臺來實現數據的及時可視化,從而形成對問題的閉環改善機制。
物聯網家電的核心功能點在于滿足用戶遠程控制家電設備、建設個性化智能場景、獲取推薦內容和售后服務。物聯網家電質量的重點是關注核心功能在家電終端上是否正確實現、用戶是否滿意等。
用戶滿意與否主要通過用戶對產品和服務各方面的體驗來反映。用戶體驗通常包含了視覺感受、界面友好性、功能易用性等方面。視覺感受很難通過客觀數據量化的方式進行度量,但核心功能的易用性卻可通過一些客觀數據來衡量。考慮物聯網產品和服務功能受用戶機型、手機內存、網絡環境、用戶操作路徑差異的影響較大,需要我們建立一套能反映用戶真實體驗的指標體系,并能根據產品的核心業務功能,抽象出核心指標,進一步實現指標量化[7]。
基于以上分析,以提升用戶綜合體驗為目標制定了評價指標體系。為了全方位綜合的評價用戶使用產品核心功能的體驗感受,指標又根據四個核心功能細化為登錄成功率、配網成功率、獲取插件包成功率、設備控制成功率、場景執行成功率、發現頁面加載成功率、服務完整率七個子指標,并根據用戶的量級對各子指標進行加權,最終形成用戶綜合體驗成功率指標。用戶綜合體驗評價指標體系如圖1所示。

圖1 用戶綜合體驗評價指標體系
2.2.1 數據采集
模型建立之后,要完成量化評價及分析,需要擁有穩定準確的數據來源,既要包含用戶操作過程的記錄,也要包含家電本身的生產數據;智能家電在使用過程中,可以記載并保存大量用戶使用的數據,物聯網終端應用的用戶埋點、設備的唯一標識及生產數據是主要的數據來源。
(1)家電設備數據的采集
家電設備數據的采集是很多擁有核心制造能力的公司都可以實現的,但是要將設備信息與物聯網的大數據關聯起來卻是非常困難的,沒有成熟的方案可參考借鑒,需要將設備的生產信息燒錄到電控中,在用戶完成配網操作后,通過設備電控主動上報給云端,云端進行存儲,再與生產的數據進行匹配。
匹配依賴智能家電產品的身份證——序列號(SN),為保證SN的準確性、唯一性的要求,首先需在前端規范智能家電產品SN的技術標準,保證SN從生成到使用的規范性,以達成可與埋點數據一一匹配的關聯關系;其次要通過制造執行系統(MES)、質量管理系統(QMS)等生產制造與檢驗系統,將SN的全部信息錄入數據庫,包括家電的生產時間、工廠、線體、過程檢驗的信息、使用的電控版本、模組版本等,為大數據的指標定義、對比分析奠定設備側的數據基礎。家電設備數據收集方案如圖2所示。

圖2 設備數據收集方案
(2)App數據采集
用戶在App端的數據,可以通過事件跟蹤(埋點)的方案進行收集。埋點可以描述用戶在物聯網應用終端內觸發的一系列行為,包括點擊、側滑等。埋點的技術實質是先記錄軟件應用運行過程中的事件,當需要關注的事件發生時進行判斷和捕獲,然后獲取必要的上下文信息,最后將信息整理后發送至服務器端,信息再經過解析入庫,形成初步的用戶終端應用的埋點數據。
埋點方案雖比較好理解,也是互聯網行業中比較成熟的方案,但是對于設計一套完全適應物聯網家電質量改善所需要的埋點,必須要先梳理與指標對應需記錄的事件[8]。事件記錄需要對物聯網的底層技術鏈路有深入的了解:需要梳理事件在終端應用用戶觸發的時機、觸發后的路徑、經過的節點、到達的節點,同時分別在什么節點采集什么數據,也就是埋點采集的信息要做到需要采集的事件觸發時機全鏈路完整,則采集的信息有用。為此,需要組織終端應用App的產品經理、軟件開發、后端服務器開發、測試等相關人員進行全鏈路的梳理,把現有的從設備到模組、模組到云、云到App等端到端的信息打通,當端到端的技術鏈路知識掌握后,就需要根據質量的需求設計埋點,更多是基于用戶操作各項功能的成功確定埋點采集方案。埋點上線也需要一系列的流程,如圖3所示。

圖3 指標埋點采集流程
埋點上報可采用自研的埋點SDK捕捉,但是隨著指標需求增大,自研埋點投入的人力將越來越多,質量數據的收集周期也會變得越來越長,一般會引入第三方埋點統計平臺[9]來處理。如圖4所示,該平臺覆蓋數據定義、采集、生產、應用等埋點全生命周期。使用該平臺后,埋點的開發周期縮短,埋點的類型也更加豐富。

圖4 第三方埋點統計平臺
2.2.2 數據管理
埋點數量會隨著需求增加而不斷增多,尤其是在采用第三方埋點采集平臺的情況下,需要對埋點數據進行治理,治理一般遵循以下原則:
(1)統一管控埋點需求
埋點要明確需要統計的指標,埋點需求應規范統一。
(2)埋點設計有全局觀
站在全局視角規劃埋點并且具有可擴展性,按照性質(公共參數、私有參數)和層級給這些參數進行簡單劃分[3]。
(3)埋點開發要規范
埋點的使用方和開發方不用時,雙方在埋點評審時要思考不同實現邏輯和異常場景是否會影響埋點上報,保證埋點上線符合預期。
(4)埋點驗收全面
驗收的校驗埋點是否多報、少報,參數是否缺失,參數是否規范等。
(5)埋點要有生命周期管理
做好埋點梳理、埋點瘦身、埋點升級的工作,定期統計一段時間內低頻上報的埋點和這些埋點相關指標、報表的訪問量,以此為依據開展埋點生命周期管理工作,如圖5所示。

圖5 埋點全生命周期管理
2.3.1 數據存儲
海量的數據,需要穩定存儲方案,并且需要有實時的調用及處理能力,如圖6所示,以基于Hadoop框架的數據倉庫為例,其中Hive處理離線數據,Kafka處理實時數據,實現用戶行為數據和業務數據實時進入數據倉庫;前端數據產品應用,從數據倉庫中調接口取數。無論是實時的數據采集,還是先本地存儲稍后再發送的數據采集,最終都要進入數據倉庫。

圖6 數據倉庫示例
數據倉庫分3層:原始數據層(ODS)、數據倉庫(DW),數據應用層(App),如圖7所示。

圖7 數據倉庫分層示例
其中:
ODS層:數據倉庫源頭系統的數據表通常會原封不動地存儲一份,ODS層也經常會被稱為準備區。這一層的工作是貼源,數據和源系統的數據是同構,一般對這些數據分為全量更新和增量更新,通常在貼源的過程中會做一些簡單的清洗。
DW層:數據倉庫明細層、中間層和匯總層,是數據倉庫的主體內容。將一些數據關聯的日期進行拆分,使得其可被更具體的分類,一般拆分成年、月、日。ODS層到DW層的ETL腳本會根據業務需求對數據進行清洗、設計,如果沒有業務需求,則根據源系統的數據結構和未來的規劃進行處理,對這層的數據要求是一致、準確、盡量建立數據的完整性。
App層:應用層匯總層,主要是將明細數據在hadoop平臺進行匯總,然后將產生的結果同步到DWS數據庫,提供給各個應用。
2.3.2 數據治理
在用數據賦能業務的鏈條中:產生數據(埋點)→獲取數據(ETL)→分析數據→發現問題→業務決策,數據本身會產生污染以影響到數據的準確性,可能會到獲取時、分析時,甚至是決策階段,才會意識到數據本身可能出現了問題。數據從觸發上報→發送→ETL→進數倉,中間有任何一個過程出問題,都可能會影響數據的穩定、準確和及時。另外,不斷擴展的業務需求,會使業務數據字段發生變更,這時錯傳、漏傳了數據進數倉,也會影響數據質量。擴展的業務需求,必然會出現數據膨脹這個問題,所以數據治理也應運而生。治理主要從三個方面考慮:
(1)數據質量監控
對于數據指標本身的異常波動做了監控的設計,每個版本的變化,都需要重新確認新增或變化埋點的變化,做全面的確認,避免臟數據入庫。
(2)空間方面
合并冗余表、舍棄冗余字段、內容壓縮。
(3)時間方面
合理規劃數據的生命周期,不同層的數據保留時間不同,有的需要永久保存,對于那些暫時沒有業務調用的冷數據,壓縮歸檔。
2.4.1 數據分析
數據的核心意義是要實現數據的分析價值,擁有了用戶各種操作的埋點記錄、日志、家電生產信息等大數據信息,要將大數據以各種不同的分析方法實現業務價值,通過對數據的處理、分析、建模,定位終端應用的優化項目,最終實現用戶體驗的改善;常用的分析方法主要有:
(1)漏斗分析法
漏斗分析法是一個流程化的思考方式,反映用戶行為狀態以及從起點到終點各階段用戶轉化率情況。根據業務邏輯,分析某一個功能的用戶行為漏斗是否和設計相同,若不同,可定位在哪一步存在問題[6]。將用戶在App上操作的各個環節通過埋點大數據進行漏斗的分析,確認哪一步流失較多,從高到低的進行排列,逐步突破。
例如,在配網通過率的分析改善過程中,通過大數據呈現出用戶配網過程的漏斗模型,如圖8所示,可以識別到用戶主要流失的點在掃碼、連接熱點階段,占用戶配網失敗占比的50%以上,所以重點聚焦掃碼與連接熱點的診斷,針對不同樣式的二維碼,一方面從源頭標準化的角度統一規范,系統防呆落地;另一方面從App端對歷史產品的二維碼進行兼容。連接熱點階段,根據大數據分析可以看到用戶主要在找不到熱點、無法進入連接設備熱點頁,企劃側統一家電連熱點的方式,歷史產品通過數據校驗配網指引的準確性。經過質量改善項目運作,共輸出23項改善點,一次配網通過率提升17%。

圖8 配網漏斗模型
(2)對比分析法
設備相關的生產數據與App的埋點數據都具有采集存儲,可以實現終端應用版本、插件版本、手機型號、操作系統、假期、運營活動、模組版本、路由器版本、家電品類、型號、生產時間、生產工廠、線體、電控版本等全方位數據對比,可分析各個維度的數據差異,找到各產品的差異,對標成功率高的產品進行鏈路優化改善。
例如,在控制成功率數據分析過程中,如圖9所示,通過對比發現干衣機、掃地機、洗碗機控制成功率相對較低,主要問題為設備透傳超時,如圖10所示,經過分析確認為電控指令上報不準確,最終方案在插件頁實現上報修正。

圖9 控制成功率對比分析圖

圖10 控制失敗原因帕累托圖
(3)分布分析法
分布分析法是通過對質量的變動分布狀態進行分析并發現問題的一種重要方法,通常用于分析特定行為在某個維度的分布情況。用戶行為在某個時間點集中,譬如假期或者活動對終端應用訪問量產生影響,分析與現有服務端的承載能力是否匹配。
例如,通過時間分布發現06:00—06:05,會集中出現空調的場景執行失敗報錯,經確認主要原因為該時間段設定了一個早起暖房場景,用戶在同一時間觸發此場景,達到服務器容量限制,導致執行失敗,可以通過服務器擴容改善此問題。
(4)用戶路徑分析法
用戶路徑分析法是用戶在終端應用中的訪問行為路徑,每一個路徑背后都有不同的動機,根據用戶路徑來分析終端應用核心功能的正確路徑[10]。用戶在使用終端應用時很常見的一個用戶路徑是進入終端應用后打開插件切到后臺,隔一段時間再進入終端應用,而終端應用刷新token時間是4小時,若一開始忽略這種用戶路徑,則導致22.4%的用戶再切回終端應用的時間間隔超過刷新token的時間,存在token失效控制失敗的問題,解決措施是插件SDK執行控制token失效時自動刷新token。
2.4.2 數據應用
在大數據分析的同時,質量改善的核心是要體現在應用結果上,為了實時可視的呈現物聯網家電大數據分析改善的效果,搭建了物聯網質量數據平臺,前端實時可視IoT質量水平,借助全方位的數據共享及可視化,實現各Feature Team小組的質量水平評價與對比,上線7大品質指標數據,上線27份報表,監控告警33次,并跟進分析整改,完成35項問題優化,用戶綜合體驗成功率改善17%。
質量數據平臺的搭建,可以將看板管理發揮到極致,各種質量數據都囊括其中,當指標數據發生波動時,可以更精準地定位到相關的變化點,更快速地找到大數據的關聯關系,更快速地找到問題的方向,結合白盒的能力,甚至可以直接落實到一些代碼層面的bug,從而快速修復解決。
借助實時大數據的能力,加上質量平臺的能力,賦予了每個指標一個閾值,當指標突發異常時,會有及時的異常推送,通過微信消息、郵件等辦公軟件通知到相關責任人進行關注,通過數據的定位能力,快速找到相關人員進行處理,以達到組織級別的快速響應,減少對用戶的影響。
最后回到問題的閉環改善,因為有了大數據的分析能力,同時融入傳統行業的質量改善理念,每個問題都可以做好數據的預測及數據會帶來的變化,持續關注每日數據的趨勢,可以看同期的對比,發版前后的對比,問題修復前后的對比,改善需求前后的對比,真正做到及時改善,及時閉環;同時質量平臺也實現了bug、需求等問題的沉淀機制,可以對問題進行深入分析,對應流程標準缺失的問題,建立相應的標準體系文件,從根本上解決、規避問題。
綜上所述,本文提出的基于用戶大數據分析的物聯網家電質量改善方法,主要圍繞用戶綜合體驗提升的目標,通過構建物聯網大數據能力,實現硬件家電、App控制端等的數據采集、存儲、治理、分析應用,為物聯網家電質量改善提供了基礎,同時為了更好的實現全價值鏈的數據驅動,以及全面的物聯網質量改善,需要將后臺底層數據分析的能力,進行前端界面的可視化,打造IoT質量管理平臺,所有質量相關人員,都可以經過授權登錄質量平臺進行數據實時查詢;隨著質量平臺的持續深化應用,最終實現物聯網家電質量問題精準定位、量化評價、監控預警和閉環改善四大功能,最終實現全方位用戶綜合體驗質量改善。
進一步的,對于智能家電開發人員來講,未來還可以將用戶大數據分析與主動服務結合起來,實現設備的自我診斷與修復,更進一步提升用戶綜合體驗。