徐 胤,宋 燦,汪亞娟
(國家電網(wǎng)有限公司客戶服務中心信息運維中心,江蘇 南京 211166)
貿(mào)易戰(zhàn)、疫情加快了國家數(shù)字化戰(zhàn)略的推進,宏觀上中國的數(shù)字化能力將形成領先全球的數(shù)字化競爭力。在國家戰(zhàn)略的指導下,大型央企進一步加快轉(zhuǎn)型的決心與速度。在轉(zhuǎn)型的過程中,企業(yè)數(shù)字化的場景非常豐富,從軟件信息化場景、硬件智能化場景、應用數(shù)據(jù)集成化場景,豐富的數(shù)字化場景對人才的成長與進步要求越來越高[1]。
在數(shù)字化轉(zhuǎn)型的過程中,員工要面對多元化的數(shù)字化場景,知識結(jié)構也將面臨一次大的升級,70后、80后、90后、00后不同年齡段的員面對數(shù)字化轉(zhuǎn)型,學習效率、學習需求、評價標準都不一樣,研究小組的“AⅠ混合推薦算法在企業(yè)內(nèi)部學習社區(qū)場景的深度應用”這一課題就是在這個背景下產(chǎn)生的。
互動社區(qū)的核心是其所產(chǎn)生的內(nèi)容,當前互聯(lián)網(wǎng)互動社區(qū)產(chǎn)生內(nèi)容的方式大致有UGC、PGC、OGC這3種。UGC指用戶生產(chǎn)內(nèi)容,一層是用戶,即內(nèi)容貢獻者;另一層是平臺,充當內(nèi)容運營者和內(nèi)容審查者的角色,有了人氣,平臺就會越來越大,人氣就會越來越旺,反之亦然。PGC指專業(yè)生產(chǎn)內(nèi)容,其內(nèi)容個性化、視角多元化、傳播民主化、社會關系虛擬化,電商媒體、高端媒體多采用PGC模式。OGC指職業(yè)生產(chǎn)內(nèi)容,內(nèi)容產(chǎn)生者如記者、編輯、媒體工作者等,創(chuàng)作內(nèi)容屬于職務行為。本文主要分析UGC及PGC模式,借鑒其經(jīng)驗。
以知乎為例,知乎涵蓋話題內(nèi)容全面,問答豐富多樣,用戶量龐大,人均日訪問時長達50 min。用戶圍繞著某一感興趣的話題進行相關的討論,同時可以關注興趣一致的人。針對一些話題進行發(fā)散思維整合,用戶活躍度高、內(nèi)容專業(yè)門檻較低,榮譽體系完善。
以36氪為例,36氪是一個科技創(chuàng)新創(chuàng)業(yè)綜合生態(tài)服務平臺,文章水平較高且篇幅較長,能夠看到很多觀點和互動。36氪對于用戶投稿要求非常高,經(jīng)過嚴格專業(yè)審查通過后才能發(fā)表,故文章專業(yè)性極強,帖子無法實現(xiàn)實時發(fā)表,更新周期略長。如果要實現(xiàn)作者入駐,需要遞交作者簡歷及真實性檢查等一系列工作,平臺需要對專家人才庫進行運營管理。
研究背景:新上線的大型企業(yè)數(shù)字化營銷系統(tǒng)涉及企業(yè)營銷員工超過2萬人。新的企業(yè)數(shù)字化營銷系統(tǒng)業(yè)務模塊眾多、知識點零碎,新業(yè)務、新規(guī)則、新功能、新政策變化迅速,而一線員工由于知識結(jié)構、自身能力、培訓條件、政策傳達等方面的原因在使用中必然會產(chǎn)生眾多的問題。結(jié)合以往新系統(tǒng)上線的經(jīng)驗,困擾員工最大的3個問題是“功能不會用”“問題誰解答”“想法向誰提”。
研究方向:AⅠ混合推薦算法在企業(yè)內(nèi)部學習社區(qū)場景的深度應用。研究小組將大數(shù)據(jù)的標簽應用與NLP的深度網(wǎng)絡學習相結(jié)合,以員工數(shù)據(jù)校本、內(nèi)容數(shù)據(jù)樣本2個維度,形成一套針對每個員工、每份學習內(nèi)容的個性化AⅠ推薦算法,將推薦算法應用到每個員工身上形成“千人千面”的學習方案與評價文案,提升學習效率。將推薦算法應用到每個學習內(nèi)容上,建立強大的關聯(lián)性學習內(nèi)容之間的知識圖譜關系,從而形成一個強大的智能知識庫。“千人千面的AⅠ標簽庫”與“以點帶面的知識圖譜智能知識庫”這2大核心產(chǎn)品是課題組的核心研究方向。
實驗場景:學習社區(qū)建設應用。研究小組的研究課題是在實際工作場景中形成的,研究小組承擔了企業(yè)數(shù)字化營銷系統(tǒng)的運營運維工作,在工作的過程中,為了更好地讓內(nèi)部員工學習、適應新的數(shù)字化營銷系統(tǒng),建立了學習社區(qū)這個內(nèi)部學習社區(qū),加快員工對數(shù)字化營銷系統(tǒng)問題的解決、使用技巧的掌握,課題組將AⅠ混合推薦算法深度應用到了學習社區(qū)這個場景研究中。
3.2.1 數(shù)據(jù)分類
學習社區(qū)項目中,將系統(tǒng)所產(chǎn)生的全部數(shù)據(jù)進行了分組:用戶數(shù)據(jù)類、內(nèi)容數(shù)據(jù)類。通過內(nèi)容數(shù)據(jù)不斷作用于用戶數(shù)據(jù),實現(xiàn)用戶學習行為、學習效率、學習結(jié)果的不斷變化,再根據(jù)用戶數(shù)據(jù)的不斷變化來調(diào)整與之對應的內(nèi)容數(shù)據(jù)。
3.2.2 標簽畫像
標簽是對數(shù)據(jù)進行定義的手段,通過不斷對每條數(shù)據(jù)進行標簽化處理,從而獲得數(shù)據(jù)的標簽畫像。標簽分為初始標簽、AⅠ標簽、人工標簽3大類,對應數(shù)據(jù)的3大場景,數(shù)據(jù)產(chǎn)生的時候會自動產(chǎn)生初始標簽,在數(shù)據(jù)不斷被訪問應用的過程中,會產(chǎn)生AⅠ標簽,在與用戶、管理員不斷互動的過程中,會產(chǎn)生人工標簽。通過3大類標簽,不斷通過標簽重合度進行去重,實現(xiàn)標簽畫像的智能化、精準化[2]。
3.2.3 NLP自增標簽
自然語言處理(Natural Language Process,NLP)深度整合了數(shù)字化云企業(yè)內(nèi)部頂級的NLP技術,依托千億級中文語料累積,提供16項智能文本處理能力,包括智能分詞、實體識別、文本糾錯、情感分析、文本分類、詞向量、關鍵詞提取、自動摘要、智能閑聊、百科知識圖譜查詢等。可廣泛應用于用戶評論情感分析、資訊熱點挖掘、電話投訴分析等場景,滿足各行各業(yè)的文本智能需求。
基于NLP框架,將大型企業(yè)營銷線的26個專業(yè)的數(shù)據(jù)字典進行分詞,生成初始標簽庫。根據(jù)員工、內(nèi)容這2類數(shù)據(jù)打上初始標簽,實現(xiàn)基礎的匹配。同數(shù)據(jù)不斷互動、使用的過程中,通過NLP學習網(wǎng)絡對標簽進行重合度、標簽密度的計算,將高密度、高重合度的標簽進行NLP自增方式標記到數(shù)據(jù)上,實現(xiàn)數(shù)據(jù)標簽AⅠ自增[3]。
3.2.4 AI混合推薦
通過初始標簽、NLP自增標簽、人工標簽,筆者們的用戶類數(shù)據(jù)、內(nèi)容類數(shù)據(jù)分別獲得了標簽畫像。在企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)員工登陸學習的過程中,展開了AⅠ推薦算法在企業(yè)內(nèi)部學習社區(qū)場景的深度應用。
根據(jù)每個用戶登陸后的身份、學習內(nèi)容、內(nèi)容熱度進行AⅠ混合推薦,“千人千面”的個性化學習方案、評價方案,提升學習效率。主要采用以下3個步驟開展算法搭建:①數(shù)據(jù)建模。推薦系統(tǒng)根據(jù)用戶的某些信息給用戶建模,同時給頻道建模。②內(nèi)容推薦。推薦系統(tǒng)根據(jù)不同的算法對用戶興趣與頻道信息進行篩選匹配,找到用戶感興趣的頻道,然后推薦給用戶。③分類。根據(jù)用戶行為記錄等對用戶進行劃分,為同一群體的用戶推薦其余用戶喜歡的,也可以根據(jù)內(nèi)容元素為內(nèi)容分類。
AⅠ混合推薦算法工作原理如圖1所示。

圖1 AⅠ混合推薦算法工作原理圖
學習社區(qū)項目設計了“問答”這個功能場景,就是讓員工在使用企業(yè)數(shù)字化營銷系統(tǒng)的過程中將遇到的問題在學習社區(qū)進行“一鍵提問、閃電提問”,然后快速幫助員工解決企業(yè)數(shù)字化營銷系統(tǒng)的使用問題。
AⅠ混合推薦算法在這個場景中發(fā)揮了巨大的作用。首先員工提問的時候,通過AⅠ推薦,在員工輸入提問標題的時候AⅠ助教就會即時進行相似的已解答的問題推薦,員工不用提問就可通過別人已經(jīng)問過的問題來解決自己的問題。同時如果已解答問題沒有員工需要的答案,AⅠ推薦算法會繼續(xù)推薦正在提問中的相似問題,員工只需點擊“同問”就可以閃電實現(xiàn)問題關注,問題被解答后自動推送消息幫助員工獲得答案。
企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)系統(tǒng)具有“經(jīng)驗分享”功能模塊,是一個幫助員工在內(nèi)部社區(qū)學習過程中從“新人”到“專家”的自我成長的主動學習過程。AⅠ混合推薦算法將每條“經(jīng)驗分享”內(nèi)容進行標簽化,將內(nèi)容類數(shù)據(jù)的標簽庫作用于經(jīng)驗分享類的內(nèi)容,然后通過經(jīng)驗分享的每篇文案的標簽庫與用戶的標簽庫進行“標簽重合度、標簽高密度”的AⅠ推薦,將經(jīng)驗分享文章推薦給每位員工,幫助他們從“新手”向“專家”進行成長蛻變。
AⅠ混合推薦算法在企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)的3大典型場景得到了成功的應用,為企業(yè)數(shù)字化營銷系統(tǒng)培養(yǎng)了大量的使用專家,加快了企業(yè)數(shù)字化營銷系統(tǒng)的應用效率。AⅠ混合推薦算法在課程組研究成功后,可以應用于很多場景,在企業(yè)內(nèi)部學習社區(qū)場景延伸開來,具有更廣闊的市場前景。
平臺的生命周期與活躍度,取決于持續(xù)不斷運營。基于企業(yè)數(shù)字化營銷系統(tǒng)的目標定位,確定營銷知識運營、營銷文化運營、營銷創(chuàng)新運營3方面的運營目標:打造創(chuàng)新性學習型問答社區(qū),運營場景包括知識沉淀、知識流動、知識應用等;推動營銷數(shù)字化轉(zhuǎn)型文化認同,運營場景從傳、溝通、參與到進化的遞進認同過程;推進企業(yè)數(shù)字化營銷系統(tǒng)優(yōu)化與提升,運營場景包括知識收集、創(chuàng)新推動及需求創(chuàng)新落地。
研究小組在實施企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)項目的過程中,參考了大量的知識文獻,閱讀了大量書籍,將方法論提煉成為“AⅠ混合推薦算法”,并將之深度應用于企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)項目。整理復盤整個研究過程,整理研究資料,研究發(fā)現(xiàn)“千人千面的AⅠ標簽庫”與“以點帶面的知識圖譜智能知識庫”這2大核心產(chǎn)品將是課題組的寶貴經(jīng)驗,現(xiàn)總結(jié)出來和大家分享。
“千人千面的AⅠ標簽庫”:為數(shù)據(jù)資產(chǎn)打上標簽,應用NLP技術給每條數(shù)據(jù)打上初始標簽、AⅠ標簽、人工標簽這個方法論實現(xiàn)了每條數(shù)據(jù)標簽畫像,內(nèi)容數(shù)據(jù)與用戶數(shù)據(jù)之間的“標簽重合度、高密度”匹配,然后進行AⅠ混合推薦實現(xiàn)了“千人千面”的推薦效果。
“以點帶面的知識圖譜智能知識庫”:每條內(nèi)容數(shù)據(jù)都是寶貴的學習資產(chǎn),在實施企業(yè)數(shù)字化營銷系統(tǒng)學習社區(qū)項目的過程中,由于每條內(nèi)容數(shù)據(jù)都帶著多維度的標簽庫,AⅠ算力可以精準定義到每條學習內(nèi)容,匹配給每位學習者。因此,將所有的學習內(nèi)容以每位學習者提出的“第個問題”為切入點,幫助學習者形成一個強大的關聯(lián)知識庫。如果能夠在后期不斷豐富學習內(nèi)容數(shù)據(jù),必然能夠形成一個以與“AⅠ混合推薦算法與關系型標簽庫”相結(jié)合的創(chuàng)新型知識庫。