唐云婷



【摘 要】本文闡述高校用戶畫像技術的現狀、用戶畫像技術實現過程、智慧校園中用戶畫像技術應用場景及實踐,提出用戶畫像技術局限及展望,認為隨著人工智能技術和大數據技術的日趨成熟,用戶畫像技術必將大放異彩。
【關鍵詞】智慧校園 信息化 用戶畫像技術
伴隨著信息的爆炸高校也迎來了智慧時代,智慧校園成為高校服務的主要載體,并發揮著中流砥柱的作用。利用用戶畫像技術對學生個體進行描繪,從而智能分析學生的學習、就業、社交、消費等行為,為教學管理決策提供參考數據已漸成趨勢。
一、智慧校園
智慧校園是單一網絡接入服務向多元化功能服務方向演變的產物,其和信息化社會的發展水平息息相關,其核心功能是為師生提供高效便捷的在線服務。伴隨物聯網技術應用,智慧校園逐漸演化成以核心機房服務集群為核心、為自治系統內用戶提供高效服務、輻射整個校園的智能化系統。在校園安保感知服務、教學云課堂服務、科研檢索服務、人事管理服務等方面發揮重要作用。
智慧校園是現代化教育的重要部分,“人人皆學、處處能學、時時可學”的教育體系是未來發展的趨勢,智慧校園推動人才培養模式和教學方法改革,豐富高質量教育服務供給,促進育人過程智慧化、教學管理智能化、教育服務精準化,為實現更加高效而有質量的教育提供強有力的支撐。
二、用戶畫像技術
用戶畫像技術是一種基于數據挖掘技術用于勾畫目標用戶的有效工具,是利用計算機技術形成的用戶的虛擬代表,其在許多領域得到廣泛應用。用戶畫像可以簡單理解成是海量數據標簽形成了一個任務原型。用戶畫像技術最先在電商領域興起,在信息爆炸時代,用戶數據充斥在網絡中,電子商務網站對用戶的購買行為進行分析,將用戶的數據進行分類整理將其抽象成標簽,許許多多的標簽組成了用戶的“畫像”。一句話總結,用戶畫像技術就是用戶信息標簽化。
(一)標簽技術
用戶畫像的底層是數據分析,進行用戶畫像繪制前,需要將學生數據進行規范化為相同維度的特征向量,這樣計算機算法才可以有用武之地。對結構化數據而言,特征提取工作從給數據打標簽開始。所謂標簽就是學生的特點或分類,這些特點可能需要在特定的場景中呈現,每一名學生也會有諸多屬性,而屬性彼此之間的聯系,構成標簽體系。標簽體系的設計有兩個常見要求,一是便于檢索,二是效果顯著。在不同的場景下,對這兩點的要求重點不同。比如,愛好、閱讀、運動、心情等可能在不同場景下有不同的屬性值。合適的特征標簽可以讓學生畫像變得更豐富,能夠提升學生的畫像效果(顆粒度)。學生畫像往往難以精準描繪一個人,因此,在為學生進行畫像時除了性別、年齡、籍貫等這些有明確答案的標簽,其他大多數描述標簽,探討其“準確程度”是沒有意義的。標簽體系的建立并不存在一勞永逸的結果,新課程、新學生、新環境的出現,需要不斷地研究和調整,這是一項持續進行的實戰性極強的數據分析工作。標簽無法準確反饋學生畫像的質量,需要研究一種方法用于判斷用戶畫像質量。在某個標簽上可以設置一個閾值結合學生在此標簽上的得分來判斷該學生是否屬于該標簽類型,隨著閾值設置的不同,學生畫像質量就會變化,需要研究一個曲線模型顯示閾值與用戶畫像之間的變化關系。
從技術層面說,學生畫像繪制或生成的過程比較乏味,是計算機大數據處理算法的一個體現,一個看似簡單卻難以把握精髓的是建立用戶畫像的標簽體系。設計用戶標簽時,可以根據實際需要選擇相應的算法進行標簽值預測或分析。比如,可采用K近鄰算法(見圖1)或協調過濾算法(見圖2)對數據標本進行預測以輔助標簽提取,這是用戶畫像技術的核心。
(二)高校用戶畫像技術研究現狀
國內高校對用戶畫像進行研究,常見于學業預警、行為分析、課程設置等教學管理或改革。用戶畫像的目的是讓管理人員比學生本身更了解學生,從而為學生提供更好的服務。用戶畫像技術目前尚不完善,仍處于早期階段,整體滲透率非常低,產業生態蕭條,但用戶需求旺盛。
(三)用戶畫像技術實現過程
用戶畫像技術實現過程并不容易,其分析結果并不具備普適性,因此,在高校內目前僅處于探索階段,其總體過程是對數據處理的過程(如圖3所示),最終的畫像是體現用戶實際數據的虛擬模型。用戶畫像技術的生成過程大致可分為數據采集、數據入庫(數據倉庫)、數據預處理、標簽提取、生成畫像等步驟。其中數據預處理包括數據清理、數據轉換、數據規范化等步驟用于確保數據的完整性和正確性,并且對不同等級和類別的數據進行規范化,使其能夠在同一標準下做評比,數據的預處理過程中可根據實際情況進行算法選擇。
在數據規范化后就可以對數據進行標簽提取,標簽分類需要人為干預或生成,并且計算其權重和維度,以便形成用戶畫像。標簽的提取并不是一件輕松的事情,其數量繁多并且需要用戶干預生成,標簽的準確性影響畫像的質量。在標簽提取完成后,結合K近鄰算法或協調過濾算法預測某些未知項的數據,并生成用戶畫像。
三、智慧校園中用戶畫像技術應用場景及實踐
高校采用用戶畫像技術可以在選修課、學生就業、學業預警、閱覽推薦等方面有針對性地施行個性化施教或管理。在選修課方面,用戶畫像技術可以為教學決策提供非常有價值的數據支撐,用戶畫像能夠繪制學生的需求,結合教學資源進行適當或完全滿足學生課堂之外的選修課程需求,能夠極大地提高課程提供和選修需求之間的契合度;在學生就業方面,利用用戶畫像技術繪制市場需求和就業走向,為專業建設和人才培養提供數據支撐。甚至在生活、消費、閱讀、社交、心理等各方面都可以幫助學校更好地了解學生,從而進行個性化培養,提高教育教學水平。
(一)精準資助
以智慧校園為基礎的用戶畫像技術,在用戶整體畫像生成后,可以有效地實現國家四部聲明的“四個精準”:對象精準、力度精準、分配精準、發放精準。有效、公平、精準地實現幫扶對象的認定,并且較好地保護學生隱私。2019年9月,西安電子科技大學利用用戶畫像技術對每天吃飯花費低于8元的學生進行隱形資助,既保護了學生隱私也讓學生享受到補貼。在精準資助方面,用戶畫像技術需要對學生的一卡通消費情況進行統計,可供參考的度量指標如表1所示,利用用戶畫像技術,將閾值(由相關部門進行人工核定)以下的目標進行篩選,由于用戶畫像不一定“細膩”,可由相關部門組織人工,定期對篩選出的畫像進行審核,這樣實現畫像和人工的雙重認定,從而實現精準資助。
用戶畫像技術可以采用聚類和預測兩種方式進行,其中聚類是需要將閾值以下的目標進行重點描繪,這是K近鄰算法的應用之處;而預測則需要有固定的樣本作為參考或學習,對目標對象進行技術預測,這是協調過濾(基于內容)算法的應用。
(二)學業預警
利用智慧校園的成績管理系統和云課堂,對學生整個階段的學習情況進行統計和分析,其中包括課堂參與度、評教、作業、考勤、在線筆記等各方面的數據進行分析,設定一定的閾值利用相應的算法進行畫像描繪,對處于閾值邊緣或超過閾值的學生進行針對性地關注可以有效地實現學業預警,并且能針對性地進行個性化人才培養。2018年,南寧師范大學利用智慧校園大數據描繪“學生畫像”指導專業教與學,技術團隊通過匯總得到學院2016級和2017級專業學生的畫像統計數據并制作成云圖,在優秀學科、學習方法、英語四級、就業等方面提供了非常有價值的參考數據。
在學業預警方面,用戶畫像技術結合云課堂技術對學生的學業情況進行統計,可供參考的度量指標有出勤、請假、遲到、曠課、作業、回答問題、實驗等10余項指標,對警戒線(一般由教科處或各系部根據實際情況進行劃定)周圍的學生列入預警群,對列出的對象進行提前通知,以起到警示作用。
用戶畫像技術在學業預警方面主要以預測為主,這需要對大量的樣本進行學習,并對潛在對象進行預測并進行歸類。學習的標本來自教務系統歷年來不合格的學生數據,對潛在對象的分類以機器學習為主,分類以“預警”和“正常”兩類,對預測的對象依然需要人工審核,因為任何預測都存在不確定性。
(三)智能推薦
各高校為了提高圖書借閱效率,多數都啟用了智能推薦技術,結合用戶畫像技術可大大提高智能推薦的匹配效果,更好地提高用戶體驗,節約用戶時間。用戶借閱圖書的類型、頻率、及對圖書的評價等因素可以形成一個標簽體系,而用戶并不是獨立的,其與舍友、同學和同樣愛好的其他用戶均有著可供研究的數據,在智能推薦方面可以使用基于內容的協同過濾算法,為用戶智能推薦喜歡的圖書,這樣可以大大提升用戶借書效率。
四、用戶畫像技術局限及展望
眾多的標簽組成了用戶畫像,而標簽來自用戶的行為數據,因此,行為數據的豐富程度是關系用戶畫像精確與否的重要指標,通俗地說,就是更多的數據帶來更多的畫像精確度。但目前用戶畫像技術的使用尚有以下局限。
(一)無法多維度深度挖掘用戶
用戶畫像的維度應該包括人口屬性、學業需求、興趣愛好、社交屬性等其他根據環境不同所需的信息,但在實際應用中很難在短期內搜集如此全面的數據或待數據搜集完后,學生已經離開學校走向社會,因此,在多維度挖掘用戶方面存在時間局限。
(二)用戶信息搜集與隱私政策沖突
為了提高用戶畫像的精確度需要較多、準確的用戶數據。常見的搜集用戶信息的手段有問卷調查、座談會、深訪、觀察等,但在大數據面前這些手段都收效不大,并且很多情況下用戶因為個人隱私的原因不愿透露過多的信息,這是用戶畫像技術與隱私政策的沖突所致。
(三)用戶畫像粒度很難精確
用戶畫像的粒度也與數據息息相關,筆者通過分析用戶畫像來尋找差異點和優化點,但對于“20~30歲”和“21歲”兩個標簽來說,這是明顯的不同粒度的標簽,而在實際中諸如此類無法精確得到用戶數據的場景比比皆是,這導致用戶畫像的粒度受到局限。
雖然存在眾多局限性,不可否認用戶畫像已經在實際應用中發揮重要作用,以其為基礎的“千人千面”的個性化推薦系統在互聯網領域應用廣泛,用戶畫像技術在多方數據融合的情況下將成為用戶的另一張身份名片,除了在教學管理、社交分析、閱讀推薦等情境下發揮作用,還可以與其他實施場景進行結合,進行針對性地引導學習,隨著人工智能技術和大數據技術的日趨成熟,用戶畫像技術必將大放異彩。
【參考文獻】
[1]王慶,趙發珍.基于“用戶畫像”的圖書館資源推薦模式設計與分析[J].現代情報,2018(3).
[2]張大偉.異種屬性相似度在高校資助對象認定中的應用[J].信息與電腦,2020(22).
[3]JIAMTHAPTHAKSIN R,AUNG T H.User preferences profilingbased on user behaviors on Facebook page categories[C]//International Conference on Knowledge and Smart Technology.Chonburi,Thailand:IEEE,2017.
[4]周文靜.面向校園論壇用戶興趣的用戶畫像構建方法研究[D].北京:北京郵電大學,2018.
[5]BRUSILOVSKY P,MILLAN E.User Models for adaptivehypermedia and adaptive educational systems[M]. Berlin:Springer Germany,2007.
(責編 蘇 林)