摘 要:本文首先分析了研究的 實(shí)踐意義,接下來詳細(xì)闡述了在線用戶評論的相關(guān)概念,最后對基于ARIMA模型的時間序列建模以及建模實(shí)驗(yàn)結(jié)果等作具體分析論述,希望通過本文的分析研究,給行業(yè)內(nèi)人士以借鑒和啟發(fā),同時希望為我國面向在線討論的時間序列建模實(shí)驗(yàn)的分析研究獻(xiàn)言獻(xiàn)策。
關(guān)鍵詞:時間序列;在線討論;帖子;信息量;ARIMA模型
引言
2018年,教育部在《教育信息化2.0行動計(jì)劃》中明確提出要“提升慕課服務(wù),匯聚高校、企業(yè)等各方力量,推出3000門國家精品在線開放課程,達(dá)成優(yōu)質(zhì)的個性化學(xué)習(xí)體驗(yàn),滿足學(xué)習(xí)者、教學(xué)者和管理者的個性化需求”。在慕課學(xué)習(xí)平臺中,在線討論是較為常見的學(xué)習(xí)活動,通常以文本的形式呈現(xiàn)出來。以計(jì)算機(jī)為中介的交流理論認(rèn)為,基于文本的在線討論活動既有利于發(fā)展學(xué)習(xí)者的批判性思維,又能促進(jìn)其深度學(xué)習(xí)和知識建構(gòu)。而在線討論中產(chǎn)生的文本數(shù)據(jù),反映了學(xué)習(xí)者的學(xué)習(xí)投入和情感狀態(tài)。因此,關(guān)注在線討論的文本數(shù)據(jù)、挖掘并監(jiān)控在線討論中帖子的質(zhì)量,既是提升慕課服務(wù)的有效途徑,也是達(dá)成優(yōu)質(zhì)的個性化學(xué)習(xí)體驗(yàn)并滿足學(xué)習(xí)者、教學(xué)者和管理者個性化需求的必要手段。時間序列設(shè)計(jì)是一種常見的預(yù)測方法,可用于識別或測量多種教育現(xiàn)象的發(fā)展態(tài)勢。通過文獻(xiàn)梳理,本研究發(fā)現(xiàn)從時間序列角度分析在線討論質(zhì)量的研究成果較少,其原因主要在于:①目前缺乏完備的指標(biāo)來衡量在線討論中帖子的質(zhì)量,相應(yīng)地也就缺少自動、智能的量化計(jì)算方法;②時間序列分析模型的構(gòu)建過程比較復(fù)雜,需要研究者具備較高的數(shù)學(xué)素養(yǎng)。基于上述分析,本研究認(rèn)為借助機(jī)器來挖掘和監(jiān)控在線討論的質(zhì)量高低變化,是一個值得探索的方向。
一、實(shí)踐意義
1.1有效指導(dǎo)電子商務(wù)生產(chǎn)廠商做出正確的生產(chǎn)決策
在線用戶評論會對電子商務(wù)生產(chǎn)廠商的產(chǎn)品完善和服務(wù)改進(jìn)產(chǎn)生重要的決策影響,本文研究內(nèi)容將在線用戶評論情感詞和產(chǎn)品特征詞進(jìn)行時間序列維度劃分,有利于直觀發(fā)現(xiàn)不同評論時間間隔用戶在意的產(chǎn)品內(nèi)容,電子商務(wù)生產(chǎn)廠商可以根據(jù)在線用戶評論內(nèi)容,發(fā)現(xiàn)產(chǎn)品質(zhì)量、外觀和服務(wù)中的不足,并從時間維度,針對不同時間特征需求用戶,對現(xiàn)有產(chǎn)品進(jìn)行有效改進(jìn),以適應(yīng)廣大消費(fèi)者的需求,改善用戶體驗(yàn),提高用戶認(rèn)可度,產(chǎn)生良好的網(wǎng)絡(luò)口碑傳播效應(yīng),有助于提高產(chǎn)品核心競爭力。
1.2指導(dǎo)電子商務(wù)企業(yè)商家進(jìn)行精準(zhǔn)銷售管理
在線用戶評論通過文字、圖片、星級評分等行為方式主動分享所購產(chǎn)品的消費(fèi)、使用過程體驗(yàn),在評論內(nèi)容中會闡述商品的特征、情感與服務(wù)感知。這些內(nèi)容對電子商務(wù)企業(yè)商家具有巨大的潛在商業(yè)價(jià)值。本研究掌握了在線用戶評論行為的時間特征規(guī)律,有利于對電子商務(wù)企業(yè)實(shí)踐提供更好的指導(dǎo),電商企業(yè)可以通過分析消費(fèi)者在線用戶評論行為時間特征規(guī)律,鼓勵和引導(dǎo)消費(fèi)者在充分感知和體驗(yàn)消費(fèi)的同時能夠及時地書寫真實(shí)的評論內(nèi)容,產(chǎn)生優(yōu)質(zhì)評論和良好的網(wǎng)絡(luò)口碑傳播效果,同時,也可以根據(jù)消費(fèi)者時間序列階段需求配置合適的企業(yè)服務(wù)資源,以便更好地為消費(fèi)者服務(wù)。
二、在線用戶評論的相關(guān)概念
在線用戶評論在線用戶評論(OnlineConsumerReview)又稱為在線評論,是web2.0時代迅速興起的一種網(wǎng)絡(luò)口碑傳播方式,通過網(wǎng)絡(luò)平臺存儲和傳播對所購商品進(jìn)行文本評價(jià)的評論信息。在線用戶評論是大數(shù)據(jù)環(huán)境下用戶生成內(nèi)容(UGC)的一種重要的表現(xiàn)形式,根據(jù)傳播范圍可以分為開放式在線評論和非開放式在線評論。開放式在線評論是所有閱讀者都可以瀏覽網(wǎng)絡(luò)評論內(nèi)容,可以在所有瀏覽用戶范圍傳播;而非開放式在線評論會設(shè)定瀏覽限制或僅限定在注冊會員內(nèi)查看評論文本內(nèi)容。具體來講,開放式在線評論具有代表性的如淘寶、京東等電子商務(wù)平臺的在線評論信息,這種開放式在線評論對潛在消費(fèi)者而言具有極高的購買參考價(jià)值,是產(chǎn)品口碑在互聯(lián)網(wǎng)絡(luò)環(huán)境下面向更廣泛用戶的深度傳播,是對潛在消費(fèi)者購買決策信息支持最有效的形式內(nèi)容。
三、基于ARIMA模型的時間序列建模
所有帖子的信息量都被轉(zhuǎn)換成時序數(shù)據(jù)集后,采用ARIMA模型進(jìn)行時間序列建模,核心步驟包括:①時間序列的平穩(wěn)性和白噪聲檢驗(yàn);②ARIMA模型的參數(shù)估計(jì)與有效性檢驗(yàn);③ARIMA模型的預(yù)測與分析。其中,平穩(wěn)性和白噪聲可借助時間序列的統(tǒng)計(jì)工具進(jìn)行檢驗(yàn),包括增項(xiàng)DF單位根(AugmentedDickey-Fuller,ADF)檢驗(yàn)和Ljung-Box檢驗(yàn)。
四、建模實(shí)驗(yàn)結(jié)果
為了判斷Dts時間序列的平穩(wěn)性,采用ADF檢驗(yàn)方法進(jìn)行單位根檢驗(yàn)。Dts時間序列的ADF檢驗(yàn)結(jié)果為:t=–0.801(p=0.423),均大于1%、5%和10%顯著性水平下的臨界值,說明Dts時間序列存在單位根,即Dts是非平穩(wěn)時間序列,故Dts時間序列需進(jìn)行差分運(yùn)算處理。經(jīng)過二階差分后Dts時間序列的ADF檢驗(yàn)結(jié)果為:t=–4.123(p<0.01),小于1%顯著性水平下的臨界值,意味著經(jīng)過二階差分后的Dts時間序列具有平穩(wěn)性。此外,Dts時間序列的Ljung-Box檢驗(yàn)結(jié)果表明:Dts時間序列是非白噪聲的時間序列(p<0.01)。
五、ARIMA模型的預(yù)測與分析
精確地預(yù)測在線討論中帖子信息量的變化軌跡是幾乎不可能的,更無法推測出具體的數(shù)值。但是,ARIMA模型可以預(yù)測帖子信息量的波動范圍,預(yù)測的目標(biāo)是對Dts時間序列上未來值的變化趨勢進(jìn)行預(yù)報(bào)。大多數(shù)預(yù)測值與真實(shí)值基本吻合;但真實(shí)值會出現(xiàn)爆發(fā)點(diǎn)或突發(fā)區(qū)間,即在某個時間點(diǎn)或時間區(qū)間上帖子信息量會出現(xiàn)突變,而這個突變始終在上限值的范圍內(nèi)——這表明ARIMA(5,2,5)模型能正確描述在線討論中帖子信息量的未來變化趨勢并給出波動范圍,具有較強(qiáng)的預(yù)測能力。
結(jié)語
在教育大數(shù)據(jù)背景下,在線討論中帖子的自動評價(jià)與監(jiān)測是一個重要的、也極具挑戰(zhàn)性的研究主題。一方面有利于平臺管理者優(yōu)化學(xué)習(xí)平臺的資源調(diào)度、降低學(xué)習(xí)支持服務(wù)的成本,另一方面能夠幫助教師監(jiān)測在線討論中帖子的質(zhì)量。此外,本實(shí)驗(yàn)還促進(jìn)了時間序列分析方法在教育教學(xué)中的應(yīng)用。
參考文獻(xiàn):
[1]教育部.教育信息化2.0行動計(jì)劃[OL].
作者簡介:
侯永勝(1987—),對外經(jīng)濟(jì)貿(mào)易大學(xué)統(tǒng)計(jì)學(xué)院在職人員高級課程研修班學(xué)員,研究方向:大數(shù)據(jù)科學(xué)與應(yīng)用。