999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進貝葉斯的語義推送算法設計

2020-04-09 07:56:06馮錫煒竇予梓高天鑄吳衍兵
計算機技術與發展 2020年3期
關鍵詞:詞匯信息教育

朱 睿,馮錫煒,竇予梓,高天鑄,馬 蕾,吳衍兵

(遼寧石油化工大學 計算機與通信工程學院,遼寧 撫順 113001)

0 引 言

教育信息化越來越受到教育研究者的關注,隨著各類學科的電子化,人們訪問這類網站所產生的瀏覽數據量越來越大。通過大數據技術,對這些瀏覽數據進行分析后,可以根據每個用戶群體不同的瀏覽數據習慣進行相關教育方面的信息推送[1-3]。

專業化教育資源本體庫的建立對于教學信息資源的推送有著不尋常的實踐價值[4-5]。在2017年教育部發布了《基礎教育教學資源元數據》系列教育行業標準通知,里面包括了《基礎教育教學資源元數據 信息模型》、《基礎教育教學資源元數據XML綁定》及《基礎教育教學資源元數據 實踐指南》,這些標準對于建立相關教育信息化本體有著非常重要的意義。

文中利用Protégé,以計算機組成原理這一課程內容為本體設計數據來源,進行本體設計。基于百度指數中關于計算機組成原理的各項搜索數據,基于貝葉斯建立詞匯頻度分析模型,將百度指數中的搜索指數結合詞匯頻度分析模型進行計算,計算后的各個不同本體的詞匯頻度分析數據按照數值的從大到小進行推送。

1 教育信息化本體構建

1.1 教育信息化

教育信息化具有兩層含義,一個在教育目標中加入信息素養,另一層指在教學與科研中加入信息技術手段,注重教育信息資源的探究與使用[6]。文中主要對后者進行闡述。在信息技術手段上利用大數據、語義分析及用戶粘性等信息技術對教育工作者常進行瀏覽的網頁記錄進行分析,進而進行推送[7-8]。

1.2 教育資源本體

教育資源本體用來容納和規范教育信息,根據實際的需求,將本體的屬性分為數據屬性(Data Property)和對象屬性(Object Property)。數據屬性定義域是本體的類,值域是數據類型。對象屬性是表示所有個體之間的關系屬性[9]。

數據屬性:為使網絡上分布的教育資源庫有統一的語義標注標準,通過對《基礎教育教學資源元數據》的每一個元數據項進行分析,然后整理出了數據屬性。部分數據屬性的定義與說明如表1所示[10-11]。

表1 數據屬性定義及說明

對象屬性:根據教育元數據進行教育資源領域的本體構建。主要對象屬性是教育信息的對象屬性[12]。教育資源之間存在豐富的語義關系,通過語義關系建立本體屬性,利用這些屬性進行本體推理和查詢,作為教育資源語義搜索的基礎[6]。

教育資源間屬性關系,可根據教育信息的特點,對教育信息間關系進行分析抽象,得到表2所示的對象屬性及對應公理。

其中對象屬性的公理,為從離散數學當中借鑒過來的三種關系性質,分別是Transitive(傳遞性)、Asymmetric(非對稱性)和Reflexive(自反性),具體對象屬性及對應公理如表2所示[13]。

表2 對象屬性及對應公理

1.3 教育資源本體

利用Protégé進行計算機組成原理這一課程體系及相關知識的本體構建。層級關系采用目前本科計算機類學生教學常用的《計算機組成原理》中對計算機組成的分類方式作為分類標準,主題上分四個大塊,分別是概論、計算機系統的硬件結構、中央處理器、控制單元。采用樹狀方式進行存儲,深度為4層。圖1和圖2分別是在Protégé進行本體構建的結構圖和可視化界面圖。Protégé會生成對應的owl及xml文件,可以方便在Hadoop中進行相關處理工作。

圖1 Protégé本體之間結構關系簡圖

圖2 Protégé本體之間可視化界面部分展開

2 教育信息化本體構建

教育信息之間的語義關系可以制定豐富的自定義推理規則[14-15]。這里假設a、b為教育信息,p、q表示屬性,p具有傳遞性,p和q互逆:

傳遞性規則:(? a p ? b)(? b p ? c)->(? a p ? c)

如果教育信息a和b之間具有屬性p,教育信息b和c之間也具有屬性p,屬性p具有傳遞性,則可以推理得到教育信息a與c之間也具有屬性p。

互逆規則:(? a p ? b)->(? b q ? a)

如果教育信息a與b之間具有屬性p,由于屬性p和q互逆,則可以推理得到教育信息b和教育信息a之間具有屬性q。

這里以計算機組成原理中的知識點為例,利用表2對象屬性及對應公理中對象屬性結合傳遞性或互逆規則,用JSJZC表示計算機組成原理的知識點作,在表3中寫出為推理規則。

表3 教育信息本體間邏輯

續表3

屬性約束,OWL使用屬性約束來描述那些特定類的屬性條件,屬性條件的基數約束如表4所示[11]。

表4 屬性條件約束規則

3 詞匯頻度分析模型

本體構建只是將零散的教育信息進行半結構化的數據構建過程,而詞匯頻度分析模型是將這類數據進行處理的模型。Hadoop作為一個分布式計算基本框架,在對大數據進行分布式計算的過程中,需要對數據進行整理和規劃,而作為Apache公司推出的MapReduce可以在大數據以及半非結構化的概況下進行數據處理[16-17]。教育信息數據具有半非結構化,需要通過本體構建的方式構建起一個相對的結構體系,所以通過對MapReduce和Hadoop進行配合,進行相關的數據計算,能更好地對數據進行處理。

而詞匯頻度分析模型MapReduce對教育信息資源進行管理,詞匯頻度分析模型的處理和表示是分類器構建的一個重要過程[18]。詞匯頻度分析研究的是對教育信息資源進行推送的相關算法,在前面已經基于本體進行個元數據的分類及結構構建工作,但只有結構無法進行相應的推送工作,因為對于元數據來說,每個元數據在推送過程中都具有相同的推送價值[19-20]。為了更好的進行相關信息資源的推送,文中在基于語義構建元數據的基礎上加入了基于改良后的貝葉斯概率統計計算公式。貝葉斯概率統計計算公式相較于傳統的頻數概率統計方式有所不同,其概率統計會保留不確定性[7]。

(1)

這與推送內容的目標用戶對于推送內容的不確定性恰好吻合,而傳統的貝葉斯公式如式(1)所示,其中P(A)代表A發生的概率,其概率值在[0,1],X代表在A之后進行測試的實驗[7]。這個公式代表的含義是在已知P(A)(在推送中最開始的P(A)可來自該行業專家的初始定值或小范圍內的問卷調查賦值初始概率)的情況下,每次新的變化會讓概率在[0,1]之間不停的變化。當中需要對每個教育本體進行附加屬性,通過這些附加屬性進行詞匯頻度分析模型的構造。文中采用詞匯頻度分析模型來對各個標題進行賦值,從而在進行推送的過程中可以更加準確地進行相關信息的推送工作[21]。

W={w1,w2,…,wn}

(2)

wi={name,depth},i∈[1,n]

(3)

式(2)中的W代表本體庫,式(3)中的wi為本體庫中的本體,每個本體wi含本體名稱和在本體庫中的本體層數,規定根節點(在文中是計算機組成)層數為1,其中下角標i代表每個本體的標號,n代表本體庫中最大本體數目。

htj={h11,h12,…,h1m,h21,…,h2m,…,hf1,…,hfm}

(4)

式(4)中htj是各個本體詞匯在不同日期下的熱度值,其中t代表日期,最大日期值為f,j代表所對應本體的標號。wi通過記錄的字段name與htj在代表本體進行互相映射。

(5)

式(5)為預先處理數據,根據已構建的本體庫,其存在層級關系,層級越低,其概括越大。而層級越高,其內容越細。計算在本體庫中與wi具有較強連接度的本體數據的比例關系,進而得出與整體的關系。P(wi)代表的是每個本體與整體的連接概括關系,而dep(wi,wj)表示兩個本體間的層級的距離,如果兩個本體間越相近,其dep()值越小,P(wi)越大,其本體wi與其他本體的鏈接越緊密,在推送的時候更應該連帶進行推送。此部分對應傳統貝葉斯公式中的P(A)部分。

(6)

式(6)為計算在對應本體的熱度值,該熱度值的來源為各大搜索引擎的熱詞搜索數據(文中采用的是百度指數中的相關數據)。這里設每日該本體對應的熱詞比例公式為P(htj),htj和hTj分別為獲取當前詞匯的熱度數和不同天數下的該本體的熱度數。P(htj)值越高,代表htj在用戶搜索中占有較重要的意義,htj所對應的本體wi的推送排名應該上升。P(htj)值越低,代表htj在推薦中應該進行排名下滑。

(7)

通過組合式(5)及式(6),可以得到簡單的基于貝葉斯模型,如式(7)所示。但貝葉斯在進行統計概率的情況下,其容易受到單次數據較大波動導致統計概率發生較大的起伏,所以,文中在結合本體與貝葉斯統計概率公式的同時加入頻數統計概率。

(8)

式(8)為當有相應的用戶搜索數據后,計算用戶搜索頻度值。式(8)中的α值為加權自定義值,默認情況下為0。而β為本體加權變量,默認情況下為1。如果需要特殊優先推送,增加該本體的β值或者調節α值,增加β值可以對本體進行正向加權,讓P(wi,htj)增加,而調節α即避免當前該信息過新無人查看P(htj)=0這種情況。

(9)

式(9)得到每個本體Wi所對應的粘性能量值Ei,推送系統根據Ei值進行相關內容的推送。Ei值越大,其推送排名越靠前;Ei值越小,其推送排名越靠后。

4 語義推送結果分析

基于逆概率的貝葉斯算法設計出的詞匯頻度分析模型和通過語義本體構建規則構建起來的半結構化教育信息本體結構,進行用戶粘性模型教育信息推薦系統[22-23]的設計工作。通過在百度指數上的相關數據結合專業書籍及相關專業老師的意見,計算P(wi)及相關公式的結果Ei,得到計算機組成原理排名前10的詞匯。教育信息推薦系統推送結果如表5所示。

表5 教育信息推薦系統推送結果

圖3是用MATLAB生成的教育信息推薦系統推送結果展示圖,以搜索計算機組成一詞例推送出的相關信息,點的大小代表訪問量,距離的遠近代表相關性層級的遠近。圖4是MATLAB生成的按書目錄一級標題推送結果。從圖3和圖4對比中可以大致看出,基于按一級目錄進行推送的結果在大多情況下不如教育信息推薦系統的推送結果,教育信息推薦系統的推送結果具有信息量大,相關信息多的特點。

圖3 教育信息推薦系統推送結果展示圖

圖4 按書目錄一級標題推送結果圖

對于表5當中的教育信息推薦系統的推送結果,選取了100名相關計算機專業的學生,通過給他們推送基于詞匯頻度分析模型及按書目錄一級標題排列進行推薦可靠度打分,讓其判斷需要程度的排序,得出如圖5所示的百名用戶滿意度記錄。從圖中可以大致看出,基于按一級目錄進行推送的結果在百名用戶中大多情況下不如教育信息推薦系統的推送結果。

圖5 百名用戶滿意值記錄

數值判斷方面,利用Jaccard Index(簡稱JS指數)進行用戶對推送結果排序的符合程度計算。式(10)為JS指數計算方式,其中A為推送結果,B為用戶希望推送結果。J(A,B)為JS指數計算結果,當JS指數大于0.70時為優秀,大于0.50時為良好,低于0.25時,該系統不利于進行推送。

(10)

將表5當中的信息推薦系統表和按一級目錄排列的結果同時讓100名自愿用戶(計算機專業學生)評判是否符合心理推送預期。并且利用式(10)進行計算。

根據圖5中百名用戶滿意值記錄,進行平均值計算,結果比較如表6所示。從表中可以看出,利用詞匯頻度分析模型結合語義本體分析后的推送系統JS平均指數達到了0.73,達到了良好的標準,而根據一級目錄進行推薦的推薦系統JS平均指數達到了0.57,明顯比基于用戶粘性模型及語義本體分析后的JS平均指數低。

表6 各類推薦算法比較表

對于表5當中的教育信息推薦系統的推送結果,從多名自愿用戶(計算機專業學生)的學生中選出100個計算機專業常見詞匯,通過測試推送基于詞匯頻度分析模型及按書目錄一級標題排列進行打分,能推送出準確的結果為1,未能推送出結果的為0,未能推送出準確結果但能推送出其泛詞(相同或相關的詞匯)的結果為0.5。圖6是100詞匯測試結果記錄圖,其中實線代表教育信息推薦系統推送,虛線代表按照一級目錄推送。

圖6 100詞匯測試結果

根據圖6,將圖中數據進行推薦度計算(推薦結果累加總分/詞匯總數),結果比較如表7所示。從表中可以看出,利用詞匯頻度分析模型結合語義本體分析后的推薦度分數達到了0.73,達到了良好的標準,而根據一級目錄進行推薦的推薦系統推薦度數僅僅達到了0.535,顯而易見,教育信息推薦系統的推送結果的準確性要遠遠高于按一級目錄推送結果的準確性。

表7 推薦算法比較

5 結束語

文中利用語義本體對教育信息進行本體構建,利用貝葉斯及頻度統計概率的方式對構建的教育信息本體進行概率上的計算,得到每個本體的推送概率Ei,根據Ei值的大小進行教育本體信息的推送工作。對推送的結果進行滿意度判斷,并且進行統計后,利用JS指數對該推送結果進行分析。

為了使推送的內容更加準確,從算法的實用性和健壯性出發,在教育信息研究領域當中應用改進貝葉斯算法設計的詞匯頻度分析模型,其推送結果的準確性和適應性優于基于目錄結構推送算法,能夠更加精確地對所服務的人群進行相應數據的推送工作。

猜你喜歡
詞匯信息教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
本刊可直接用縮寫的常用詞匯
教育有道——關于閩派教育的一點思考
辦好人民滿意的首都教育
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
本刊一些常用詞匯可直接用縮寫
主站蜘蛛池模板: 欧美劲爆第一页| 国产日韩欧美视频| 日本亚洲最大的色成网站www| 日韩在线播放中文字幕| 国产国产人在线成免费视频狼人色| 精品伊人久久久香线蕉| 国产在线精彩视频二区| 亚洲无码精品在线播放| 久久国产成人精品国产成人亚洲 | 老司机午夜精品视频你懂的| 米奇精品一区二区三区| 亚洲美女一区二区三区| 婷婷亚洲天堂| 国产精品理论片| 精品无码国产一区二区三区AV| 婷婷综合色| 国产69精品久久久久妇女| 成人av专区精品无码国产| 欧美视频在线不卡| 国产成人三级在线观看视频| 国产精品密蕾丝视频| 国产99精品视频| 在线国产资源| 久久人人爽人人爽人人片aV东京热 | 精品视频一区在线观看| 丝袜美女被出水视频一区| 大陆精大陆国产国语精品1024 | 激情网址在线观看| 天堂va亚洲va欧美va国产| 波多野结衣无码AV在线| 亚洲国产系列| 亚洲伦理一区二区| 在线国产你懂的| h视频在线播放| 激情综合网激情综合| 久久一色本道亚洲| 国产毛片网站| 日本国产在线| 欧美日韩久久综合| 一区二区三区国产| 中文字幕在线播放不卡| 精品国产毛片| 四虎在线高清无码| 国产精选自拍| 久久青草免费91观看| 亚洲国产亚洲综合在线尤物| 国产精品视频999| 国产真实乱了在线播放| 亚洲欧州色色免费AV| 91精品国产无线乱码在线| 91久久夜色精品国产网站| 欧美国产日产一区二区| 午夜日b视频| 欧美日韩导航| 亚洲欧洲日韩综合色天使| 欧美日一级片| 伊人大杳蕉中文无码| 精品久久蜜桃| 国产欧美高清| 91精品啪在线观看国产| 国产日韩欧美一区二区三区在线| 九九热精品免费视频| 成人在线综合| 99久久免费精品特色大片| 国产一区二区三区精品久久呦| 久久这里只有精品免费| 欧美日韩午夜| 无码中文字幕加勒比高清| 国产91精品最新在线播放| 国产手机在线ΑⅤ片无码观看| 熟女视频91| 色婷婷电影网| 欧美天堂在线| 国产精品区视频中文字幕| 毛片免费观看视频| 无码人中文字幕| 夜精品a一区二区三区| 亚洲日韩精品伊甸| 99这里只有精品在线| 无码国产伊人| 亚洲热线99精品视频| 亚洲视频在线青青|