999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基礎教育課程知識圖譜構建技術框架研究

2019-09-10 07:22:44朱曉悅杜雨雯王家若
南北橋 2019年18期

朱曉悅 杜雨雯 王家若

【摘? ? 要】基礎教育知識圖譜能體現出知識之間的聯系,以可視化方式向教師與學生反饋結構化知識,進行教學支架服務,輔助學生進行知識管理和教師教與學的設計。本文從基礎教育知識圖譜構建的框架出發,分實體抽取和實體關系抽取兩個角度研究知識圖譜構建的技術路徑,并生成高中數學必修二的知識圖譜。

【關鍵詞】知識圖譜? 實體抽取? 實體關系抽取? 基礎教育

中圖分類號:G4? ? ? 文獻標識碼:A DOI:10.3969/j.issn.1672-0407.2019.18.007

一、緒論

(一)研究背景與意義

在課堂教學過程中,教師通過圖像、視頻、互動軟件等多媒體教學載體的應用,教學知識的表達有了越來越多圖形化、生動化的展現方式。隨著大數據與機器學習的深入發展,通過數據挖掘的方式能夠發現更深層次的知識聯系。知識圖譜就是其中一種表達方式,知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系:實體間通過關系相互聯結,構成網狀的知識結構。

(二)國內研究現狀

知識圖譜的應用領域一般具有“新”或“熱”的特征,旨在通過對目標領域的分析把握其發展態勢。因此,統計并梳理知識圖譜應用領域的新關鍵詞,可以窺見我國各時間段的研究重點及整體趨勢。1.研究重點。從關鍵詞來看,我國知識圖譜應用較多的是對某學科和某主題進行知識圖譜分析。如學科知識圖譜:王琪等以1991-2009年間與“體育”相關的博士論文為數據,深入探討了科學知識圖譜在體育學科研究中的應用前景。如主題知識圖譜:王晴用CitespaceⅢ分析2015年以前的“慕課”研究相關文獻,發現當前我國“慕課”研究的熱點集中在技術支持、教學效果、教學活動、教學模式等問題。2.整體趨勢。時代化。通過觀察知識圖譜應用領域的相關關鍵詞發現,從“數據挖掘”到“云計算”再到“慕課”,知識圖譜的研究對象一直緊跟時代、與時俱進。通過研讀論文發現,目前中國在學科知識圖譜方面的研究還是比較缺乏的,而本項目的研究內容就關注于基礎教育學科的知識數據庫的建立,并通過知識圖譜建立一個知識框架,以作為一個學科標準對照。

二、知識圖譜構建技術框架

(一)實體抽取

實體抽取是圖譜構建中最關鍵的步驟,它是決定了圖譜質量的關鍵。簡單來說實體抽取就是從文本中抽取關鍵詞,實體抽取流程大致如圖2-1所示,將文本切分成獨立的詞,并對詞進行分析(本質是聚類分析),常見方法有機器學習分析、統計分析與語義分析,由于技術水平等限制,我們采用了統計分析方式。

1.分詞。分詞是將連續字符串切分成詞的過程,為避免漏詞,本項目使用ansj分詞工具中的最小顆粒度分詞再進行復合詞拼接,將文本中的內容切分成獨立的詞,并進行詞性標注。同時在分詞結果中進行詞性過濾,考慮到漢語語法,作為關鍵詞只保留動詞相關、名詞相關等詞性。2.復合詞拼接。需要將分割后的詞拼接,以達到較高的召回率,本項目采用基于統計的規則進行拼接,主要體現在兩點上:互信息與信息熵。這里簡單介紹:互信息體現兩個變量的相互依賴程度,常用定義如下:

其中X、Y表示相鄰詞語,該公式為相鄰詞出現的概率與作為單獨詞出現的概率之比的對數,數值越大則說明二者作為一個詞的概率較大信息熵主要是用詞語的左邊界熵和右邊界熵,用來判斷兩個詞出現的順序可能性。3.關鍵詞抽取。在得到候選復合詞之后,需要進行進一步處理得到關鍵詞。關鍵詞作為一篇文章中重要的詞,其特點是出現頻率高并且與其他文章相關度不高,綜合考慮下,本項目使用簡單的TF-IDF算法進行關鍵詞抽取,TF-IDF算法用以評估某詞對文檔集的重要程度。計算公式如:TF-IDF=TF*IDF

(二)實體關系抽取

在提取完實體后,需要進行實體間關系的抽取。本文中,分類關系和非分類關系是兩種主要的實體關系類型。分類關系中最典型的是上下位關系,它表明了上位詞和下位詞之間的層次關系,例如銳角與三角形。而非分類關系體現了實體之間的關聯性,實體間沒有層次之分,例如銳角與鈍角。在獲得實體間分類關系的過程中,我們利用字符串匹配法。即通過字符串匹配遍歷列表中的詞,提取概念之間的詞串包含關系,這種概念之間的分類關系是顯而易見的。在獲取實體間非分類關系的過程中,本項目采用了Apriori算法。通過計算支持度(support)、置信度(confidence)和提升度,找出數據中的頻繁項集,從而挖掘出數據間的關聯規則。

三、結果分析

按照上述流程,采用手動+自動結合的方式,以人教版高中數學必修一為例,提取教案、課本、教材等57個純文本文件作為語料,手動設置閾值,將最終得到的實體與實體關系通過網頁D3.js展現出如下圖所示結果:

由于是人工評測(實際應為由現有語料庫自動評測,但限于項目人工調整閾值等因素,采用專家評估),單就實體抽取來說結果如下:抽取詞共37個,實際應有實體98個,錯誤1個

P=97.3%? R=36.7%? F=53.2%

總的來看:我們過于追求準確而丟失了很多數據,導致F值有點低,且由于是人工調整閾值效率極低,需要改進方法。

參考文獻

[1]劉嶠等:《知識圖譜構建技術綜述》,《計算機研究與發展》2016年第三期.

[2]王琪,徐成立.知識圖譜視野下我國體育科學研究的發展路徑——基于1991~2009年體育學博士論文關鍵詞共詞網絡的可視化分析[J].體育學刊,2010,17(12):118-125.

主站蜘蛛池模板: 欧美亚洲一区二区三区导航| 欧美69视频在线| 亚洲狼网站狼狼鲁亚洲下载| 欧美精品不卡| 国产成人综合亚洲欧洲色就色| 亚洲美女AV免费一区| 国产成人在线无码免费视频| 99尹人香蕉国产免费天天拍| 国产成人一区| 中文字幕亚洲乱码熟女1区2区| 亚洲男人天堂网址| 国产永久无码观看在线| 国内精品小视频在线| 亚洲视频在线网| 精品亚洲欧美中文字幕在线看| 精品视频福利| 国产91无码福利在线| 欧美日韩中文字幕在线| 无码中文AⅤ在线观看| 国产乱子伦手机在线| 蝴蝶伊人久久中文娱乐网| 色综合a怡红院怡红院首页| 国产麻豆精品在线观看| 国产精品久久久久久影院| 91精品国产91久无码网站| 国产麻豆91网在线看| 天天色天天综合网| 日韩午夜片| 欧美精品v| 久久精品中文字幕免费| 欧美成人aⅴ| 国产流白浆视频| 国产精品香蕉在线| 亚洲欧美精品在线| 国产精品99r8在线观看| 青青草91视频| 久久国产精品嫖妓| 亚洲国产精品久久久久秋霞影院| 福利姬国产精品一区在线| 久久综合干| 无码人妻免费| 日韩欧美高清视频| 91亚洲免费视频| 狠狠色丁香婷婷| 国产日韩欧美精品区性色| 国产成人高清在线精品| 欧美全免费aaaaaa特黄在线| 夜色爽爽影院18禁妓女影院| 欧美一级99在线观看国产| 国产精品亚洲а∨天堂免下载| 69综合网| 成年人免费国产视频| 日韩 欧美 小说 综合网 另类| 国产永久在线视频| 亚洲日韩精品欧美中文字幕 | 国产在线观看成人91| 第一页亚洲| 国产免费高清无需播放器| 色婷婷在线影院| 日韩欧美一区在线观看| 18禁色诱爆乳网站| 欧美成人手机在线视频| 色成人综合| 国产午夜在线观看视频| 亚洲国内精品自在自线官| 日韩欧美视频第一区在线观看| 中文精品久久久久国产网址| 久久99蜜桃精品久久久久小说| 欧美日韩v| 72种姿势欧美久久久大黄蕉| 久久久久国色AV免费观看性色| 亚洲国模精品一区| 午夜a级毛片| 亚洲国产欧美自拍| 天天综合网在线| 99久久国产综合精品女同| 91丝袜美腿高跟国产极品老师| 日韩精品亚洲一区中文字幕| 欧美第二区| 天天干伊人| a免费毛片在线播放| 日本欧美视频在线观看|