999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多方對話角色關系語料庫構建工具的設計與開發

2021-03-08 01:38:30王儀琳蔣玉茹湛宇航王玫勻
電子技術與軟件工程 2021年23期
關鍵詞:頁面文本

王儀琳 蔣玉茹 湛宇航 王玫勻

(北京信息科技大學計算機學院 北京市 100101)

隨著人工智能與大數據的發展,大量的有效信息隱藏于互聯網海量數據中,很多工作都需要從文本中挖掘其中蘊含的實體關系。人機對話系統領域內涉及的語義角色標注是近年來人工智能研究的熱點[1],而多方對話的研究剛剛起步。多方對話文本作為一種特殊的文檔形式,發言人之間的交互錯綜復雜,存在大量的跨句關系,而且還存在大量的省略與指代信息。

為了進行多方對話文本自動理解工作,首要的是構建一定規模的語料庫資源。在語料庫角色構建平臺的研究中,周彬彬[2]所構建的標注系統較完備,但僅針對軍事性語料,相比之下,夏琦[3]所開發的角色標注系統考慮到了對話文本語料,但結果并不理想,因此,面向多方對話文本中的角色關系挖掘工作,開發具有普適性的適應多種語言的多方對話角色構建工具勢在必行。

本項目分析角色關系標注的需求,設計并開發了一個便于用戶通過閱讀語料文本直接進行角色關系標注的工具。既滿足了基本的標注需求,又一定程度上實現了相關數據的實時可視化。同時具有比較好的實用性和可操作性,也考慮到了王俊福[4]提出的標注中多用戶同時協作時的并發問題,且適用于不同語言類型的對話文本語料。

一個好的標注工具可以提高標注者的工作效率,設計良好的標注系統界面和簡單的標注操作可以降低標注者們進行標注工作的難度,并且降低標注工作的枯燥程度。本文也考慮到了上述情感因素,在開發工具的時候進行了相應美觀設計。

1 功能需求

本文將角色關系標注分為角色指代標注和關系標注兩個子功能。圖1為本工具的模塊結構圖。

圖1:多方對話角色關系語料庫構建工具模塊結構圖

1.1 角色指代標注

用戶在對話文本中選取提及詞(人物的稱呼),并與該提及詞所對應的角色進行關聯,完成角色指代標注。

(1)用戶選擇單元和場景,系統界面顯示相應的對話文本。

(2)用戶選中對話文本中的提及詞,然后選擇左側相對應的角色實體,完成一次角色標注。若左側無所標注提及詞對應的角色實體,應選擇其他,再根據彈窗鍵入定義的實體中文名稱即可。

(3)標注完一個場景,提交結果,標注結果存入后端數據庫。

(4)同一場景在未點擊提交前標注內容可以修改更新,但點擊提交結果后不可再進行修改。

1.2 角色關系標注

用戶通過閱讀對話文本,從文本中找到所有出場人物之間的關系,通過添加欄加入進圖數據庫,完成角色關系的標注。

(1)可以添加實體名稱和實體類型。

(2)通過選擇兩個角色實體及二者之間的關系類型進行角色關系的添加或刪除操作。

(3)系統為新添加的角色關系增加時間戳,以記錄同一對角色不同時期關系的變化。

(4)可以通過輸入一個角色實體的名稱查詢以該角色實體為中心的角色關系圖。

2 架構

本工具使用B/S(Browser/Server)架構,前端部分主要實現語料顯示、在線標注和關系圖可視化等功能。后端部分主要存儲用戶所標注的角色和關系數據,以實現數據的持久化。具體而言,本工具前端使用Bootstrap開源框架,后端使用Flask框架和Django框架,角色指代標注的結果以JSON文件形式存儲,角色關系標注的結果存入Neo4j數據庫。

3 頁面設計

3.1 角色指代標注頁面設計

如圖2所示,為本工具設計并實現的角色指代標注頁面。

圖2:角色標注頁面

(1)標注文本選取。利用頁面右上方工具條選擇標注內容。

(2)標注文本展示。頁面右下方為標注內容展示區。主要展示說話人和說話內容。說話內容經過分詞后展示。

(3)角色列表展示。頁面左側列出語料中出現的主要角色名稱,其他人物名稱用戶標注的時候需單獨標出。

3.2 角色關系標注頁面設計

如圖3所示,為本工具設計并實現的角色關系標注頁面。其中標注文本選取和標注文本展示與3.1節角色標注頁面相同。此外,還有:

圖3:角色關系標注頁面

(1)知識圖譜展示部分。利用頁面左上方,將已標注的角色關系進行可視化展示。

(2)角色關系添加和刪除。利用頁面左側中部,根據文本內容,選擇角色實體1和角色實體2,再選擇他們的關系,然后再點擊“添加關系”按鈕,將一個角色關系三元組插入知識圖譜數據庫;或者點擊“刪除關系”按鈕,將角色關系三元組從知識圖譜數據庫中刪除。

(3)角色實體添加和刪除。標注過程中遇到之前未曾出現過的角色實體,可以輸入實體名稱和實體類型,然后進行添加。也可以刪除。

(4)實體圖查詢。輸入角色實體名稱,點擊“查詢實體圖”,可以在頁面左上方顯示與該實體相關的知識圖譜。

5 總結

本文利用設計并開發了一個面向多方對話角色關系挖掘工作的語料庫構建工具,該工具已經應用于課題組的語料標注工作,標注了《我愛我家》劇本120集內容中的出現的角色指代和關系信息。該工作為后續在多方對話文本中進行角色關系自動挖掘研究打下了基礎。

猜你喜歡
頁面文本
微信群聊總是找不到,打開這個開關就好了
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
同一Word文檔 縱橫頁面并存
主站蜘蛛池模板: 亚洲欧美日韩精品专区| 亚洲欧美日韩精品专区| 国产亚洲视频中文字幕视频| 久久黄色一级视频| 免费看一级毛片波多结衣| 91色综合综合热五月激情| 一本大道香蕉中文日本不卡高清二区| 国产美女91视频| 欧美人与性动交a欧美精品| aⅴ免费在线观看| 久久女人网| 午夜精品久久久久久久99热下载 | 亚卅精品无码久久毛片乌克兰 | 91精品啪在线观看国产91| 99在线国产| 午夜成人在线视频| 国产精品免费电影| 国产玖玖视频| 国产97视频在线| 欧美a√在线| 欧美性精品不卡在线观看| 91美女在线| 国产在线麻豆波多野结衣| 日本免费一级视频| 欧美劲爆第一页| 亚洲日韩AV无码精品| 欧美yw精品日本国产精品| 国产农村1级毛片| 国产超薄肉色丝袜网站| 亚洲日韩日本中文在线| 亚洲人成网站18禁动漫无码| 91在线免费公开视频| 日韩美毛片| 欧美a网站| 国产a在视频线精品视频下载| 特级毛片8级毛片免费观看| 99视频精品全国免费品| 亚欧美国产综合| 成人国产免费| 91外围女在线观看| 日韩精品专区免费无码aⅴ | 久久黄色毛片| 亚洲黄网在线| 欧美日韩另类在线| 国产成人AV综合久久| 亚洲午夜片| 国产成人亚洲精品无码电影| 国产成人AV综合久久| 成人午夜精品一级毛片| 视频一区亚洲| 国产a v无码专区亚洲av| 在线观看网站国产| 亚洲一级毛片免费观看| 免费人成网站在线观看欧美| 亚洲天堂精品在线| 国产a在视频线精品视频下载| 久久国产精品77777| 欧美激情,国产精品| 亚洲欧美一级一级a| 91福利在线观看视频| 亚洲精品另类| 永久毛片在线播| 视频二区国产精品职场同事| 91色爱欧美精品www| 四虎永久免费地址| 久久96热在精品国产高清| 四虎永久在线视频| 亚洲无码A视频在线| 国产一区亚洲一区| 97超爽成人免费视频在线播放| 在线播放91| 在线另类稀缺国产呦| 日韩大片免费观看视频播放| 亚洲中文字幕在线观看| 国产欧美视频综合二区| 国产在线观看99| 成AV人片一区二区三区久久| 婷婷色丁香综合激情| 欧美视频二区| 一本色道久久88综合日韩精品| 久久久久免费精品国产| 欧美a在线看|