






















[關鍵詞] 漢語學習詞典;用戶視域;評價體系;內容分析法;德爾菲法;層次分析法
[摘 要] 外向型漢語學習詞典目前存在較嚴重的質量問題,詞典評價研究雖對提高詞典質量具有重要意義,但過往研究卻存在評價主體單一、評價方法主觀、評價內容失衡等諸多問題。為突破詞典評價研究瓶頸,提高詞典編纂質量,本研究擬構建用戶視域下的外向型在線漢語學習詞典評價指標體系,構建流程為:首先,從用戶需求研究文獻、APP Store留言板塊、深度訪談等數據源中爬取用戶評價語料以構建用戶評價語料庫,借助內容分析法對語料分析后構建初始評價指標體系。其次,采用德爾菲法對指標體系進行優化。最后,利用層次分析法計算出指標權重。最終確立的評價指標體系包含3個一級指標、19個二級指標及56個三級指標。
[中圖分類號] H195.3;H164 " [文獻標識碼] A " [文章編號] 1674-8174(2025)01-0092-13
1. 問題的提出
外向型學習詞典在助推語言對外傳播過程中發揮著巨大作用,以Longman Dictionary of Contemporary English、Collins COBUILD English Language Dictionary、Cambridge International Dictionary of English等為代表的外向型英語學習詞典成功地將英語語言背后的文化、習俗、價值觀等傳播至世界的各個角落,但既有外向型漢語學習詞典(以下簡稱“外漢詞典”)質量還不足以承擔此重任。紙質詞典方面,近20年我國已編纂了百余種外漢紙質詞典,其中不乏有為學界所廣泛稱譽的“精品詞典”如《商務館學漢語詞典》(2007)、《漢語教與學詞典》(2011)等,但仍有部分詞典存在抄襲、變相抄襲、學習性和外向型特征不突出等各類質量問題(宋立文,2021)。在線詞典如Pleco、TrainChinese、HanpingLite等則更是良莠不齊、整體質量也不盡如人意(李睿、王衍軍,2022)。張志毅(2012)曾說:“我們離辭書強國確還有50年的距離”,目前看來,外漢詞典的距離尤甚,如何提升外漢詞典質量成為亟待解決的問題。
詞典評價在此可發揮重要作用。鄒酆(2004:334)指出:“辭書評論能給辭書編纂提供改進意見,并指導適用;能給辭書管理部門提供宏觀調控、統一規劃管理的依據;能向辭書理論與歷史的研究提供業經初步整理的辭書訊息資料”。可見,詞典評價可從編纂實踐、監管、理論等方面促進詞典質量的提升。詞典評價研究領域,詞典評價標準研究是該領域的研究重心,可劃分為整體評價標準研究和局部評價標準研究兩類。整體評價標準立足于詞典文本的整體結構信息,具有宏觀性、系統性的特點。外漢詞典方面,目前僅蔡永強(2016:165-168)從理論基礎、外部結構、宏觀結構、微觀結構等維度構建了系統的詞典評價體系。局部評價標準主要針對詞典某一微觀結構信息,如釋義上,魯健驥、呂文華(2006)認為外漢詞典的釋義應具備“可讀性”“熟知性”“區別性”“提示性”;例句上,崔樂(2012)認為外漢詞典例句應具備“信息的全面性”“語言的簡易性”“篇幅的簡短性”等。
過往的外漢詞典評價標準研究對引導詞典編纂具有一定積極意義,但仍存在以下不足:(1)評價主體單一:我國漢語學習詞典遭遇窘況的主要原因是缺乏用戶意識(楊玉玲、李宇明,2023),目前詞典標準的構建也僅是從專家視角入手,缺乏對用戶標準的研究,致使標準缺少應用價值。武繼紅(2005:90-96)指出:“如果僅僅把詞典批評視為學術行為、詞典學家的評估或者編者的自我描述,缺乏對詞典使用以及使用者的應有關注,就會影響其理論意義和應用價值”;(2)評價方法主觀:多依靠內省的定性方法提取編纂經驗后面所隱藏的規律,致使結論常欠缺普遍性、科學性;(3)評價內容失衡:多聚焦于釋義、例證等微觀結構信息,對于詞典中的辨析、標記等方面涉及較少,致使評價內容失衡,系統性不足。(4)評價客體未彰顯時代特征:缺少對在線詞典、融媒詞典等新興詞典標準的研究,與時代特征、用戶需求悖離。
綜上所述,為促進外漢詞典評價研究發展,提升外漢詞典質量,我們有必要借助科學手段構建出用戶視域下的具有系統性的在線外漢詞典的評價體系。
2. 基于內容分析法構建初始評價指標體系
內容分析法(Content Analysis)是一種對研究對象的內容進行深入分析,透過現象看本質的科學方法,是一種客觀地、系統地、定量地描述交流內容的研究方法。由于內容分析法可以有效地識別個人、團體的喜好偏向、關注焦點和交流趨勢等,可用于構建評價體系(向婧怡等,2018;侯平平等,2022)。
2.1 用戶評價語料庫建立
“合適”的語料庫需要具備兩個特質:一是與研究目的相適應,能夠回答研究問題;二是具有代表性,能夠代表研究對象(宮雪、梁寧,2023)。本研究語料庫的語料來源共三處,如圖1所示:(1)從過往用戶需求調查文獻中提取評價性語料(左側語料),文獻共計53篇,被調查者約5100余人來自50余個國家和地區,涉及Pleco、Naver、Hanping Lite等各類在線外漢詞典。(2)從Pleco、Train Chinese、Hanping Lite等在線外漢詞典的APP Store留言板塊及用戶社區中篩選出用戶評價語料(中間語料),由于網絡空間具有虛擬性、寬松性、平等性等特點,用戶能夠比較真實地將其對產品的需求表達出來,可成為研究用戶偏好的重要資料(張文、頓雪霏,2010)。(3)對25位漢語學習者(中、高級別,使用在線外漢詞典時長3年及以上)有關在線外漢詞典的使用需求進行了深度訪談,并從中提取評價性語料(右側語料)。為保障數據質量,我們對所收集的數據進行了預處理:首先,去除了重復評論、噪音數據、無效符號、表情等不能反映實際語義信息的評論文本。而后,對過濾后的評論文本進行規范化處理,例如進行同義詞替換如將“例證”“例句”“例子”統一為“例句”。最后,根據詞典特征設置停用詞,對數據進行去停用詞處理。語料庫最終共收集有效評價語料2,6000余條。
2.2 詞頻分析
詞頻分析過程為:將語料庫中的評價語料儲存為txt文本格式,而后利用ROST CM6 對評價文本進行分詞,分詞完成后,再對其進行詞頻統計。圖2為根據高頻詞導出的詞云圖,表1為排名前50的高頻詞及詞頻。
通過詞頻統計可以看出:首先,用戶評價的重點為詞典的結構信息如例句、釋義、收詞、檢索、標注等。其次,用戶關注的內容是廣泛的,除詞典結構信息外,還對詞典的系統功能、練習設置等提出了具體的要求。最后,從高頻形容詞“方便”“準確”“實用”“易懂”等形容詞可推知,用戶更為重視詞典“實用性”“準確性”等。
2.3 高頻詞社會網絡分析
詞頻分析能通過提取的評價文本中的高頻詞反映研究對象的主要特征,但無法反映詞組在特定意義上的聯系以及文本深層次的結構關系,而社會語義網絡分析則能通過構建概念和語義關系的網絡圖來直觀展現高頻詞之間的關系,有助于了解用戶的具體使用偏好,如圖3中“難懂”指向“例句”,表明“例句難懂”作為共現詞,在總文本中出現頻率較高,具有普遍性。社會語義網絡分析的過程為,首先對評價文本進行分詞處理,提取高頻詞并過濾掉無意義詞匯后,對文本進行特征分析,并形成VNA文件,啟動NETDRAW,繪制完成社會語義網絡圖,如圖3所示。
2.4 提取分析單元
結合高頻詞表、社會語義網絡可以確定與核心高頻名詞相關的分析單元,共提取有效分析單元110個,如表2所示。
對于描述模糊的分析單元,可以分析單元為關鍵詞搜索具體評價語料以明確分析單元所指,如表3所示,分析單元“例句數量”主要指“例句數量太少”或“例句數量太多”。
2.5 編碼方案設計
確定分析單元之后,需將單元進行編碼歸類。編碼歸類方案通常有3個來源,分別是數據、已有的相關研究、已有的理論(韋艷麗等,2022)。評價指標體系的構建應以明確評價對象本質、屬性等為前提,構建結果也應體現評價對象的屬性特征(梁宇,2023)。由在線外漢詞典所屬范疇類型(見圖4),首先,在線外漢詞典具有與一般詞典所共有“典范性”“知識性”“穩定性”等屬性,而上述屬性特征主要通過詞典結構信息考察,同時根據高頻詞“例句”“釋義”等,可設立一級編碼指標“結構信息”,下設二級編碼指標如“釋義”“例證”“義項”“收詞”等,將分析單元歸入所屬二級指標,依據其語義內涵構建三級編碼指標,如“例句-豐富性”“例句-實用性”等。歸類時需注意,歸類必須完全、徹底,能適用于所有分析材料,使所有分析單位都可歸入相應的類別,不能出現無處可歸的現象,且每一分析單位只能歸入一個類別。其次,與外向型學習詞典所共有的“學習性”屬性,結合高頻詞“練習”“聽力”等,依此設立“練習設計”一級編碼指標,下設二級編碼指標“練習內容”“練習反饋”,編碼歸類后可設立“練習內容-多樣性”“練習內容-有效性”等三級編碼指標。最后,與在線詞典所共用的“技術性”屬性,結合高頻詞“系統”“功能”“界面”等,依此設立“技術性能”一級編碼指標,其包括“界面設計”“系統運行”“系統功能”等二級編碼指標,編碼歸類后可設立“功能操作-多樣性”“功能操作-簡易性”等三級編碼指標。將最終歸類結果視為初擬評價指標體系,歸類結果如表4所示。
2.6 信度檢驗
內容分析中的信度可以定義為不同編碼員對內容歸類的一致性,為檢驗分類的信度,選擇了A、B、C三位研究生作為編碼人員,3位編碼人員皆有詞典編纂和研究經歷。對編碼人員進行編碼培訓后,3位編碼員獨立完成歸類任務。歸類完成后,采用Holstis信度計算內容分析中編碼員歸類的一致性,其中:
[相互同意度=2MN1+N2]
Holstis信度 = [n×相互同意度均值1+[(n-1)×相互同意度均值]]
M為兩位編碼人員編碼一致數量,N1和N2分別為編碼單位數,n為編碼人員數量。據表5數據顯示,Holstis信度達到0.983,滿足理論要求(夏長杰、劉奕,2017:28)。
3. 基于德爾菲法評價指標體系優化
德爾菲法,是指反復運用分發專家咨詢表的形式,采用背靠背的方法,征詢專家小組成員的意見,將專家的意見經過“集中、返回、再集中”的幾輪征詢,最后使專家小組的意見趨于一致,得出咨詢結論的研究方法,本研究借助該方法對初擬評價指標體系進行優化。
3.1 專家基本情況
本研究目的為構建用戶視域下的詞典評價指標體系,因此本研究所選專家應屬“專家型用戶”,其遴選標準為:漢語學習年限5年及以上,為國際中文教育或語言學及應用語言學研究生學歷,均通過HSK6級考試,為高級漢語學習者;使用在線外漢詞典時間5年及以上,為資深在線詞典用戶。最終遴選16位專家,基本信息如表6所示。
3.2 統計分析
運用德爾菲專家咨詢法,對專家開展兩輪咨詢,通過電子郵件或者微信將問卷發放給專家,對初擬指標進行修改、增刪等,并依據Likert7級評分法對指標“重要性”進行評分,評分越高說明該指標對應的程度越高。利用SPSS22.0軟件對數據進行整理和分析,計算各指標的平均值、標準差、變異系數、專家意見協調系數、專家積極程度、權威程度等。其中,專家積極程度用積極系數表示,專家積極系數 = 有效問卷回收數/問卷發放數 × 100%,大于 60%為較好。專家權威程度系數(Cr)根據判斷依據(Ca)和熟悉程度(Cs)計算,Cr=(Ca + Cs)/2,Cr gt; 0.70即表示專家權威程度較高咨詢結果可靠。判斷依據包括理論分析、實踐經驗、參考國內外資料、直覺四個部分組成,其賦值標準如表7所示,“熟悉程度”按照很熟悉、熟悉、比較熟悉、一般熟悉和不熟悉的層次分別賦值1.0,0.8,0.6,0.4和0.2。專家意見協調系數可通過肯德爾和諧系數Kendalls W和變異系數Vj進行考察,Kendalls W越高(數值在0~1之間)、Vj 越小,說明專家對研究內容的評價結果波動越小、離散程度越低、意見越集中。
3.3 統計結果
3.3.1 專家積極程度
第1輪和第2輪咨詢各發放函詢問卷16份,收回有效問卷16分,專家積極系數為100.0%,表明專家對本研究給予的重視程度較高。
3.3.2 專家權威程度
據專家對判斷依據和熟悉程度賦值結果顯示,第1輪、第2輪專家咨詢的Cs分別為0.821,0.862,Ca分別為0.871,0.914,計算得到2輪咨詢的Cr值分別為0.846,0.888,均大于0.70,表明專家權威程度較高且專家對指標評分時有較高的熟悉程度和較充分的判斷依據。
3.3.3 專家意見協調程度
兩輪專家函詢各級指標Vj數值范圍分別為0.076~0.228 ,0.089~0.104,可見第二輪專家函詢對各級指標評價的波動程度更小,意見更為集中。表8所示,兩輪專家函詢的Kendalls W分別為0.465和0.642,差異具有統計學意義(Plt;0.001),第2輪專家意見協調系數比第1輪有較大提高,表明專家意見趨于一致,各級指標重要性可接受。
3.4 專家咨詢結果及指標調整
根據各專家重要性評分結果,計算每項指標的均值和變異系數Vj ,根據其界值進行指標篩選,界值標準為:重要性得分均數gt;3.5分且Vj均值lt;0.25。第1輪咨詢結果顯示,所有指標均值gt;3.5,Vj均值lt;0.25,指標均可保留。根據專家提出的修改建議,經課題組討論,將原屬一級指標“結構信息”中的“檢索”“超鏈接”“發音”3個二級指標移入一級指標“技術性能”中;將三級指標“義項-劃分精細性””改為“義項-劃分針對性”;將三級指標“系統運行-及時性”改為“系統運行-時效性”。將三級指標“例句-豐富性”改為“例句-數量適宜性”,并將指標說明修改為“每個義項都需有一定數量的例句,2-5例為宜”,“例句-長度適宜性”指標說明修改為“例句長度適中,不宜過長、過短”,將“義項-劃分針對性”指標說明修改為“義項劃分要針對漢語學習需求,劃分不宜過粗、過細”。
第2輪咨詢結果顯示,所有指標均值 gt; 3.5,Vj均值 lt; 0.25,指標均可保留。根據專家修改建議,經課題組討論,將二級指標“問題回饋”改為“客服反饋”。二級指標“辨析”改為“易混淆詞”,并將其所對應的3個三級指標改為“選取針對性”“辨析準確性”“辨析易懂性”。三級指標“例句-典型性”指標說明修改為“例句能反應被釋詞典型語境、用法等”。
4. 基于層次分析法的指標權重計算
本研究借助層次分析法(Analytic Hierarchy Process)計算指標權重,該方法是20世紀70年代初由美國匹茲堡大學薩蒂教授提出的將定性分析與定量分析綜合集成的系統工程方法,其將人的主觀判斷為主的定性分析進行定量化,將各種判斷要素之間的差異數值化,以幫助人們保持思維過程的一致性,是目前一種被廣泛應用的確定權重的方法(梁冬瑩等,2013)。
4.1 構建判斷矩陣
經過兩輪德爾菲專家咨詢后,最終確立一級指標3個、二級指標19個及三級指標56個,依據指標關聯隸屬關系建立遞階層次結構模型。如圖5所示,將“外向型在線漢語學習詞典用戶評價指標體系”作為目標層,規定結構信息、練習設計、技術性能三個一級指標為目標層的分指標A。將二級指標作為準則層B,三級指標作為子準則層C。依據指標體系模型構建判斷矩陣,判斷矩陣表示同一層次的相關元素相較于上一層次元素的重要性,如表9所示一級指標判斷矩陣,共構造出判斷矩陣21個。
參考托馬斯薩提提出的“1-9”重要等級標度法對指標重要性進行評判(鄧雪等,2012)。但層次分析法在處理評價指標時具有一定的主觀性和不確定性(楊俞玲等,2022),為提高權重賦值的科學性,我們基于黃朋月、袁勤儉(2023)的方法,參考前文的詞頻表,統計出各指標的詞頻總數和該指標在同一準則指標中的占比,再結合各指標的詞頻占比對每一層次各指標的相互重要性給出判斷,詞頻占比及對應重要性標度如表10所示。如表11所示,三級指標“標記-豐富性”及“標記-準確性”(i∶j)的詞頻占比之比為“18.6∶1”,根據表10重要性標度換算,在判斷矩陣中“標記-豐富性:標記-準確性”為“9∶1”。
4.2 指標權重計算
權重的計算過程為:首先,計算判斷矩陣中每一行的乘積,公式為:[Mi=j=1naij(i=1.2...,n)]。其次,計算指標初始權重系數,公式為:[Wi=Min(i=1,2,...,n)]。最后,對[Wi]進行歸一化處理,其公式為:[Wi=Wi-i=1nWi-(i=1.2,...n)]。如表12所示,“標記”下屬三級指標“豐富性”“準確性”“易懂性”的權重值分別為0.7927、0.0760、0.1312。
4.3 一致性檢驗
指標權重值計算完成后,應進行一致性檢驗,以證明其可靠性。一致性檢驗計算過程為:首先,計算最大特征值,其公式為: [λmax=i=1n(AW)inWi(i=1,2,...n)。]其次,計算一致性指標CI值,其公式為:[CI=λmax-nn-1]。 最后,根據矩陣階數查詢隨機一致性指標RI(表13所示)并計算一致性比率CR,其公式為:[CR=CIRI]。
當CRlt;0.1時,表示判斷矩陣通過一致性檢驗。相反,當CRgt;0.1時,提示需要對判斷矩陣做出必要的調整。如表12所示“標記”下屬三級指標矩陣CR值為0.02lt;0.1,通過一致性檢驗。經計算,本研究其他判斷矩陣的CR值均小于0.1通過一致性檢驗。
4.4 計算全局權重
全局權重反映了在整體目標下各指標的相對貢獻程度,將局部權重(即4.2節Wi值)與其對應的上一準則層的權重相乘,可獲得全局權重值(胡泳等,2024),最終結果如表14所示。
5. 總結與討論
本研究利用內容分析法、德爾菲法、層次分析法成功構建了用戶視域下的在線外漢詞典評價指標體系,共包含3個一級指標、19個二級指標及56個三級指標。魏向清(2001)曾指出“缺乏理論依據”是雙語詞典評價研究中最重要的問題之一。同樣,既有外漢詞典的評價研究中極為欠缺對詞典評價理論的探討。“發展辭書原理是辭書評價的天職”(鄒酆,2004:334),用戶評價指標體系的建構過程及結論對引導漢外詞典評價理論的革新具有重要意義,具體表現在:
5.1 評價主體:由“一元”到“多元”
目前外漢詞典評價多停留于專家層面的“一元主體”評價,忽視了評價主體的多樣性。本研究雖建構了用戶評價指標體系,豐富了評價主體,但用戶評價仍具有一定局限性。首先,用戶多只關注其常用的結構信息,對于不常用的信息卻予以了忽視,在評價體系中也未能反映,如對釋義括注、釋義指示語等的評價。雍和明(2003)此前的調查也發現,有些詞典用戶甚至沒意識到英漢詞典中包括有詞源信息。其次,受詞典典范性特質的影響,用戶會默認某些結構信息是嚴謹、正確的而不予評價或鮮少評價,陸福慶(1994)即指出“他們(指用戶)是把詞典奉為“典”而予以充分信任的”,權重值也顯示“標記”“語法信息”“易混淆詞”等準確性權重值較小。此皆表明欲構建系統的詞典評價體系,僅從某一主體視角出發還遠不夠。古貝、林肯(2008)等提出的第四代評價理論強調價值的多元性,主張評價對象及其他利益相關者應全面參與評價過程。事實上,學習詞典的利益相關者是多樣的,據Hartmann(2001:24)的研究應至少包括:用戶、詞典學研究者、詞典編者、語言教師等。系統評價體系的構建應注重發揮各利益相關者的評價優勢,如武繼紅(2005)即指出教師比編者更接近詞典使用的真實情況,其評價更加客觀,也更加直接,未來應加以利用。同時還應充分回應各方利益訴求,協調各方評價矛盾,尤其注重解決“研究者評價追求理論適配性和編者追求可操作性間的矛盾”“內向型詞典評價追求嚴謹性和外向型詞典追求實用性間的矛盾”“編者、研究者評價聚焦性和用戶評價多樣性間的矛盾”以及“出版者追求經濟效益和用戶追求性價比間的矛盾”等。
5.2 評價方法:由“定性研究”到“性、量”并舉
一套總體得到認可的評價方法對提高詞典評價質量十分重要(Swanepoel,2008),但既有外漢詞典評價標準的構建主要依靠定性方法去捕捉、概括描述編纂經驗后所隱藏的規律。張宏(2009)在研究配例標準即指出,定性研究是依據典型的或少量個案的資料得出的結論,這種結論不一定具有普遍性,如有研究者指出外漢詞典的例證應具有“趣味性”(崔樂,2012),但由于語體、語義等的限制,并非所有詞目的例證都應具有趣味,如部分莊雅體詞目。為提高評價標準構建的科學性、實用性,除定性手段外,還應注重介入量化手段,注重通過數值高低選取評價標準,客觀反映評價主體對于評價標準的重視程度,做到“性、量”并舉,本研究所用層次分析法、內容分析法等即注重發揮兩種方法的優勢。此外,“定性”與“定量”相結合的方法還應貫徹于評價標準的運用中,應注意,定性評價與定量評價實則是評價事物的兩個方面,二者互為表里和統一,定性評價必然導致定量評價,定量評價的目的在于更精確地定性評價(林原等,2021)。詞典編纂、內容的復雜性特征也決定其應采用多元評價方法,注意性、量并舉,協調配合以促進評價的科學性。
5.3 評價目的:由“批評”到“指導”
以往外漢詞典評價標準構建目的多在于攻訐、批評詞典內容質量,忽視將構建結果轉化為指導詞典理論、編纂提升的動力。羅思明(2008:26)即指出,詞典評價的作用不應是作“無病呻吟”或“雞蛋里挑骨頭”,應成為促使詞典學理論與實踐進步的外部動力和制約力量。在理論層面,首先,用戶評價體系可明晰未來詞典理論研究重點,如在評價體系中釋義、例證的可理解性權重值較大,未來應繼續加強釋義元語言研究。其次,驗證理論的實用價值,如章宜華(2010)基于二語習得理論提出學習詞典的“多維釋義理論”強調釋義內容應注重解釋詞語各個層面的意義,評價體系中“釋義-全面性”這一指標對此進行證實。但為多數專家所認同的“同場同模釋義原則”卻未見用戶提出,原因可能在于該標準是基于專家對同場詞語系統查詢對比后而提出,但用戶查閱的一次性、隨機性和短暫注視等特點使其較難發現同場詞語間的釋義差異,該標準實用價值還有待研究。在編纂實踐上,首先,用戶評價體系有助引導編者正視用戶作用。Lew等(2017)曾表示:“一般用戶無法勝任評價詞典資源的任務”。但事實上,用戶不僅知曉詞典結構信息的構成特點,具備判斷詞典質量的能力,其所構建的評價體系也比Pearsons(2013)、Lew(2017)等人的要全面,故我們應摒棄過往“幼化”或“脫離”用戶的錯誤做法,應將用戶評價建議置于重要位置。其次,評價體系可引導編者對詞典進行針對性提升,如就收詞而言,以往專家就收詞標準論述不一,但用戶認為應注重收錄新詞、成語、短語等,其中新詞需求最大。功能設計上用戶也提出了離線查詞、模糊查詢、收藏功能、筆記功能等具體功能需求。總之,我們應充分發揮詞典評價體系“以評促編”“以評促研”的功能,促進外漢詞典學良性發展。
[參考文獻]
埃貢·G·古貝,伊馮娜·S·林肯 2008 第四代評估[M]秦霖等(譯). 北京:中國人民大學出版社.
蔡永強 2016 對外漢語學習詞典學[M].上海:學林出版社.
崔 樂 2012 《外國人漢語新詞語學習詞典》配例研究[J].云南師范大學學報(對外漢語教學與研究版)(3).
戴佳慧 2020 英國巴基斯坦留學生常用漢語學習軟件調查研究[D]. "天津師范大學碩士學士論文.
鄧 雪,李家銘等 2012 層次分析法權重計算方法分析及其應用研究[J]. 數學的實踐與認識(7).
宮 雪,梁 宇 2023 基于描述語庫的國際中文教材評價指標基礎框架構建[J].民族教育研究(3).
黃朋月,袁勤儉 2019 用戶視閾下圖書類APP的評價指標體系研究[J].圖書館(12).
侯平平,姚延波,張丹丹 2022 在線旅行服務企業戰略績效評價體系研究[J]. 企業經濟(2).
胡 泳,徐 偉等 2024 基于多元化評價體系理論的我國研究生教育管理評價體系構建[J]. 武漢理工大學學報(社會科學版)(3).
李 睿,王衍軍 2022 基于盧與沙魯斯卡(2017)評估框架的外向型在線漢語學習詞典App評估研究[J].華文教學與研究(3).
梁 宇 2023 國際中文教材動態評價模型構建研究[J].四川師范大學學報(社會科學版)(5).
梁冬瑩,周慶梅,王克奇 2013 基于層次分析法的數字資源服務績 效評價體系構建[J].情報科學(1).
林 原,王凱巧,丁堃等 2021 學術論文的定性評價定量化研究[J].情報理論與實踐(8).
魯健驥,呂文華 2006 編寫對外漢語單語學習詞典的嘗試與思考——《商務館學漢語詞典》編后[J].世界漢語教學(1).
陸福慶 1994 《新現代漢語詞典》釋義的嚴重錯誤[J].辭書研究(3).
羅思明 2008 詞典學新論[M],合肥:安徽教育出版社.
宋立文 2021 外向型漢語學習詞典的出版概況、編寫問題與未來之路[J]. 北華大學學報(社會科學版)(5).
王曉涵 2021 外國學生使用外向型漢語詞典APP學習漢語現狀調查與分析[D]. 遼寧師范大學碩士學位論文.
魏向清 2001關于構建雙語詞典批評理論體系的思考[J]. 外語與外語教學(1).
韋艷麗,蔣小慶等 2022 基于內容分析法的閱讀類APP用戶使用偏好研究[J]. 包裝工程(8).
——— 2005 論學習詞典批評與讀者意識[J]. 辭書研究(2):90-96.
武繼紅 2005 論學習詞典批評與讀者意識[J]. 辭書研究(2).
向婧怡,張紅舉,陳 力等 2018 基于內容分析法的水生態文明概念及評價指標探討[J].中國人口·資源與環境(S1).
夏杰長,劉 奕 2017 中國服務業發展報告(2016-2017): 邁向服務業強國: 約束條件、時序選擇與實現路徑[M]. 北京: 經濟管理出版社.
楊玉玲,李宇明 2023 外向型漢語學習詞典的供需錯位和出路[J]. 辭書研究(6).
楊俞玲,張丙辰,李 尋等 2022 基于AHP-熵權法的ASD兒童干預APP導航界面設計評價[J].包裝工程(12).
雍和明 2003 英漢雙語詞典與英語單語詞典用戶語言需求與信息檢索的比較[J].辭書研究(6).
鄒 酆 2004 辭書學叢稿[M]. 武漢:崇文書局.
張 宏 2009 外向型學習詞典配例研究[D].廣東外語外貿大學碩士學位論文.
張 文,頓雪霏 2010 探討大陸游客對臺灣旅游目的地形象的感知——基于網上游記的內容分析[J]. 北京第二外國語學院學報(11).
章宜華 2010 新一代英語學習詞典的理論構想——基于二語習得理論的研究[J]. 現代外語(3).
張志毅 2012 辭書強國——辭書人任重道遠的追求[J]. 辭書研究(1).
Hartmann, R. R. K.2001 Teaching and Researching Lexicography[M]. London: Person Education Limited.
Lew, R. amp; A. Szarowska 2017 Evaluating online bilingual dictionaries: The case of popular free English-Polish dictionaries[J]. Recall 29(2).
Pearsons, E. amp;W. Nichols 2013 Toward a framework for reviewing online english dictionaries[J]. Dictionaries Journal of the Dictionary Society of North America(34).
Swanepoel, P. 2008 Towards a framework for the description and evaluation of dictionary evaluation criteria[J]. Lexikos (18).
On construction of evaluation index system for L2 learners dictionaries of Chinese
from the users perspective
CHEN Xiande, YANG Yuling
Key words: Chinese learners dictionary; user perspective; evaluation system; content analysis method; Delphi method; Analytic Hierarchy Process
Abstract: There are currently serious quality issues with L2 learners dictionary of Chinese. Although dictionary evaluation research is of great significance in improving dictionary quality, previous studies have had many problems such as a single evaluation subject, subjective evaluation methods, and imbalanced evaluation content. In order to break through the bottleneck of dictionary evaluation research and improve the quality of dictionary compilation, this study intends to construct an evaluation index system for online L2 learners dictionary of Chinese from the users perspective. The construction process is as follows: firstly, user evaluation data is collected by data crawling from sources such as user demand research literature, APP Store comment sections, and in-depth interviews to construct a user evaluation corpus. After using content analysis method to analyze the corpus, an initial evaluation index system is formed. Secondly, the Delphi method is used to optimize the indicator system. Finally, the Analytic Hierarchy Process was used to calculate the weights of the indicators and the established evaluation index system includes 3 primary indicators, 19 secondary indicators, and 56 tertiary indicators.
【責任編輯 師玉梅】
[收稿日期] 2024-01-05
[作者簡介] 陳賢德,男,北京語言大學教師教育學院,主要研究方向為詞典學,2848051775@qq.com;楊玉玲,北京語言大學教師教育學院,女,主要研究方向為漢語語法、漢語學習詞典學,yangyuling705@126.com。本文通訊作者:楊玉玲。
[基金項目] 國家社科基金一般項目“外向型漢語學習融媒詞典的研發與創新研究”(22BYY159);北京語言大學優秀博士學位論文培育計劃資助項目“外向型電子漢語學習詞典評價指標體系的構建及應用研究”(2024)