丁楠 曹瑋倬 相甍甍















摘要:[目的/意義]目前在技術問答社區知識交流方面的研究尚不完善,旨在采用數據包絡分析法研究技術問答社區知識交流效率,從而發現其不同板塊之間存在的差異和變化規律,為改進社區管理和提高知識交流效率提供參考。[方法/過程]在構建知識交流效率評價指標體系的基礎上,以“開源中國”社區15個熱門板塊為研究樣本,基于SBM模型與Malmquist指數計算其知識交流的靜態和動態效率值并進行深度分析。[結果/結論] “開源中國”社區15個熱門板塊之間的平均知識交流效率良好,但板塊間差距較大,且總體知識交流效率處于上升趨勢,主要是由于技術進步變化指數呈現19.50%的上漲幅度,說明技術振興是“開源中國”社區知識交流效率上升的主要原因,但出現一定程度管理不當現象并且資源利用率較低。
關鍵詞:技術問答社區 ? ?SBM模型 ? ?Malmquist指數 ? ?知識交流效率 ? ?開源中國
分類號:G202
引用格式:丁楠, 曹瑋倬, 相甍甍. 基于SBM-Malmquist的技術問答社區知識交流效率測度研究[J/OL]. 知識管理論壇, 2022, 7(2): 101-115[引用日期]. http://www.kmf.ac.cn/p/278/.
1 ?引言
隨著網絡技術的蓬勃發展,信息交流和傳播的方式開始多樣化,越來越多的人在論壇和博客上通過發文(帖)和回文(帖)來表達觀點、共享信息和獲取知識,人際交流突破了時空的局限。用戶提出問題后,社區吸引、發動來自各個領域的其他用戶解答問題或提出對策,從而圍繞一個主題不斷地達成共識,形成了類似于現實中社區的網絡團體——虛擬社區。近年來,虛擬社區逐漸成為人們通過互聯網交流和獲得知識的重要媒介,這使一些搜索引擎無法直接檢索到的、存儲在人腦當中的知識得以展現。專業性的網絡論壇作為一類特殊的虛擬社區,是知識交流的重要工具之一,用戶一問一答之間,便發生了信息交換和知識交流[1],例如技術問答社區是把IT技術作為論壇的主題,為技術人員提供知識交流的虛擬社區,其鼓勵相關用戶都能積極參與開放性討論并分享創作過程,逐漸成為個人或團體開展知識交流和共享的有效平臺。近年來,隨著IT技術的廣泛應用,技術問答社區的規模也逐漸擴大[2],本文主要對技術問答社區的知識交流效率進行研究,根據實際得到的數據結果,有針對性地提出優化和管理措施,從而增強用戶知識交流效果以及創新力度,助力技術問答社區的持續發展。
“開源中國”社區是目前國內最大的開源技術社區[3],自2008年創辦以來,致力于為IT開發者提供發現、使用和交流IT技術的問答平臺,本文選取“開源中國”社區中最熱門的15個標簽板塊作為用戶知識交流的數據來源。首先,在梳理和總結已有文獻成果的基礎上,為測算技術問答社區知識交流效率投入產出值構建相應的評價指標體系;其次,采用數據包絡分析方法中的SBM(Slack Based Measure)模型和Malmquist指數計算知識交流靜態和動態效率值;再次,根據測算結果,對影響技術問答社區知識交流效率的主要因素進行分析;最后,根據所得出的結論,提出合理化建議,以期為促進技術問答平臺知識交流,提高其知識創新水平提供參考意見。
2 ?相關研究
2.1 ?問答社區
目前,國內外學者對于問答社區的研究主要關注用戶信息行為、用戶問答質量以及社區間的對比等方面。關于用戶信息行為的研究主要集中于知識貢獻方面,例如,劉雨農等以知乎網“疫苗”話題為樣本,研究虛擬知識社區的社會網絡結構特征及影響因素,發現其用戶關系是多層次、塊狀分布的,存在知識生產者和需求者兩個中心,其中核心用戶比邊緣用戶更傾向于貢獻知識[4]。Z. Liu等研究發現知識貢獻行為是用戶在問答社區中獲得所需信息的前提條件,其中用戶的參與、興趣和關聯性等因素對用戶的回答意愿有重要的影響[5]。J. H. Jin等研究發現用戶的自我呈現、其他成員的認知和社會學習機會對知識貢獻行為都有正向影響[6]。關于問答質量方面的研究主要以影響因素的特征為主,例如,沈洪洲等以知乎社區為研究對象,總結了10個對回答內容質量具有潛在影響的基本特征,回答內容的標注數量越多,重點內容及結構就越清晰,回答內容質量越高,同時,用戶更易認同情感傾向積極的回答[7]。王偉等以知乎社區為研究對象,著重挖掘了答案及其編寫者的特征,并通過邏輯回歸、支持向量機和隨機森林3種方法構建特征模型,對答案質量進行全面預測[8]。關于社區間對比方面的研究主要集中在中外社區運營視角的功能建設上,例如,李丹選取Quora和知乎進行對比,著重從產品性能、運營管理和用戶特征3個層面展開分析,結果發現Quora擁有十分精準的功能定位、更簡潔的功能區劃分,相比知乎具有更多優勢和成功經驗[9]。萬莉通過測度小木蟲和人大經濟論壇8門學科的知識交流效率,發現人大經濟論壇知識交流效率和規模效率低于小木蟲論壇,純技術效率高于小木蟲論壇[10]。
通過現有研究成果可以發現,國內外學者關于問答社區的研究主要集中于信息行為中知識貢獻的研究,少數學者對問答質量的影響因素展開了研究,而對于社區間對比的研究較為匱乏且時間較為久遠,并未涉及近年來的發展狀態。其中,知識貢獻主要涵蓋了提出問題和瀏覽信息[11],而提問量與瀏覽量即可代表問答社區的活躍度[2],因此,本研究把問答社區中研究相對成熟的知識貢獻作為指標體系,把能夠反映主題使用情況的熱門精選板塊作為決策單元,以此為基礎利用數據包絡分析法對技術問答社區知識交流效率的測度展開研究,以期豐富問答社區的研究。
2.2 ?知識交流效率
目前,國內外學者尚未就問答社區知識交流效率展開研究,由龐建剛等[12]對虛擬學術社區的定義可知,問答社區可以被視為虛擬學術社區的一個子類。當前,對虛擬社區知識交流效率的研究主要集中于效率測度與影響因素兩個方面。對于效率測度方面的研究主要基于數據包絡分析法,例如,宗乾進等在2014年首次提出了知識交流效率評價指標體系,以科學網博客8個學科為例,采用數據包絡分析法(Data Envelopment Analysis,DEA)方法進行了靜態分析[13];晉升在DEA方法的基礎上進一步拓展了Malmquist指數方法對小木蟲論壇12個板塊的知識交流效率進行研究[14];楊瑞仙等以在線健康社區“丁香園論壇”為對象,剔除外生因素后基于三階段DEA模型對其中5個板塊進行了研究[15]。也有少數學者采用其他研究方法,例如,龐建剛等選取經管之家論壇的3個區域為對象,采用隨機前沿分析法(Stochastic Frontier Analysis,SFA)及Kernel方法對知識交流效率及其動態演化進行研究[12];胡德華等以4個學術虛擬社區的16個版塊為樣本,運用遺傳投影尋蹤算法進行知識交流效率的綜合評估[16]。關于影響因素的研究主要通過結合效率測度進行綜合分析,例如,吳佳玲采用Super-SBM方法及Tobit模型對小木蟲論壇的知識交流效率及影響因素進行了分析[17];袁永旭等以丁香園論壇為研究對象,運用SBM(Slack Based Measure)模型和Tobit模型進行知識交流效率和影響因素的研究[18]。
綜上,對于虛擬社區知識交流效率的研究以效率測度為主,且大多具有鮮明的學科特色,例如理工類學科的小木蟲論壇、經管類學科的經管之家論壇和醫學類的丁香園論壇等,而針對近年來活躍高的技術問答社區的研究較少。同時,在運用數據包絡分析方法進行知識交流效率測度時,普遍采用CCR(Charnes & Cooper & Rhodes)模型以及BCC(Banker & Chames & Cooper)模型,對于SBM模型結合Malmquist指數的運用較少。針對此現狀,本文基于SBM模型和Malmquist指數相結合的評價方法,對技術問答社區知識交流進行測度,并提出合理化建議。
3 ?研究設計
3.1 ?數據來源
本文選擇“開源中國”社區中最熱門的15個標簽板塊作為決策單元(Decision Making Units,DMU),其中包括“Java”“Android”和“PHP”等,于2021年1月借助“八爪魚采集器”工具,分別對2018-2020年15個板塊的數據進行相應指標體系數據的收集,并對采集到的發帖、回帖數據以及時間、投票和作者進行整理統計,以反映實際的知識交流情況。
3.2 ?研究方法
3.2.1 ?SBM模型
DEA模型于1978年被A. Charnes、W. W. Cooper和E. Rhodes提出,是一種用于評價多投入、多產出指標距離生產前沿面有效性的非參數方法[19]。傳統的DEA模型為規模報酬不變的CCR模型和規模報酬可變的BCC模型,自問世便被廣泛應用。但傳統的DEA模型屬于“徑向”和“角度”的雙度量[20],“徑向”要求投入與產出同比例變化,“角度”通常只能考慮一個投入或產出的導向角度,忽略了DMU中松弛變量引起計算結果偏差問題[21]。經過學者們多年不斷探究,在傳統模型的基礎上加入更多的限定條件,不斷衍生出超效率DEA、SBM以及EBM等模型。本文使用K. Tone[22]于2001年提出的在目標函數中引入松弛變量的SBM(Slack Based Measure)模型,與傳統模型相比,其規避了徑向和角度問題的影響,且充分考慮了投入和產出的松弛度,使所得相對效率值介于[0,1],提升了效率評價的可信度和準確度,更偏重于知識交流效率最大化的考慮[19]。故本文運用SBM模型對技術問答社區知識交流效率進行測算,能夠對技術問答社區的投入和產出松弛變量進一步優化,即將最小化的松弛變量作為目標函數,用以表明技術問答社區的知識投入冗余和產出不足越少,知識交流效率值則越高。
SBM模型如公式(1)所示:
公式(1)
其中,ρ*代表DMU的相對效率值,S1和S2為期望及非期望產出要素個數;x0、y0分別代表DMU的投入和產出向量;X、Y分別代表DMU的投入和產出矩陣。當且僅當ρ*=1時,DMU有效;當0 ≤ ρ* <1時,DMU無效。
3.2.2 ?Malmquist指數
Malmquist指數由瑞典經濟學家S. Malmquist在1953年提出,隨后R. F?re等將其與數據包絡分析法相結合,用來測算生產和經營效率等問題,使其在金融、醫療和工業等領域應用廣泛[14]。Malmquist指數是通過對比決策單元在t時期和t+1時期的距離函數比值來判定其效率變化情況和發展趨勢,彌補了傳統DEA無法測算動態效率的缺陷[23]。故本文運用Malmquist指數考量技術問答社區知識交流全要素生產率的演化趨勢,其能夠與數據包絡分析法充分結合,進而對技術問答社區知識交流的動態效率進行測算,以便更好地分析社區的變化趨勢。
Malmquist指數如公式(2)所示:
公式(2)
其中,xt和xt+1分別表示t和t+1時期研發投入量;yt和yt+1分別表示t和t+1時期研發產出量;tfpch、effch、techch、pech和sech分別代表全要素生產率、技術效率變動、技術進步、純技術效率變動和規模報酬變動指數。若tfpch>1,則表示全要素生產率有所提高,整體呈上升趨勢;tfpch=1,則全要素生產率不變,整體趨勢穩定;tfpch<1,則全要素生產率降低,整體呈退步狀態。
3.3 ?指標體系構建
技術問答社區是專門進行技術交流的問答社區,用戶通過網絡便可以實現知識共享、交流和創新。在技術問答社區中,知識提供者[24]通過發帖將隱性知識外化提供給使用者,知識使用者通過瀏覽來獲取所需信息,同時可以結合自身知識儲備使知識進一步外化,知識反饋者通過投票、評論等行為對知識提供者進行反饋,整個過程實現了知識共享、交流和創新[10]。本文基于萬莉[10]的研究成果,并結合技術問答社區知識交流的特征構建技術問答社區知識交流效率的指標體系,如表1所示:
(1)投入指標X1——用戶數量。用戶是技術問答社區開展知識交流的主體,知識的提供和傳播都依賴于這一主體。本文統計的用戶數量為實際參與到知識交流中的人員數量,即各板塊參與發帖和回帖的人員數量,不包括僅注冊或投票的人員,本文認為這兩類用戶不能視作知識交流投入。
(2)投入指標X2——發帖數量。用戶依據所探討的主題選擇相應板塊進行發帖,發帖數量充分說明用戶在這一領域知識交流精力的投入程度。
(3)投入指標X3——討論時間。即從發帖到采集時獲取到的最后回帖的時間跨度,衡量知識交流的持續時間,反映了用戶在整個知識交流過程中的時間投入情況。
(4)產出指標Y1——瀏覽數量。即各個板塊中每篇帖子截止到統計時間的瀏覽數量,直觀反映出用戶對帖子主題的關注程度,帖子的瀏覽數量越大,信息傳播范圍越廣泛。
(5)產出指標Y2——回復數量。即用戶對感興趣的帖子進行相關內容的回復數量,其中一個用戶針對不同帖子進行回復按帖子數量計數,針對同一帖子多次回復按1次計數。帖子的持續回復是將主題進一步內化和吸收的過程,直觀反映了話題熱度,回帖數量越多說明知識交流的程度越高,傳播的影響力越大。
(6)產出指標Y3——投票數量。即用戶針對答案的準確與否投贊成票和反對票,每人每帖限投一票,票數的高低與帖子的優劣程度息息相關,有助于用戶快速甄別更優質的帖子,是技術問答社區知識交流效率評價的核心指標。
4 ?結果分析與討論
4.1 ?描述性統計分析
本文通過對“開源中國”社區15個熱門標簽板塊的數據依指標體系進行整理與統計,結果如表2所示:
如表2所示,不同板塊間指標差異較大,總的來說,投入指標數量越多其產出指標數量也相應越多,如Java板塊3個投入指標數量均為最高,其3個產出指標數量也最高;用戶數量與發帖數量基本呈正比關系,如Java板塊用戶與發帖量均為最高,而用戶量較少的jQuery和Ubuntu板塊發帖量也較少;發帖量越多其討論時間也越長,如Java板塊發帖量的均值高達23 846.33篇,而Ubuntu板塊僅為389.33篇。
4.2 ?基于SBM模型分析知識交流靜態效率
本文基于MaxDEA PRO 6.3件中的SBM無導向模型對“開源中國”社區15個熱門板塊的投入和產出數據進行測算,分別得到綜合技術效率、純技術效率和規模效率。綜合技術效率是衡量現有投入資源是否達到最優產出狀態[25],測量技術問答社區中知識交流的整體管理水平;純技術效率是指投入規模一致時各板塊最佳的投入產出效果,由此評估技術問答社區在技術和管理等方面的客觀狀況;規模效率為綜合技術效率與純技術效率之比[26],是指技術因素保持不變時投入指標的增長所導致的效率變化,反映了技術問答社區的資源配置狀況。
根據表3所示,“開源中國”社區15個熱門板塊的平均綜合技術效率指數介于[0.652,1],平均值為0.841,處于良好水平。2018-2020年間,每年分別有6個、9個、7個板塊知識交流效率達到DEA有效(綜合效率指數為1),而各板塊知識交流綜合技術效率變化趨勢各異,本文將其劃分為以下4個類型:①成熟型,包括Java、JFinal和Apache Echarts板塊。這3個板塊每年均達到DEA有效,說明這些板塊整體管理水平達最優狀態,投入與產出要素的組合與規模合理,目前正處在生產前沿面上,知識交流效率達到理想效果。②成長型,包括PHP、Linux和CentOS板塊。2018年這3個板塊綜合技術效率值均較低,但隨著時間的變化不斷發展,均逐步達到DEA有效狀態。③波動型,包括Android、MySQL、Spring、Eclipse、jQuery、Apache Tomcat和Android SDK板塊。這7個板塊的綜合技術效率發展趨勢不穩定,均呈現出起伏狀態,其中MySQL和Apache Tomcat板塊在2019年出現最低值,表現為開口向上的具有凹折點的折線,其余5個板塊在2019年均出現最高值,表現為開口向下的具有凸折點的折線,且Spring、jQuery和Android SDK 3個板塊在2019年達DEA有效狀態。 ? ?④衰退型,包括Python和Ubuntu板塊。這兩個板塊均在2018年達DEA有效狀態,且Ubuntu板塊在2019年也達DEA有效狀態,但2020年二者均出現大幅下降趨勢,說明其要積極尋找原因并借鑒成熟型板塊的管理制度與發展模式,對投入產出要素的資源配置進行優化。
除此之外,從各板塊知識交流綜合技術效率三年均值來看,無效單元占比高達80.00%,即大部分板塊未達到理想狀態,頂尖水平與下游水平板塊數量相差較大,說明各板塊知識交流的差距較大。其中,Android板塊和Eclipse板塊三年來效率值均未達到有效,Eclipse板塊效率值最低,僅為0.652,說明這兩個板塊在投入、產出以及管理上均存在較大問題,是未來關注的重點對象。
由圖1可知,在2018年各板塊效率均值為0.829,存在9個板塊效率值高于均值;2019年各板塊效率均值達0.927,相較于2018年出現顯著提升,存在11個板塊效率值高于均值;2020年各板塊效率均值達0.767,出現大幅度下降趨勢,存在8個板塊效率值高于均值。15個板塊知識交流效率均值呈現一定的波動變化,且在2020年最為明顯,Eclipse板塊出現0.423的極低值,說明2020年由于疫情等重大事件造成社區內各板塊的知識交流效率差異較大。
根據表4可知,導致單元無效的原因可以分為3類:①板塊的純技術效率有效而規模效率無效,如2018年PHP、Spring、Linux和Apache Tomcat板塊,2019年Python板塊以及2020年MySQL、jQuery和Ubuntu板塊的純技術效率均達1,而規模效率無效且范圍處于[0.427,0.966],板塊間無效值差距較大,說明此類板塊現有的技術與管理水平相對完善,在規模保持不變的前提下,充分利用了技術投入來保證知識交流效率的有效,但存在由于規模結構不合理產生的投入冗余現象,導致資源無法充分利用,且板塊間實際規模與理想規模間存在不同程度的差距,只有對規模結構進行合理改善,才能有效提升綜合技術效率,從而達到DEA有效狀態;②板塊規模效率有效而純技術效率無效,目前只有Android板塊在2019年規模效率達1,而純技術效率無效,說明其規模結構較為合理,資源配置能力較高,對于投入要素的利用較充分且產出效率較高,但當前的技術和管理水平較差,是制約綜合技術效率達有效的關鍵所在,該板塊需要強化內部管理,引入較為先進的技術和設備,建立一定的技術壁壘,從而提高純技術效率;③板塊的純技術效率和規模效率均無效,在2018-2020年間每年的板塊數分別占比55.56%、66.67%和62.50%,說明此類板塊資源配置與技術管理同時出現問題,二者均需加強。在第三類板塊中,只有2018年jQuery板塊出現純技術效率較高,而規模效率較低情況,其余板塊均為純技術效率較低,規模效率較高,且規模效率范圍處于[0.827,0.986],無效值較為集中且與有效值差距較小,說明其規模效率方面易改進,可以完善投入產出的合理配置,進行社區的精耕細作,從而實現知識交流綜合技術效率有效。而純技術效率方面的改進空間較大,社區內制度和技術管理水平均需要加強,同時應采取積極措施增加用戶數量及發帖數量的投入,減少不必要產出,并提升發帖質量,促進投入要素的有效利用,以不斷提升純技術效率。值得一提的是,Android和Eclipse板塊三年來從未達到過有效水平。
可以發現,“開源中國”社區DEA無效板塊普遍存在規模效率較低的問題,這說明在知識交流過程中,忽視了規模的擴大,在今后的發展中應多加關注知識投入和產出的合理配置。此外,雖多個板塊出現純技術效率有效情況,但相較于規模效率值所處范圍,社區內板塊的技術管理水平較高,但兩極化現象依舊嚴峻,制約著綜合技術效率的提升,未來應不斷加強技術管理水平和制度的約束,建立起能夠激發用戶參與的互惠政策,促使投入資源得到合理利用,提高知識交流的質量。
4.3 ?基于Malmquist指數分析知識交流動態效率
上文基于SBM模型對“開源中國”社區知識交流效率的分析是時間點上的靜態分析,為了進一步探究知識交流效率變動的內在因素和趨勢,本文根據“開源中國”社區15個熱門板塊在2018-2020年間的投入與產出數據,采用MaxDEA8軟件測算出其全要素生產率指數(tfpch)、技術效率變化指數(effch)和技術進步變化指數(techch)[27],其中effch衡量DMU相對于生產前沿面的接近程度,用來反映社區內各板塊對現有資源的有效利用能力,可由純技術效率(pech)和規模效率(sech)決定[28],techch代表各個時期最佳效率值的變化規律,用來衡量社區內各板塊的技術創新是否隨生產前沿變化,上述指標可以直觀反映出各板塊知識交流動態效率的客觀情況。
表5為“開源中國”社區2018-2020年各生產率指數變動情況。從全要素生產率來看,整個階段均值為1.156,年平均增長率為15.60%,且每個周期指數均大于1,說明知識交流效率處于上升趨勢;從技術效率來看,整個階段均值為0.967,說明其總體技術效率變化呈現下降趨勢,主要由于2019-2020年下降了25.90%;從技術進步來看,整個階段均值為1.195,上升了19.50%,說明總體技術進步變化指數呈現上漲趨勢,主要得益于2019-2020年上漲了41.40%,這表明技術振興是“開源中國”社區知識交流效率上升的主要原因;從純技術效率和規模效率來看,均處于下降趨勢,平均降幅為1.30%和2.00%,二者在一定程度上限制了技術效率的改善,這與表3中所得結果相符。
綜合前面分析發現,“開源中國”社區知識交流效率良好且2018-2020年間全要素生產率處于上升趨勢,為探索其深層次原因,下文分別對15個熱門板塊的全時段和分時段Malmquist指數進行分析。
表6為“開源中國”社區15個熱門板塊全時段Malmquist指數情況,約66.67%板塊的全要素生產率呈現增長態勢,15個板塊平均增幅為15.60%,其中技術效率變化指數平均降幅3.30%,但技術進步變化指數平均增幅19.50%,從而拉高了全要素生產率。從圖2可以明顯看出“開源中國”社區全要素生產率增長的動力來源是技術進步,這也得益于近年來我國IT技術產業技術水平的顯著提升。15個板塊中表現突出的是JFinal板塊,全要素生效率增幅高達107.8%,高增長態勢主要歸因于技術進步增幅高達107.8%。技術效率呈現下降趨勢,即使是呈現全要素生產效率上升狀態的板塊中也有約33.33%出現了技術效率下降的情況,說明技術產業各種資源的協調不夠優化,現有的技術潛能也沒有得到最大程度的釋放,管理水平有待進一步提高。全要素生產率呈下降趨勢的33.3%板塊中,Java和Apache Echarts主要是技術進步出現下降,Python和Eclipse為技術效率退步,而Spring技術進步和技術效率均呈現降態。由圖3可以發現,雖然純技術效率和規模效率對技術效率存在絕對影響作用,但絕大多數技術效率呈現下降的板塊,其規模效率也同時呈現下降趨勢,而純技術效率卻沒有呈現類似的變化情況,說明應加大對于現有資源結構和規模的整合,提高創新水平,將具有創新性的投入應用于研發關鍵技術和核心信息,提高資源配置狀況,從而推動其各板塊技術效率進步。
表7為“開源中國”社區分時段各板塊Malmquist指數動態變動情況,2018-2019年間,53.33%的板塊全要素生產率呈現增長態勢,其中半數以上漲幅超過50%,15個板塊平均漲幅11.20%,并且觀察到其技術效率與技術進步均呈同步增漲態勢,說明此階段管理得當,技術水平發展良好,15個板塊中以Android板塊最為突出,全要素生產率高達2.887。2019-2020年間,53.33%的板塊全要素生產率的增長態勢,但技術效率呈下降趨勢,技術進步呈上升趨勢,均變化明顯,技術效率的退步是由于純技術效率和規模效率分別出現6.90%和9.20%的退步所致,說明雖然在此期間技術發展水平持續升高,但受制于資源利用率水平較低,導致發展不平衡,出現了一定程度管理不當現象。圖4和圖5為各指數2019-2020年與2018-2019年兩個時段的差值,也佐證了第二時段綜合發展情況突出,但技術效率發展限制了“開源中國”社區的整體發展水平。
5 ?結論與建議
本文在已有研究的基礎上,基于SBM-Malmquist對技術問答社區知識交流效率進行測度評價,結果表明:2018-2020年間“開源中國”社區15個熱門板塊平均知識交流效率良好,但板塊間的差距較大,每年僅有3個板塊達到DEA有效,并且板塊知識交流效率均值呈現“先上升后下降”的波動變化,以2020年最為明顯,說明如疫情等重大事件可能會造成社區知識交流出現明顯下降;無效單元中僅存在Android板塊在2019年規模效率有效,說明板塊資源配置水平參差不齊,投入資源并未得到優化配置,投入冗余而導致資源得不到充分利用;全要素生產率處于上升趨勢,平均漲幅15.60%,技術效率變化呈現下降趨勢,技術進步變化指數呈現19.50%的上漲幅度,且2019-2020年間上漲了41.40%,充分說明技術振興是“開源中國”社區知識交流效率上升的主要原因,但存在管理不夠完善及資源利用率不夠高的問題仍亟待解決。
基于上述研究結果,本文從運營管理角度出發,為提高技術問答社區知識交流效率提出以下建議:
第一,整合技術問答社區資源管理。社區管理者應根據自身定位,積極對標國外先進技術問答社區,結合自身實際情況吸納有效改進措施。同時,合理定位用戶群體,針對Java、JFinal和Apache Echarts等每年均達到DEA有效的板塊設置相應的門檻,保證用戶質量與數量的同時打造出其特有的文化氛圍。另外,技術問答社區的有序運行不僅依賴于用戶的發帖、投票和瀏覽,社區管理者應主動引導,例如定期發起時效性強的熱點內容吸引用戶參與并討論,同時規避由于技術問答社區的不斷發展而引發的信息激增現象,這會導致內容重復、低相關性和低質量的信息大量堆積,從而影響用戶體驗效果。
第二,優化技術問答社區資源配置。可以采用集約式管理,針對資源配置水平較低的板塊從量的提升逐步過渡到質的把控,有針對性地根據內容對帖子進行篩選,例如管理員可通過選取精華帖子并邀請具有較高活躍度和榮譽值的用戶進行回帖,同時為回帖和發帖質量等級相對較高的用戶提供一定的激勵,如社區虛擬金幣等。同時,優化投票機制,同一回帖者下的再回帖者和發帖者均設置投票功能,并對得票數量高的用戶給予一定的物質和精神獎勵,從而不斷調整社區的內部激勵機制。除此之外,社區可以在主頁或功能欄為新用戶設置實操性較強案例的教程,提高用戶信息素養,提升用戶黏性,從而優化技術問答社區單位投入的所得產出量。
第三,推動技術問答社區技術創新。可以設置同類問題的推送功能,例如根據用戶的發帖、瀏覽與回帖等情況鎖定用戶所感興趣問題的搜索進程和軌跡,通過對用戶深度挖掘并聚類構建用戶畫像,可以更精準地進行同類問題的推送并及時推薦可參考的相關評論,同時設置內部監管,屏蔽不良信息,使用戶盡可能多地獲得有用信息。另外,人工智能技術的進步可以促進技術問答社區人機對話模式的形成,匹配數據庫將同類問題的答案自動回復給用戶,并可以根據用戶所提關鍵詞引導用戶進入相關領域或展現類似知識圖譜的推薦功能,激發用戶進一步思考并提升知識交流效率。
本文所選取的研究對象和方法具有一定的創新性,但也存在著一定的不足和局限,在指標體系的構建中,根據技術問答社區自身特征加入了“帖子投票數量”這一新指標,但只從微觀層面對知識交流效率進行了測度,對于宏觀層面上影響知識交流效率的因素有待進一步研究,因此在未來持續跟進研究中,可將數據包絡分析法與其他方法相結合,在測度知識交流效率的同時,進一步分析知識交流效率的影響因素,從而對技術問答社區提出更深層次改善建議。
參考文獻:
[1] 彭紅彬, 王軍.虛擬社區中知識交流的特點分析——基于CSDN技術論壇的實證研究[J]. 現代圖書情報技術, 2009(4): 44-49.
[2] 李勝利, 鐘瀅.中外技術問答社區的實證對比研究與啟示——以CSDN和Stack Overflow為例[J]. 情報學報, 2020, 39(9): 989-1000.
[3] 蔣競, 呂江楓, 張莉.中文軟件問答社區主題分析研究[J]. 軟件學報, 2020, 31(4): 1143-1161.
[4] 劉雨農, 劉敏榕.虛擬知識社區的社會網絡結構及影響因素——以知乎網為例[J]. 圖書情報工作, 2018, 62(4): 89-96.
[5] LIU Z, JANSEN B J. Questioner or question: predicting the response rate in social question and answering on Sina Weibo[J]. Information processing & management, 2018, 54(2): 159-174.
[6] JIN J H, LI Y J, ZHONG X J, et al. Why users contribute knowledge to online communities: an empirical study of an online social Q&A community[J]. Information & management, 2015, 52(7): 840-849.
[7] 沈洪洲, 史俊鵬, 馬巧慧.社會化問答社區回答內容質量影響特征研究——以“知乎”為例[J]. 情報雜志, 2020, 39(10): 169-175, 202.
[8] 王偉, 冀宇強, 王洪偉, 等.中文問答社區答案質量的評價研究:以知乎為例[J]. 圖書情報工作, 2017, 61(22): 36-44.
[9] 李丹.中美網絡問答社區的對比研究——以Quora和知乎為例[J]. 青年記者, 2014(26): 19-20.
[10] 萬莉.學術虛擬社區知識交流效率測度研究[J]. 情報雜志, 2015, 34(9): 170-173.
[11] 閆安, 李添秀.虛擬社區中知識獲取方式對獲取結果的影響研究——以知乎社區為例[J]. 圖書館理論與實踐, 2020(1): 65-71, 87.
[12] 龐建剛, 吳佳玲.基于SFA方法的虛擬學術社區知識交流效率研究[J]. 情報科學, 2018, 36(5): 104-109.
[13] 宗乾進, 呂鑫, 袁勤儉, 等.學術博客的知識交流效果評價研究[J]. 情報科學, 2014, 32(12): 72-76.
[14] 晉升.基于DEA方法的學術虛擬社區知識交流效率研究[D]. 鄭州:鄭州大學, 2019.
[15] 楊瑞仙, 黃書瑞, 王元鋒.基于三階段DEA模型的在線健康社區知識交流效率評價研究[J]. 情報理論與實踐, 2020, 43(10): 122-129.
[16] 胡德華, 張又月, 羅愛靜.基于遺傳投影尋蹤算法的學術虛擬社區知識交流效率研究[J]. 圖書館論壇, 2019, 39(4): 67-73, 83.
[17] 吳佳玲.虛擬學術社區知識交流效率研究[D]. 綿陽:西南科技大學, 2019.
[18] 袁永旭, 張亞飛, 馬瑞敏, 等.基于SBM-Tobit模型的在線健康社區知識交流效率研究[J]. 情報科學, 2021, 39(5): 106-114.
[19] 魏權齡.數據包絡分析[M]. 北京:科學出版社, 2004.
[20] 陳曉紅, 易國棟, 劉翔.基于三階段SBM-DEA模型的中國區域碳排放效率研究[J]. 運籌與管理, 2017, 26(3): 115-122.
[21] 萬莉, 程慧平.管理科學部重要期刊知識交流效率評價——基于Super-SBM與SFA模型的實證研究[J]. 現代情報, 2017, 37(11): 69-73.
[22] TONE K. A slacks-based measure of efficiency in data envelopment analysis[J]. European journal of operational research, 2001, 130(3): 498-509.
[23] 孫紅蕾, 馬巖, 鄭建明.城市信息基礎設施效率測評研究[J]. 圖書館論壇, 2017, 37(5): 1-9.
[24] 楊瑞仙, 張廣軼.學術虛擬社區知識交流過程與機理研究[J]. 現代情報, 2020, 40(10): 52-61.
[25] 王俊俊.基于SBM-Malmquist的廣西旅游生態效率研究[D]. 桂林:桂林理工大學, 2020.
[26] 方葉林.中國省域旅游業效率及演化機理研究[D]. 南京:南京師范大學, 2014.
[27] 洪圖, 李飚.我國農業類上市公司研發效率測度與劃分——基于SBM-Malmquist模型和企業生命周期的實證分析[J]. 經濟問題探索, 2020(9): 65-77.
[28] 陳明紅, 謝曉惠.網絡信息資源生態化配置效率評價研究[J]. 情報理論與實踐, 2020, 43(10): 81-87.
作者貢獻說明:
丁 ?楠:設計和改進研究方案,修改論文;
曹瑋倬:提出研究選題,搜集與分析數據,撰寫與修改論文;
相甍甍:參與研究方案、研究思路設計。
Research on Knowledge Exchange Efficiency Measurement of Technical Question-Answering Community Based on SBM-Malmquist
Ding Nan ?Cao Weizhuo ?Xiang Mengmeng
School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun ?130117
Abstract: [Purpose/Significance] The current research on knowledge exchange in technical Q&A communities is not perfect. This article uses data envelopment analysis method to study the efficiency of knowledge exchange in technical Q&A communities, and finds the differences and changing laws between different sectors to provide references for improving community management and improving the efficiency of knowledge exchange. [Method/Process] Based on the construction of the knowledge exchange efficiency evaluation index system, 15 popular sections of the “OSCHINA” community were used as the research samples, and the static and dynamic efficiency values of the knowledge exchange are calculated and analyzed deeply based on the SBM model and the Malmquist index. [Result/Conclusion] The average knowledge exchange efficiency among the 15 popular sections of the “OSCHINA” community is good, but the gap between the sections is large, and the overall knowledge exchange efficiency is on the rise trend, mainly because the technological progress change index increases 19.50%. The increasing rate indicates that technological revitalization is the main reason for the increase in the efficiency of knowledge exchange in the “OSCHINA” community, but a certain degree of mismanagement has occurred and the utilization of resources is low.
Keywords: technical question-answering community ? ?SBM model ? ?Malmquist index ? ? knowledge exchange efficiency ? ?OSCHINA
作者簡介:丁楠,講師,博士,碩士生導師;曹瑋倬,碩士研究生,通信作者,E-mail: cancer_0001@163.com;相甍甍,講師,博士,碩士生導師。
收稿日期:2021-10-22 ? ? ? ?發表日期:2022-03-10 ? ? ? ?本文責任編輯:劉遠穎