石燕青 陳思 康樂樂









DOI.10.3969/j.issn.1008-0821.2021.12.006
[中圖分類號]G252.6 [文獻標識碼]A [文章編號]1008-0821(2021)12-0060-09
在全球社會化進程不斷加快的過程中,互聯網也迅速走向社交化,在線交流已經成為一種重要的人際交往模式。作為Web2.0的典型應用,在線問答平臺應用戶需求而出現,逐漸成為用戶溝通、交流、傳播、共享知識的重要渠道,并演變為一種具有超強影響力和傳播力的社會化媒體。隨著用戶參與程度不斷深化,在線問答已經從簡單的提供答案轉變為一種社交屬性驅動的知識創造過程。在許多成熟的在線問答社區中,大部分用戶都具有很強的專業知識。因此,此類平臺上的信息除了能夠滿足用戶的信息需求之外,對于平臺以外更廣泛的用戶群體也往往具有比較持久的價值和影響力。因此,對在線問答社區的內容質量進行研究具有重要意義。
目前,針對在線問答社區內容質量的研究主要包括用戶提供回答的意愿影響因素、回答內容質量的影響因素、對回答內容質量的評價等。其中,對于答案內容質量和有用性的研究角度較為全面,包括從答案特征和回答者特征角度,如回答及時性、答案的文本長度、用戶的信譽度、回答中是否包含社交元素等方面研究影響回答內容質量的影響因素;以及使用多種模型從內容的情感傾向、用戶個人特征、內容發布時間、內容類型等多個角度進行內容質量評價。如Kim S等從用戶角度,總結出情感認同、內容和有效性為用戶對最佳回答的主要評價和選擇標準;Jeno J等從點擊次數、回答長度、回答者活躍等級等非文本特征來評估回答質量;李明等從多維度構建了知識可信度影響因素評估模型。用戶回答問題意愿的影響因素包括:通過問題答案獲得的成就感和聲譽的提高,以及互惠關系、社會關系和社區關系、用戶體驗、用戶自我效能等。此外,問題受到關注的程度和被回答的可能性,還會受到提問者和回答者之間的關系影響,如二者之間的熟悉程度、物理距離、社會相似性等。
可以看出,一方面,已有的研究大多基于答案相關特征來分析內容質量,而鮮少針對問題的特征和質量進行研究。目前,多數在線問答社區的內容會通過搜索引擎進行排名,因此,許多平臺將用戶投票和聲譽機制作為其系統設計的核心,以激勵用戶積極參與并生產高質量的信息。然而,在系統中仍然有很大一部分問題沒有得到解答,即“問題饑餓現象”。優質的問題更容易獲得高質量的回答,從而提高社區的服務質量。因此,關注問題的質量,以吸引更多用戶對問題的關注,對于提高問答社區的信息價值是至關重要的。另一方面,現有研究視角多集中在用戶方面,而在一個在線問答社區中,知識交流的驅動因素不僅僅是知識尋求者和知識提供者之間的關系,問題本身的特征、問題所處的環境、知識網絡的發展等也是重要的影響因素。因此,比起研究平臺上的答案是否能夠滿足用戶的即時信息需求,識別出有價值的內容,分析其對于具有相似信息需求的用戶是否具有潛在的長期價值,似乎具有更加廣泛的意義。
為了更好地考察什么樣的問題更容易受到用戶青睞,本文以專業知識在線問答社——Stack O-verFlow作為研究對象,將研究視角從“知識尋求者一問題一知識提供者”關系轉向內容中包含的知識,考察問題中包含的知識特征與問題質量的關系。Stack Overflow向用戶提供信息資源的同時,也提供相應的標簽供用戶進行資源標記和分類。標簽在對資源進行有效組織的基礎上,也為進一步考察系統的整體發展情況提供了外顯化的信息載體。因此,本文以標簽作為知識的顯性化表示來開展量化研究。
1研究假設
已有研究表明,在線知識問答社區中,發布的問題數量會影響潛在知識提供者對問題的關注程度。問題數量的增加會提高同類問題集合的重要性,因此這類問題更有可能得到解決。當一個問題中包含的標簽使用頻次越高,表明社區內同類問題越多。同時,也說明該知識在論壇內的大眾化程度越高,此類知識大多是基礎性知識或近期關注度高的內容,這類問題的解決會為論壇中大多數用戶提供參考,貢獻價值總量較大,因此這類問題更容易獲得較高的用戶評價。但是,隨著問題受關注程度增加,進行評價的用戶也會增加,該問題的綜合評價達到一定程度時,可能會出現下降的趨勢。因此,提出以下假設:
假設1:隨著標簽使用頻次增加,問題得到的評價呈現先升后降的趨勢。
在開放性的在線知識社區中,用戶通過在線問答論壇發布內容、獲取信息,本質是一種知識交換行為。社會交換理論解釋了資源交換過程中的個體行為。具體地說,社會交換理論研究了個人為了從與其他人的接觸中獲得某些東西而相互交換資源的行為。公共產品理論認為,如果消費者能夠從公共產品中獲得更多利益時,他們會傾向于做出更多貢獻。當問題中包含的標簽之間相關性較高時,說明該問題的知識點比較集中。如果用戶擁有與之匹配的知識,用戶對于問題的理解和吸收能力會更強,付出的時間成本更低,提供的答案質量也會更高。因此,具備相應知識的用戶會更傾向于回答這類問題,問題本身也更容易得到好評。故提出以下假設:
假設2:標簽問的關聯程度對于問題受到的評價具有正向影響作用。
認知心理學領域的學者對選擇性注意理論的研究表明,除了問題所在的環境,如果一個問題具有較突出的特征,那么這個問題更有可能引起注意。當一個問題中的標簽來自不同的知識類群時,表明該問題涉及的知識多樣化程度更高,這類問題往往具有較高的創新性或挑戰性。Karim R L等對于開源軟件的研究表明,用戶解決這類問題時往往具有更強的內在激勵作用和外在獎勵作用。回答這樣的問題對于回答者的聲譽也會有更大的提高,故用戶往往對這類問題具有較高的評價。因此,提出以下假設:
假設3:標簽的多樣化程度對于問題受到的評價具有正向影響作用。
組織學領域的學者認為,問題所處的環境對于問題的受關注程度至關重要。當問題中的標簽在整個標簽關聯網絡中處于重要位置時,相關知識的流通程度越高,該問題的受關注程度也會更高,因此隨著用戶評價越來越多,該問題的綜合分數也可能會呈現出先升后降的趨勢。因此,提出以下假設:
假設4:隨著標簽網絡重要程度增加,問題得到的評價呈先升后降趨勢。
2數據來源與處理
為了驗證上文提出的理論假設,本文收集了Stack Overflow從2008—2017年的數據,其中包括6833276名用戶發布的42 134 619條問題和回答,以及48373個標簽。根據標簽使用的頻次設計不同的閾值,來觀察標簽的比例和累計出現頻率情況,結果如表1所示。
從表1可以看出,在48373個標簽中,有135個(0.28%)標簽的使用頻次超過了35000次,即至少有35 000個問題中包含了這些標簽,這些標簽的累計使用頻次之和為19853664,超過了所有標簽累計使用頻次之和的50%:而使用次數超過8855次的標簽有566個,占標簽總量的1.17%,這些標簽出現的頻次之和接近所有標簽使用次數之和的70%:使用次數超過811次的標簽有4138個(8.55%),這些標簽的使用次數累計之和超過了所有標簽出現之和的90%:在第4組中,9033個標簽的使用次數超過了246次,這9033個標簽的使用次數之和占比超過了所有標簽使用次數的95%:在最后一組中,標簽的使用次數累計之和占到了系統中所有標簽次數之和的99.73%。從第1組到第2組,每增加1%的標簽數量,會導致標簽累計次數增加20.56%;類似地,從第2組到第3組、第3組到第4組、第4組到第5組,標簽數量每增加1%,相應的標簽累計使用次數之和分別增加2.9%、0.52%、0.09%。從標簽數量占比和標簽使用次數占比來看,除去第3組標簽,系統中剩余標簽的總使用次數占比不到10%,第3組的標簽基本能夠滿足“用最少的標簽數量最多程度地代表所有標簽”的條件。因此,為了最大限度地減小計算復雜度,選擇第3組,即得到的4138個標簽作為本文的研究數據。
本文關注的研究問題是:問題標簽的特征是否會影響一個特定問題得到的評價。因此,將一個特定問題以及標記該問題的標簽作為一個研究單元,在此研究單元內分別以問題的屬性和標簽的屬性作為研究變量。通過表1中的4 138個標簽來篩選相應的問題,將不包含這4138個標簽的問題過濾掉。通過對數據進行清洗,包括刪除無效問題、刪除有空值的問題、刪除變量不完整的問題等操作,最終得到了超過2510445組“問題—標簽”對,作為本文的研究數據。
3相關變量測度
3.1問題價值變量
為了研究標簽的特性是否會對問題的價值產生影響,本研究從問題質量方面對問題的價值進行了量化。在社會化問答社區Stack Overflow中,用戶能夠對每一個問題打分,問題的分數代表該問題受到其他用戶的評價,能夠反映該問題的質量。問題的得分較高,表明該問題具有價值,有更多的用戶希望或已經從該問題中獲取知識,因此用問題的得分來表示問題的質量。
問題得分的初始值為0,問題每得到一張贊成票,分數增加1,每得到一個反對票,分數減少1。該因變量可能是正整數,也可能是負整數。
3.2知識特征變量
標簽是該問題包含和涉及的知識點的濃縮和外化表達。本文研究的影響因素主要是標簽特征,分別從以下幾個方面對于標簽的特征進行測度:
3.2.1標簽的大眾化程度
標簽在論壇中出現的頻次,即有多少個問題使用了此標簽,表明了標簽的大眾化程度。一個問題中包含多個標簽,本文以一個問題及該問題包含的標簽作為一個單元,取該問題下所有標簽使用頻次的均值,作為該問題中標簽的使用頻次。
3.2.2標簽的關聯程度
一個問題中包含多個標簽,這些標簽之間的關聯性能夠反映出問題所涉及的知識之間的關聯性。為了測量該指標,使用逐點互信息法(PMI,Point-wise Mutual Information)來衡量標簽之間的相關性。逐點互信息指標的基本原理是計算標簽之間共同出現的概率,相比于關注標簽共同出現的次數,關注共現概率能夠避免由于標簽本身出現頻率差異而造成的誤差。逐點互信息的計算公式為:
3.2.3標簽的多樣化程度
當標記一個問題的標簽之間距離較遠或標簽來自不同的類群時,對于回答者來說,回答這類問題需要更加豐富的知識儲備。為了驗證假設3,通過測度標簽的多樣化程度來反映問題所包含的知識多樣化程度。
首先,使用K-means聚類算法對4 138個目標標簽進行分類。在此基礎上,使用Stirling A提出的多樣化分析框架,將多樣化程度看作系統中元素的一種分配方式,多樣化概念包含3種基本特性:多樣性、均衡性、差異性,每一種特性都是系統多樣化程度的必要但不充分條件,系統的多樣化程度由這3種基本特性共同決定。3種基本特性的內涵如下:
1)多樣性。指系統中元素所在的類群數量,即系統中有多少種元素,例如,在生態學中用物種數量來表示,在經濟學中用產品類別數量表示。在其他條件相同的情況下,多樣性指標越大,系統的多樣化程度越大。
2)均衡性。指系統中的所有元素在各個類群中分布的均衡程度,即每個類群中分別包含了多少個系統元素,系統元素在每個類群中的占比可以用一組正分數來表示,這些正分數的和等于1。在其他條件都相同的情況下,系統元素在各個類群中的分布越均勻,系統的多樣化程度越大。
3)差異性。指元素間被區分的程度,是對元素問差異的測度指標。該指標對于系統多樣化程度的測度非常重要,因為元素間的差異化程度決定了系統中元素的分類,因此會直接影響多樣化指標和均衡性指標。在生物學和經濟學中,該指標通常基于某種形式的距離測量來表示。在其他條件都相同的情況下,元素間的差異化程度越大,系統的多樣化程度也越大。
在綜合考慮3種特性的基礎上,系統的多樣化程度D的測度公式為:
其中d表示系統中元素i和元素j的差異化程度,即差異性。在本研究中將標簽作為系統元素,通過計算元素間的距離來表示元素間的差異。p和p分別是元素i和元素j在系統中所占的比例,即均衡性。對(N-N)/2對元素(i,j)構成的矩陣求和,反映出了多樣性。
3.2.4標簽的網絡重要程度
知識在網絡中的重要性對于其傳播能力有很大的影響。為了驗證假設4,用標簽的網絡中心性表示該知識的網絡重要性。常用的網絡中心性測度指標有3類:度中心性,表示與該節點直接相連的節點個數:中間中心性,表示網絡中的一個節點控制其他節點交互的能力:接近中心性,表示網絡中一個節點與其他節點的接近程度。
本研究中,知識傳播的路徑是通過用戶節點而非標簽節點,因此,知識的傳播不涉及標簽問的接近關系和控制關系,故計算標簽的度中心性,即與該標簽直接相連的標簽數量,來表示標簽在網絡中的重要性。在指標計算時,通過計算一個問題下所有標簽的度中心性均值,作為該問題的標簽網絡重要性指標。
3.3控制變量
在知識傳播的過程中,知識傳播的效果除了受到知識本身特性的影響之外,也會受到用戶的影響。例如,在知識共享系統中,如果一個問題由一個系統聲譽較高的用戶提出,那么該問題可能更容易受到其他用戶關注,并獲得好評。此外,提出時間更久的問題,暴露在社區中的時間更長,也會受到更多的關注。為了控制這些因素的影響,本文設置了以下指標:
3.3.1用戶聲譽
作為一個高效的專業在線問答網站,Stack O-verflow通過聲譽管理機制,根據用戶在網站上發布內容的綜合價值,給予用戶聲譽值作為獎懲,旨在鼓勵用戶普遍參與到社區活動中,并激勵用戶產生高質量的內容。表2展示了用戶聲譽的管理機制。
3.3.2用戶被瀏覽次數
該指標表示用戶在網站上發布的內容(包括提問和回答)被查看和訪問的次數,一方面,與用戶所發布內容的熱門程度相關:另一方面,也能反映出該用戶在網絡中的地位。
3.3.3問題創建時間
相比于發布時間短的問題,較早發布的問題會得到更多的回應,這會增加問題的累計得分和答案數量。因此,選擇2018年1月1日作為統一的時間節點,以秒為單位計算問題發布時間與該時間節點的時間差,作為控制變量。
4研究結果及分析
在進行數據分析前,由于用戶聲譽和用戶的被瀏覽次數的離散程度過大,為了減小模型擬合時的誤差,對這兩個指標取對數。模型中變量的相關系數矩陣如表3所示。可以看出,自變量問的相關系數都比較小。此外,對模型進行方差膨脹因子檢驗,結果顯示方差膨脹因子的平均值為1.368,說明變量間不存在多重共線性。
由于本研究的因變量是計數數據,因此計數模型進行回歸分析。在計數模型中,泊松模型是使用范圍最廣的一種模型,該模型的假設條件是樣本的均值約等于方差,基于此假設,對問題的得分進行了K-S假設檢驗,檢驗結果中顯著性系數均小于0.05,拒絕原假設,可知該變量不符合泊松分布。從其分布情況可以看出,問題得分是過度離散的,因此選擇負二項式回歸模型較為合適。負二項式模型可以被認為是泊松模型的泛化,它具有與泊松回歸模型相同的均值結果,且其具有額外的參數來對過度離散的數據進行建模,可以校正來自泊松模型的標準誤差偏移。
表4展示了4個標簽特征對問題得分的影響作用結果。模型1是只包含控制變量的基準模型,回歸結果顯示,3個控制變量的回歸系數均顯著,說明這3個變量對問題得分都有不同程度的影響作用。提問者的聲譽與問題的得分呈正相關關系。在實際情況中,提問者的聲譽越高,其在用戶網絡中的明星效應越明顯,這類用戶的網絡影響力通常也較大,他們在社區發布的內容一般能夠很快受到關注。另外,聲譽較高也能夠說明這些用戶發布的內容質量較高,他們往往是社區中知識較為豐富的專家型用戶,因此提出的問題一般更加專業和有價值。而與用戶的聲譽相反,用戶的被瀏覽次數對問題的得分具有抑制作用。創建時間更長的問題得到的好評相對更多一些。
模型2~模型5在基準模型的基礎上逐步加入了4個自變量。在模型2中,加入了標簽使用頻次的一次項和平方項來驗證假設1。結果顯示,標簽使用頻次的一次項系數為正且顯著,其平方項系數為負且顯著,表明標簽使用頻次與問題得分之間存在倒U形關系,即隨著標簽使用頻次增加,問題得分呈現上升趨勢,但當標簽使用頻次超過一定程度時,問題得分逐漸呈現下降趨勢。
模型3、模型4分別對假設2、假設3進行了驗證。可以看出,自變量標簽距離的系數顯著為正,而自變量標簽多樣性的系數不顯著:表明標簽距離有問題得分之間具有正相關關系,即一個問題下包含的標簽相關性越高,該問題越有可能得到較高評價,假設2得到驗證:而標簽問的多樣性程度對于問題得到的評價并沒有明顯的影響作用,假設3沒有得到驗證。
模型5中加入了標簽網絡中心性的一次項和平方項來驗證假設4。結果顯示一次項系數顯著為正,二次項系數不顯著:說明標簽網絡中心性與問題得分之間存在單調正相關關系,即標簽在網絡中越重要,該問題的得分越高,且隨著標簽網絡中心性的增加,問題得分不會出現下降趨勢。假設4僅得到部分驗證。該結論說明,當一個問題在網絡中處于核心位置時,表明該問題的連通性更強,是一個活躍的知識共享中心,具有較強的明星效應。對于活躍程度高的明星問題,用戶更有可能從回答問題中獲得潛在的利益,如聲譽和互惠性的提高,因此對于該問題的評價也會越高。
為了對表4的回歸結果進行進一步驗證,采用逐步回歸篩選并剔除不合適的自變量,結果如表5所示。從表5可以看出,在包含所有自變量的模型7中,標簽多樣性系數和標簽網絡中心度的平方項系數未通過顯著性檢驗:通過逐步回歸自動去掉標簽網絡中心度的平方項,逐步回歸分析中止,得到當前最優的模型8:模型8中的自變量系數的顯著性水平有所提高,但標簽多樣性的顯著性水平仍然不理想,因此進一步進行逐步回歸分析的優化:結果顯示,去掉標簽多樣性后,AIC值增加幅度最小,因此得到去掉該自變量后的模型9,所有的變量系數均為顯著。該結果進一步驗證了表4中的模型6。
在前文中,通過觀察標簽使用頻次一次項系數和平方項系數的方向及顯著性,初步得出該自變量與因變量存在倒U形關系的結論。然而,Lind J T等指出,自變量系數的表現還不足以證明U形關系的存在。為了更加嚴格地驗證對此關系進行驗證,本文使用Lind J T等提出的U形關系三步法進行檢驗。
通過以上方法,得到自變量標簽使用頻次的回歸系數結果如表6所示。
從結果中可以看出,自變量平方項的回歸系數為正,且在p<0.001的水平上顯著,滿足檢驗條件1。從表6中可以得到拐點為x=357 617.6,分別對拐點左右兩側的數據進行線性回歸,結果如表7所示。
從表7中可以看出,拐點兩側的線性回歸結果滿足檢驗條件2。拐點x=357 617.6的95%置信區間為[329 318.4,400 342.2],自變量的數據范圍是[815.5,1 281518],顯然拐點及其95%置信區間都在自變量的數據范圍內,因此滿足檢驗條件3。
經過檢驗,證明自變量標簽使用頻次和因變量問題得分之間存在倒U形關系,即問題得分隨著標簽使用頻次的增加,呈現出先升后降的趨勢。在一個在線問答系統中,標簽是相關知識的代表和濃縮。標簽的使用頻次高,表示該類知識在系統中的受關注程度較高,即有較多用戶提出了涉及該知識的問題,因此這類問題的解決能為系統用戶提供較高的價值,更容易受到用戶的認可;隨著標簽使用頻次的增加,問題在系統中的曝光程度也逐漸增加,越來越多的用戶評價會使問題得分呈現下降趨勢。
5總結與討論
社交媒體和網絡技術的發展導致信息爆炸的現象越來越嚴重,網絡平臺充斥著大量良莠混雜的信息。對于知識共享平臺來說,迫切需要明確什么樣的內容更加能夠得到用戶的青睞,以便有價值的知識能夠得到有效的傳播和擴散。本文以社會化知識問答社區Stack Ovemow為平臺,將研究重點放在問題本身的特征和所處的知識網絡環境,分析問題質量的影響因素。研究發現,知識的大眾化程度、知識的關聯程度以及知識的明星效應都會對知識的受關注和擴散程度產生影響。其中,知識的大眾化程度與問題質量呈倒U形關系,當知識之間的關系達到一個合適的值時,問題得到的評價最高:知識問的關聯度越高,問題越容易獲得較高的評價:問題中包含的知識在知識網絡中與更多的知識點之間建立關系,該問題越容易獲得高評價。
對于用戶來說,本研究的結論能夠更有效地指導提問者提出價值更高的問題,通過改變設置標簽的技巧,使提出的問題具有更高的可見性和質量,提高其在社區中的聲譽度。對于Staek Overflow這樣的專業型在線知識共享平臺而言,明確問題的傳播和評價受到哪些因素影響,可以進一步幫助平臺制定針對用戶行為的獎懲機制,制定出更完善的平臺運營機制。
然而,本研究仍然存在一些局限和不足之處。一方面,本研究的樣本選取具有一定的局限性:Stack Ovemow是一個專業的IT技術問答網站,內容多集中在編程領域,具有較強的領域特征。在接下來的研究中,研究將擴展到其他類型的在線知識共享系統:另一方面,由于研究側重于知識特征的影響作用,僅將用戶因素作為控制變量,并沒有深入分析用戶和知識標簽對問題的共同影響以及兩者之間的互動機制。實際上,社會化知識共享平臺區別于傳統網絡資源的一個重要特點,是其包含豐富的用戶行為和用戶關系,基于用戶行為的系統研究是社會化網絡環境下知識組織和知識管理的熱點問題。如何同時從用戶和知識兩個維度出發,建立完整、全面的社會化標注知識共享模型和動態演化機制,是有待繼續深入研究的。