張 麗 冰
(南開大學商學院,天津300071)
?
基于Fussy-GRNN的網絡論壇質量評價
張麗冰
(南開大學商學院,天津300071)
互聯網論壇是目前進行直接知識交流的一條重要途徑,如何對互聯網論壇進行科學評價成為一個重要問題。在已有研究基礎上,本文從網站建設、網站管理、信息交流質量和信息交流時效性等四個方面,構建網站質量評價指標體系與基于模糊廣義回歸神經網絡 (Fussy-GRNN) 的企業知識共享能力評價模型,并進行了相應測試。
網絡論壇;Fussy-GRNN;評價指標;評價模型
網絡論壇又名電子公告板(BBS),該系統通過網絡,使各用戶終端連接,進行數據或程序的上傳或下載、文章信息發布和閱讀等信息交換行為。現在的網絡論壇(網絡社區),是以電子公告板系統為核心進行應用擴展,集成信息公告欄、群組討論、在線實時聊天、交友、個人空間、無線增值服務等功能在內的網上互動平臺。同一主題的網絡社區集中了具有共同信息需求的用戶。傳統形式下的網絡論壇分為論壇、版塊和主題三個層次,而新型網絡論壇則集成了博客、微博、社交網絡、個人空間等網絡應用,分層更加復雜和多樣。網絡論壇所具有的實時性(支持在線交流)、內容豐富性(在法規要求的范圍內,可以自由根據論壇分類主題進行分析)、資源可靠性(絕大多數管理良好的論壇根據設定不允許發送無意義的文章,同時禁止惡意“灌水”回復)等特征,使人們在網絡生活中扮演著知識交流的角色。因此,有必要對網絡論壇進行評價,通過構建相關評價指標體系和評價模型,促使網絡論壇健康發展。
(一)國外相關研究情況
目前,國際上對網絡論壇的研究比較多,研究方向也各不相同。例如網絡論壇會員的行為分析、熱點追蹤與監控、潛在對象行為影響等研究。
YuIchifuji, Susumu Konno, Hideaki Sone[1]214通過研究一種基于貝葉斯原理的算法,將論壇中的回復自動分為“普通評論”,“惡意破壞論壇秩序的評論”,“嚴重破壞論壇秩序的評論”三類,并且根據實驗,此算法對“惡意破壞”或“嚴重破壞”的評論歸類準確率為64.7%,對單純“惡意破壞”評論歸類的準確率為85.4%。
Yasufumi Takama, Masaki Okumura[2]1001提出了一個定時監視多個BBS運行趨勢的可視化系統。他們認為BBS是一個能夠獲取最新信息并可以獲得在感興趣的話題下最廣的領域的觀點。因此,有必要多線程同時運作進行信息收集以獲得更多數據。他們這個構想的基礎是關鍵字可視化。此外他們的系統實現了靈活檢測用戶對關鍵詞的關注變化情況。他們同時通過試驗中基于眼動追蹤數據的原型系統獲取的測試參與者數據,分析其行為。
Alexandra L. Whittaker等[3]135通過對基于Web2.0技術下的產物——Facebook——建構網絡學習社群對本科生動物學學習的影響,發現Facebook在教育領域有很大促進作用,這些主要作用體現在強化通訊,獲取社群援助和制定問題解決策略方面。
(二)國內研究情況
目前,國內對網站的相關評價研究正處于迅速發展時期。根據中國知網學術趨勢搜索提供的數據[4](如圖1所示,檢索時間2016-5-11),我國國內對網站評價的論文,整體呈上升趨勢。

圖1 關鍵詞為“網站”并含“評價”的學術關注度圖
王晰巍等[5]111結合信息生態的相關理論和門戶網站發展狀況,基于信息者、信息和信息環境等3個信息生態基本要素,提出從“服務性、參與性、互動性”三方面入手,構建低碳類信息門戶網站生態性評價指標體系,利用層次分析法確定各評價指標權重。為驗證指標的應用價值,結合國內外典型低碳類信息門戶網站進行實證研究。宋麗麗[6]114在網絡鏈接基本分析方法基礎上,構造銷售利潤率影響因子指標,并結合其它對中小企業網站影響較大的鏈接指標進行研究,分析其與樣本中小企業排名的相關關系,對中小企業網站影響力進行評價,進而對中小企業網站建設提出建議。趙躍[7]67引入對應分析法,以31個省級政府門戶網站為評價對象,以中國軟件評測中心的3個反映政府網站功能的指標數據與Alexa網站的8個實時監測數據為依據,建立相應的對應分析評價模型,并在此基礎上得到兩張對應分析定位圖,結合網站原始數據對兩張定位圖進行比較分析,并將圖中網站分類情況與中國軟件評測中心發布的省級政府網站排名情況行比較分析,揭示出不同水平政府門戶網站的優勢與劣勢,從而達到對政府網站進行評價的真正目的。
(一)評價指標構建原則
在涉及到對事物質量評價時,遵循以下原則。
1.系統性原則。影響網絡論壇質量的因素較多,必須采用系統設計、系統評價的原則。在設定中抓住重要的、有代表性的指標,同時兼顧其他必要因素,這樣才能比較全面、客觀地評價網絡論壇的質量。
2.定性與定量相結合原則。在影響網絡論壇質量的因素中,包括不能量化但可以確定其性質的定性指標和可以量化的定量指標等兩方面指標。
3.可行性原則。對網絡論壇的質量評價指標體系建設,應考慮在實際操作中的可行性,要易于操作、方便實施。
(二)網絡論壇質量評價指標的建立
基于上述三個原則,提出了網絡論壇質量評價指標體系,包括網站建設、網站管理、信息交流質量和信息交流時效性等。該指標體系在層次上分為目標層、準則層和指標層,各層次下具有相應的指標,如圖2與表1所示。

圖2 網絡論壇質量評價體系
1.網站建設由網站的視覺建設( X1)、網站的用戶友好性 ( X2)、網站的系統穩定性(X3)、網站的系統安全(X4)四項指標構成。視覺建設可通過網站的排版和色彩設置來衡量;網站的用戶友好性通過網站注冊、發布信息、來信提醒的便捷程度等來衡量;網站的系統穩定性通過網站的加載能力,是否出現故障頁面導致無法登錄來衡量;網站的系統安全通過網站的賬號安全(是否易于盜號,個人信息是否易于泄露)來衡量。網站建設水平高低反映了網絡論壇的基礎性能好壞,也是信息交流的硬件基礎。

表1 網絡論壇指標數據
2.網站管理。包括網站規章編制( X5)、網站規章執行( X6) 兩項指標。網站規章編制反映互聯網論壇對外界反應的靈活性和原則性,以及網站管理的預見性水平;網站規章執行是指網站對于違規行為處理的響應速度,以及對違規行為處理質量水平,可用站務反饋版塊中用戶的舉報文章數目來表征。
3.信息交流質量。包括交流的信息標準化(X7)、交流的信息質量(X8)兩項指標。交流的信息標準化表現在論壇中文章發表是否遵循一定格式,如轉載的文章是否會出現轉載文章的來源等;交流信息的質量表現在論壇中優秀文章多少,其可通過論壇中的“加分”、“高亮”、“推薦”、“精華”文章占總體文章的數目來衡量。
4.信息交流時效性。包括信息交流速度(X9)、信息交流響應數量(X10)兩項指標。信息交流響應數量表現在論壇發布一篇文章后收到其他網友的回復時間長短;信息交流的響應數量表現在論壇內部一篇文章回復數量的平均值,平均值越高,說明論壇內的用戶參與度越高。
(一)模糊理論介紹
模糊理論最初由美國加州大學L.A.Zadeh提出。該理論誕生原因是傳統精確的數學方法已不能完全有效解決生活中一些復雜問題,而使用模糊的邏輯觀念來描述現實生活中的事物具備一定可行性。模糊理論是以隸屬函數來表達人類生活中不明確或模糊性問題。本文采用三角隸屬函數進行分析。
在本文的10 個影響因素中,既有定性因素又有定量因素,如網站的視覺建設、網站的用戶友好性、網站的系統穩定性、網站的系統安全、網站規章編制、交流信息的標準化等為定性因素;網站規章執行、交流的信息質量、信息交流的速度、信息交流的響應數量為定量因素。
對于不同類型的因素,要使用不同方法來確定其隸屬度: 對于定性因素可以通過專家評分法來確定隸屬度;對于定量因素可先對數據歸一化,然后再進行比較評價。
設定評價集 E {優秀、良好、一般、較差},根據最大隸屬度原則來確定評價結果。如表1中所示的網絡論壇 N1的指標“網站的視覺建設”(X1) 的評價集為 {0、0.3、0.3、0.4},根據“最大隸屬度”原則,該網絡論壇的此項指標的評價結果為“較差”,其他指標評價結果也采用類似原則進行評價。
(二)GRNN 的結構和學習算法
GRNN ( General Regression Neural Network, 泛化回歸神經網絡) 是徑向基函數(RBF)神經網絡的變化形式之一。GRNN具有很強的非線性映射能力和柔性網絡結構;同時也具有較高的容錯性和魯棒性。根據實際經驗,GRNN的訓練速度快于一般的RBF 網絡;與常用的BP 網絡相比,GRNN的收斂速度明顯較快。此外,GRNN可用于在樣本數據較少或數據不穩定情況下獲得較好的評價與處理結果。
GRNN 構成如圖3,其各構成部分為:

圖3 GRNN的網絡結構
1.輸入層(Input Layer)。輸入層各神經元是簡單的分布單元,直接將輸入變量傳遞到下一層。輸入層神經元的數量等于學習樣本輸入向量的維數。
2.模式層(Pattern Layer)。又名隱含層。其神經元的個數等于學習樣本的數目n,各神經元對應不同的樣本,模式層神經元傳遞函數為:

i=1,2,…,n
(1)
神經元i的輸出為輸入變量與其對應的樣本 X 之間的歐式距離 ( Euclidean Distance) 平方的指數平方的指數形式。式中,X 為輸入變量; Xi為第 i 個神經元對應的學習樣本。
3.求和層(Sum-mation Layer)。求和層使用以下計算公式進行求和:
(2)


GRNN 學習的步驟如下:
(3)計算測試樣本與標準模式的相似度,并利用訓練好的模型進行仿真。
(4)輸出結果。
(三)Fussy-GRNN 的網絡結構
根據模糊理論和 GRNN 的學習算法,構建出關于網絡論壇質量評價的 Fussy-GRNN模型,如圖4 所示。

圖4 網絡論壇質量的Fussy-GRNN網絡結構
該模型包括兩部分: 模糊處理部分和 GRNN 數據處理部分。其中,模糊處理部分負責對原始數據進行模糊化處理,使數據能夠被模糊神經網絡所用;GRNN 在模糊數據的基礎上,實現對數據的訓練、仿真、測試等。
(一)數據收集
根據第二部分中提出的網絡論壇質量評價指標體系,設計調查問卷,然后就11個綜合性網絡論壇中的汽車論壇進行問卷調查,調查對象包括資深網民、相關行業從業人員等。表1中所示的數據為經過模糊化加工后的調查問卷數據。
(二)數據處理和分析
利用 MATLAB軟件,進行神經網絡的模擬仿真工作。具體工作由以下幾個步驟構成。
1.Fussy-GRNN網絡結構的確定
(1)輸入層相關結構的確定。結合第三部分第二大問題中的相關描述,Fussy-GRNN網絡的輸入層神經元數量由網絡論壇質量的指標數量決定。但由于已對每個指標進行了模糊處理,共包括4 項分指標(即評價集 E 中的元素個數為4),所以輸入層的實際神經元數量為 40 個 (10×4)。
(2)輸出層相關結構的確定。對于輸出層,因為輸出值也有4項分指標,所以輸出層神經元的數量為4。
(3)隱含層相關結構的確定。隱含層的神經元數目等于學習樣本的數量,結合對輸出層和輸入層神經元結構的設計,隱含層的神經元數量應為40個,并使誤差達到所要求的目標值。
2.利用Fussy-GRNN網絡進行分析處理
(1)利用 Fussy-GRNN 對原始數據進行模糊化處理,處理后的結果如表1所示。
(2)利用 Fussy-GRNN 進行數據訓練、仿真、測試。用表1中前8組數據(即前8個網站的質量調查數據)作為訓練樣本,然后用newgrnn 函數創建 Fussy-GRNN 中的GRNN網絡;分別設定徑向基函數分布密度值(SPREAD)為0.02、0.03、0.04、0.05、0.06、0.1、0.3、0.5、0.7、0.9,進而進行仿真。
通過在系統上仿真可以得知,當SPREAD=0.1時,誤差的數量級達到1.0e-47; 當 SPREAD =0.06 時,誤差的數量級達到1.0e-130;當SPREAD = 0.05時,誤差的數量級達到1.0e-188;當SPREAD = 0.04,誤差趨近于0。這就意味著,隨著SPREAD值增大,誤差越來越大。同理,隨著SPREAD值減小,誤差越來越小。但當SPREAD =0.03 ,系統提示誤差值無法顯示(表明無法顯示),因此為便于計算,選擇SPREAD值為0.04,完成對網絡的訓練。
對表1中的后4個網站數據作為測試樣本進行仿真,所得結果如表2所示。
由表2并根據評價集和最大隸屬度原則可以看出,網站N9的評價結果為 “優秀”,N10為“良好”,網站 N11為“良好”。通過實地調研,對于網站N9和N10的實際評價結果與所仿真獲得的評價結果相符,從而也說明“基于Fussy-GRNN 的網

表2 Fussy-GRNN網絡評價結果(SPREAD=0.04)
絡論壇質量評價”的有效性;但對于網站N11,實際評價中更多偏向于“優秀”的評價,雖然其總體實際評價與本次模擬結果相同,但在進一步調查中受訪專家普遍認為N11相較“良好”中的其他網站有突出的優秀表現,盡管其與評價為“優秀”的網站還有一定差距。這也說明我們在評價集的設計中存在一些問題,比如可選選項過少等,這些問題將在后面的研究中改進。
本文通過分析目前其他論文的相關研究成果,提出使用Fussy-GRNN作為工具的網絡體系,并通過相關測試證實其有效性。模糊矩陣方法較傳統的一些方法更能表達出關于具體的一些不便說明的事實的性能,為網絡評價提供了一個新方法。
[1]YuIchifuji, Susumu Konno, Hideaki Sone, An advisory method for BBS users and evaluation of BBS commets[J]. Procedia -Social and Behavioral Sciences,2010,(1).
[2]Yasufumi Takama,Masaki Okumura, Interactive Visualization for Monitoring Support of Multiple BBS Threads[J].Procedia Computer Science,2013 ,(2).
[3]Alexandra L. Whittaker, Gordon S.Howarth, Kerry A. Lymn,Evaluation of Facebook to create an online learning community in an undergraduate animal science class[J].Educational Media International, 2014,(2).
[4]中國知網學術趨勢搜索[EB/OL].[2016-5-11],http://trend.cnki.net/TrendSearch/trendshow.htm?searchword=%u7F51 %u7AD9%20%u8BC4%u4EF7.
[5]王晰巍, 郭宇, 魏駿巍等.門戶網站生態性評價及實證研究——以低碳類門戶網站為例[J].圖書情報工作,2014,(19).
[6]宋麗麗,徐靜. 基于網絡鏈接分析的中小企業網站分析與評價研究[J].現代情報,2015,(1).
[7]趙越. 基于對應分析法的政府網站評價研究[J].電子政務,2014,(3).
(責任編輯魯守博)
2016-06-17
張麗冰,女,山東濰坊人,南開大學商學院情報學碩士。
G206.2
A
1672-0040(2016)05-0019-06