[摘要] 以對(duì)研究倫理和研究態(tài)度的強(qiáng)調(diào)貫穿全文,簡(jiǎn)介2006-2009年間在完成博士論文《網(wǎng)絡(luò)信息行為的差異化用戶模型——?jiǎng)?chuàng)建與使用型人》前后所做的6次調(diào)查經(jīng)驗(yàn),包括研究思路與策略、研究角度與立場(chǎng)、研究設(shè)計(jì)的綱要、研究對(duì)象的特殊價(jià)值、抽樣與調(diào)查的審核過程、合理推論原則以及整理SPSS工具的操作步驟等。
[關(guān)鍵詞] 用戶行為 抽樣調(diào)查 假設(shè)檢驗(yàn) 合理競(jìng)替 方法論 研究倫理
1研究思路與策略
目前圖書館學(xué)主要面臨的是網(wǎng)絡(luò)帶來的沖擊,大量新型的網(wǎng)絡(luò)技術(shù)對(duì)數(shù)字圖書館和圖書館信息服務(wù)帶來了巨大挑戰(zhàn),對(duì)數(shù)字圖書館技術(shù)方面的研究造成決定性影響;伴隨網(wǎng)絡(luò)技術(shù)的革新,海量信息的處理、分析與計(jì)算成為情報(bào)計(jì)量、書目計(jì)量和科學(xué)計(jì)量方面的新課題;信息組織、信息檢索與信息需求的改變,促使了用戶行為的改變,脫離了傳統(tǒng)圖書館學(xué)的假設(shè);最后,這些改變與沖擊的加總,就造成了圖書館性質(zhì)的根本性變化,從而使圖書館學(xué)有了新的方向與新的課題。所以,現(xiàn)在研究圖書情報(bào)學(xué),可謂身逢其時(shí)。
然而,現(xiàn)代的信息情報(bào)分析日益復(fù)雜、圖書館服務(wù)日益增加,數(shù)字圖書館的建設(shè)涉及到很多具備不同技能的參與者。這就對(duì)知識(shí)服務(wù)者的學(xué)科背景以及研究工作提出了很多新的要求和挑戰(zhàn)。專業(yè)人員必須擁有廣泛學(xué)科的知識(shí)基礎(chǔ),方能從寬廣視野中對(duì)實(shí)際從事的圖書情報(bào)工作產(chǎn)生獨(dú)特的見解與創(chuàng)見,還必須從廣泛的、有新意的甚至天馬行空的想法上,借由文獻(xiàn)閱讀與討論,通過與實(shí)際工作相結(jié)合,并經(jīng)過嚴(yán)謹(jǐn)?shù)目茖W(xué)研究過程,逐步聚集到兩三個(gè)具體的前沿問題上,在鉆研、攻關(guān)、克服種種困難后,提出創(chuàng)新與貢獻(xiàn)。
以終端用戶(end-user)行為研究而言,有兩種基本思路:①?gòu)膱D書館學(xué)出發(fā),結(jié)合其他學(xué)科;②以其他學(xué)科如管理學(xué)、社會(huì)學(xué)、心理學(xué)、經(jīng)濟(jì)學(xué)等的實(shí)踐基礎(chǔ),作為指導(dǎo)者或者引入而成為解決圖書情報(bào)事業(yè)發(fā)展困難的理論來源,利用其他學(xué)科的內(nèi)容來建立假設(shè),用統(tǒng)計(jì)或者其他方法來進(jìn)行實(shí)證調(diào)查,解決當(dāng)前圖書館面臨的某個(gè)問題,獲得可靠的結(jié)論。
剛開展的課題研究,總是困難重重,執(zhí)行之前,有能夠想象得到的困難,執(zhí)行過程中,會(huì)出現(xiàn)當(dāng)初沒有想象到的困難。甚至課題完成后,才會(huì)發(fā)現(xiàn)真正重要的問題。本文介紹的《網(wǎng)絡(luò)信息行為的差異化用戶模型——?jiǎng)?chuàng)建與使用型人》(以下簡(jiǎn)稱《型人》)的研究經(jīng)驗(yàn),先是從信息搜尋行為出發(fā),建立假設(shè),以反證求取基本行為描述,在進(jìn)行研究解釋時(shí),又從心理學(xué)與社會(huì)學(xué)的若干理論建立合理競(jìng)替假設(shè),進(jìn)行研究推論,從而得到一個(gè)假說。在此我們并不著墨《型人》,而是概述當(dāng)時(shí)實(shí)地調(diào)查的方法論,以期拋磚引玉。
2研究角度與立場(chǎng)
當(dāng)代研究論文的寫作規(guī)范和要素,包括找到什么問題、提出什么問題、解決什么問題以及用什么方法、用什么技術(shù)、用什么工具來解決這些問題。然而,自2009年至今擔(dān)任International Journal of Library and Information Science和International Journal of Science and Technology Education Research編委以來,經(jīng)常審閱到大量南亞和東南亞論文,其中,最后被退稿的論文大多是立意不夠鮮明,而不是缺乏以上要素。在眾多論文評(píng)審意見中,最常見的是“請(qǐng)明確您的研究?jī)r(jià)值與意義”。換言之,我們希望研究者們挑戰(zhàn)自己的心志、要求自己、苛求自己,去貼近實(shí)地現(xiàn)況,理清自己的研究目的和方向。簡(jiǎn)言之,質(zhì)樸遠(yuǎn)勝于取巧。
此外,如果是終端用戶行為研究,我們還注意研究報(bào)告所透露的細(xì)節(jié),審核研究者是否踏入倫理與政治的誤區(qū)。最基本的要求有如下幾方面:
#61548;自愿參加原則:不強(qiáng)迫受訪者參與,所有參與研究的受訪者都是自愿參與。
#61548;對(duì)受訪者無害原則:研究?jī)?nèi)容不涉及受訪者個(gè)人評(píng)價(jià)、隱私以及研究單位的態(tài)度。
#61548;匿名和保密原則:對(duì)所有受訪者數(shù)據(jù),采用所羅門加密法,并且予以安全存放保密。
#61548;研究過程透明原則:研究者公開姓名與單位,研究問題不涉及單位對(duì)個(gè)別受訪者的特殊照顧與福利政策。
#61548;研究報(bào)告中立原則:研究者在研究報(bào)告中具體指出研究本身存在的缺點(diǎn),而不加以掩飾。
不過,有些內(nèi)容是審核者不會(huì)看到,卻又十分重要的方面。例如,研究本身以外的另一種實(shí)際問題是:研究者如何面對(duì)自己以及所屬機(jī)構(gòu)的既得利益?因?yàn)榭茖W(xué)研究本身也屬于社會(huì)文化的一種實(shí)踐,而這不可避免地涉及到以下問題:用什么角度?關(guān)心什么問題?意圖得到什么結(jié)論?每個(gè)人在一項(xiàng)特別的研究事業(yè)的結(jié)果中都有既得利益。研究者如果清楚地意識(shí)到自己的既得利益,以及研究項(xiàng)目中各方復(fù)雜的既得利益后,應(yīng)該讓這些既得利益不影響研究設(shè)計(jì),并且防范研究結(jié)果被刻意地、有意地或無意地誤導(dǎo)。
事實(shí)上,只要能夠想清楚上述要點(diǎn),人們很容易從自己的研究問題以及別人的研究成果中找到切入點(diǎn)和突破點(diǎn)。研究倫理不是一種道德說教,而是所有研究最重要的關(guān)鍵所在。如果說,研究者的研究倫理決定了其研究高度和貢獻(xiàn),一點(diǎn)也不為過。其他的研究難點(diǎn)其實(shí)都可以解決,例如不會(huì)SPSS可以請(qǐng)人指導(dǎo),研究設(shè)計(jì)不當(dāng)可以重做或者補(bǔ)救,研究推論不佳可以改善,唯有研究倫理存在于個(gè)人心中,貫穿整個(gè)研究過程,不可不慎。
研究者應(yīng)該保持一個(gè)知識(shí)分子該有的良知,對(duì)“政策導(dǎo)致結(jié)論”應(yīng)有所警惕。幾年前,當(dāng)《型人》還未成形,而只是知道要進(jìn)行某些社會(huì)科學(xué)調(diào)查前,指導(dǎo)者和研究者就共同面臨過“我在為誰研究”的問題。這個(gè)簡(jiǎn)單的自我提問,對(duì)于日后形成《型人》卻具有決定性影響。
3研究設(shè)計(jì)的綱要
當(dāng)代的研究人員,不再只從事理論綜述和著述,由于圖書情報(bào)工作的發(fā)達(dá),幾乎所有學(xué)科(至少是中科院的理工類學(xué)科)都把“綜述”當(dāng)成“必須要做”而非“唯一要做”的事情,并且把“創(chuàng)新”看作“必須能做”的決勝條件。
幾年前,經(jīng)過仔細(xì)研究,我們認(rèn)為,無論從哪個(gè)子領(lǐng)域的某個(gè)專題開始著手,創(chuàng)新過程都仍然不離以下三方面:①文獻(xiàn)綜述——發(fā)現(xiàn)尚未解決的問題——用舊方法解決新問題。②研究方法——發(fā)現(xiàn)舊方法的不足——產(chǎn)生新方法。③研究結(jié)果——?dú)w納新方法、新問題的研究結(jié)果——產(chǎn)生新領(lǐng)域。三者環(huán)環(huán)相扣,形成創(chuàng)新型研究。特別注意的是:對(duì)新問題、新方法、新領(lǐng)域的提出,必須建立在實(shí)證的基礎(chǔ)上,可以被其他研究者重復(fù),或者進(jìn)行修改。
以《型人》的研究設(shè)計(jì)為例,最初設(shè)計(jì)執(zhí)行6次相同問卷調(diào)查的縱向研究,后來發(fā)現(xiàn)許多執(zhí)行面的問題,于是改采6次不同問卷調(diào)查的橫向研究,研究計(jì)劃實(shí)施到一半,發(fā)現(xiàn)可以執(zhí)行,但是無法深入描述終端用戶實(shí)際的工作內(nèi)容以及網(wǎng)絡(luò)行為,于是加入了訪談法和自然觀察法,改用質(zhì)量混合型研究。
在進(jìn)行總體設(shè)計(jì)時(shí),可以按情況調(diào)整,但是實(shí)際執(zhí)行階段,則容不得隨意更改計(jì)劃;所以,為確保研究計(jì)劃“如期依約”完成,在進(jìn)行研究設(shè)計(jì)的時(shí)候,參考了許多前輩的研究報(bào)告和教科書,制定一些硬性規(guī)則。例如,就問卷調(diào)查和訪談?wù){(diào)查的硬性過程來說,有以下要點(diǎn):
#61548;問卷調(diào)查的具體步驟包括:①確定問卷框架和主要內(nèi)容;②設(shè)計(jì)問卷的具體問題;③在小范圍內(nèi)試填問卷;④根據(jù)試填問卷中暴露出的問題修改問卷;⑤設(shè)計(jì)問卷發(fā)放與回收方式;⑥發(fā)放問卷;⑦被調(diào)查者回答問卷;⑧回收問卷;⑨追蹤未回答問卷;⑩整理問卷,剔除作廢問卷;○11對(duì)問卷答案進(jìn)行編碼,以便處理分析。
#61548;訪談?wù){(diào)查的具體步驟包括:①確定訪談主要內(nèi)容;②確定訪談基本形式;③設(shè)計(jì)訪談提綱;④安排訪談過程;⑤實(shí)施訪談;⑥整理訪談?dòng)涗洠虎呋貞浽L談情況并再次整理記錄;⑧對(duì)訪談結(jié)果進(jìn)行匯總,以便處理分析。
由于充分考慮研究倫理的每個(gè)細(xì)節(jié),并且擁有堅(jiān)定而且明確的研究態(tài)度,所以在“師出有名”的情況下,能夠準(zhǔn)確評(píng)估研究設(shè)計(jì)的可行性以及實(shí)際執(zhí)行的效率。
4研究對(duì)象的特殊價(jià)值
在執(zhí)行用戶研究時(shí),需要非常清楚誰是研究對(duì)象、誰不是研究對(duì)象,否則無法進(jìn)行之后的研究推論。以《型人》為例,當(dāng)初選擇中國(guó)科學(xué)院研究生院的碩、博士研究生作為研究對(duì)象,是因?yàn)槠渚哂刑厥庑裕憩F(xiàn)在:與他們的上一代科研人員不同,這一代中國(guó)科學(xué)院所有基本的人口統(tǒng)計(jì)參數(shù)、社會(huì)參數(shù)、經(jīng)濟(jì)參數(shù)以及網(wǎng)絡(luò)通訊參數(shù),對(duì)比過去15年都有新的數(shù)值,從事研究的科學(xué)研究人員總?cè)藬?shù)呈指數(shù)增長(zhǎng),在中科院內(nèi)的比率大幅增加。此外,在研究生院的學(xué)籍統(tǒng)籌下,分屬到直屬中國(guó)科學(xué)院的各個(gè)研究機(jī)構(gòu),他們?cè)谘芯克锏那闆r是這樣:與正式工作的職員一起,通過實(shí)驗(yàn)室或個(gè)別指導(dǎo),將技術(shù)、方法、理論、研究規(guī)范和價(jià)值觀傳遞出去。這些身處工作崗位的前輩,不僅把他們的技術(shù)、方法、信息和理論傳授給和他們一起工作的新手,而且也把指導(dǎo)研究的研究所規(guī)范和價(jià)值觀傳給了其同事。
研究上述對(duì)象,不容易得出普遍性的用戶行為,但是其樣本代表性特殊而且特征集中,容易找到有趣(interesting)或有新意的發(fā)現(xiàn);但是另一方面,也很具有挑戰(zhàn)性,容易產(chǎn)生設(shè)計(jì)不良或者操作不良的問題。克服這個(gè)難點(diǎn)的方式,就是反復(fù)仔細(xì)考慮研究倫理與態(tài)度。在研究過程中,幾乎每天都在天人交戰(zhàn):來自用戶的直接沖擊,會(huì)不斷修正研究者已有的知識(shí)結(jié)構(gòu)以及“普通常識(shí)”。這種鍛煉對(duì)于日后從事其他研究課題,甚至在不同圖書館以及公司工作,都是很有幫助的。另一方面,盡管面對(duì)的讀者群不同,但是《型人》的研究目的是提升圖書館的系統(tǒng)與服務(wù)而非研究者發(fā)文數(shù)與被引量,研究立場(chǎng)是讀者立場(chǎng)而非圖書館長(zhǎng)與館員的立場(chǎng),研究利益是讀者利益而非圖書館長(zhǎng)與研究者的利益。所以,當(dāng)研究者日后面對(duì)來自各種自稱“代表用戶”的聲音時(shí),能夠直接參照幾年前對(duì)終端用戶的實(shí)地調(diào)查經(jīng)驗(yàn),直覺地發(fā)現(xiàn)對(duì)方的潛藏用意以及事務(wù)上隱而未現(xiàn)的危機(jī)。在旁人看來,好似一種特異功能,其實(shí)只是幾年前下過苦功,而且每隔一段時(shí)期,花一小部分時(shí)間去溫習(xí)而已。
5抽樣與調(diào)查的審核過程
抽樣似乎是很復(fù)雜與困難的工作。但是,如果掌握研究倫理與態(tài)度的原則,并且長(zhǎng)存在心,那么考慮如何抽樣并不是太困難的事情。雖然有很多種抽樣方法、抽樣技術(shù)和抽樣量表,但是如果不符合研究倫理與態(tài)度,那有何用?反過來說,即使不懂得抽樣,只要把握研究倫理與態(tài)度,可以自己推導(dǎo)較為簡(jiǎn)便的抽樣方式。如果只有重視抽樣技巧而忽視其研究倫理,則最后必然產(chǎn)生戲劇性的研究潰敗,不可不慎。下面列舉《型人》研究前的思考過程。
5.1母體樣本名冊(cè)是否可得?
隨機(jī)抽樣與方便取樣,在操作面上的最大不同,就在于隨機(jī)抽樣是在所有調(diào)查對(duì)象(母體)中選擇受訪者(樣本)。因此,沒有包括所有母體信息的樣本名冊(cè),就不可能進(jìn)行隨機(jī)抽樣。在這個(gè)階段,除了提出明確的研究計(jì)劃書以外,也對(duì)于信息保密作出承諾與具體措施。
5.2母體樣本名冊(cè)是否完整?
擁有名冊(cè)并不等于掌握了母體的相關(guān)信息,對(duì)于問卷調(diào)查而言,名冊(cè)至少必須記載以下信息:姓名、就讀系所、是否就讀于北京地區(qū)、是否仍在就讀。上述信息提供研究者判斷是否能夠進(jìn)行隨機(jī)抽樣。事實(shí)上,該名冊(cè)包括個(gè)人信息,如性別、攻讀學(xué)位、年級(jí)或入學(xué)時(shí)間、年齡等,但是不包括他們的聯(lián)絡(luò)方式。研究者在這個(gè)階段開始判斷采用哪種類型的隨機(jī)抽樣。
5.3如何進(jìn)行抽樣?
仔細(xì)考慮后的《型人》采用分層隨機(jī)抽樣,對(duì)各個(gè)京區(qū)研究所的學(xué)生比例、性別比例、博碩士比例、年級(jí)比例等進(jìn)行抽樣。從每一個(gè)抽樣單位中,按照這個(gè)抽樣單位的規(guī)模成比例地進(jìn)行選擇。其優(yōu)點(diǎn)是:①能夠保證形成單位分類基礎(chǔ)之特征的代表性。因此,所產(chǎn)生的變異性比簡(jiǎn)單隨機(jī)抽樣或多階段隨機(jī)抽樣更少;②通過分類過程可以減少總體成員未能被包括進(jìn)來的機(jī)會(huì);③能夠估計(jì)每一層的特征,因而可以進(jìn)行比較。但是,其缺點(diǎn)是:存在著錯(cuò)誤分類的可能性,因此會(huì)增加變異性。為了克服這個(gè)缺陷,進(jìn)行過變異系數(shù)的短暫研究,最后雖然無法求證可能性,但是意外地學(xué)會(huì)結(jié)構(gòu)方程式。也因?yàn)槿绱耍谠L談?wù){(diào)查上,就采用目的抽樣。以問卷調(diào)查的分析結(jié)果為基礎(chǔ),通過判斷,從總體中選擇一個(gè)子群體作為整體的代表,將這一群體中的一部分作為樣本。
5.4如何有效發(fā)放問卷?
①與時(shí)間、地點(diǎn)和人力有關(guān)。發(fā)放時(shí)間(時(shí)期)越長(zhǎng),地點(diǎn)越分散,越是有效,但是人力協(xié)助的要求也越高。②與人力、禮品和經(jīng)費(fèi)有關(guān)。人力越多,禮品越多,發(fā)放問卷的數(shù)量越多;研究效度就越能增加;研究效度越是增加,越有能力犧牲效度換取信度,從而解決抽樣所帶來的信度不足。③與問卷數(shù)量、問題數(shù)量、禮品價(jià)值和經(jīng)費(fèi)有關(guān)。問卷數(shù)量越多,問題數(shù)量就應(yīng)該越少;這個(gè)問題在統(tǒng)計(jì)學(xué)上有一套公式,可以換算出參照值,在《型人》完成之后才知道這個(gè)解法,但是《型人》也確實(shí)在“安全區(qū)域”內(nèi)符合標(biāo)準(zhǔn);不過,若從實(shí)踐角度而言,與其考慮問卷數(shù)量和問卷題目,不如更多地考慮行政因素和受訪者預(yù)期心理所帶來的回答偏差,從而造成信度大幅降低的問題。
5.5樣本是否愿意回答?
是否愿意回答包括兩個(gè)問題:①調(diào)查如何進(jìn)行?也就是上述的發(fā)放問卷問題。②問卷本身是否不造成受訪者焦慮。造成受訪者焦慮的原因很多,除了發(fā)放回收的過程,最重要的就是問卷是否能夠輕易作答。比如,不適合問太新的議題,比如近期才出現(xiàn)的網(wǎng)絡(luò)詞匯。
如果一定要問最新的網(wǎng)絡(luò)行為,那么就要對(duì)是否了解該名詞進(jìn)行提問,或者對(duì)該名詞進(jìn)行幾句話的解釋,然而,這就會(huì)造成受訪者的壓力,而且會(huì)影響其作答。如果要降低受訪者這方面的作答壓力,問卷可以設(shè)計(jì)成具有結(jié)構(gòu)性質(zhì),比如對(duì)問題先進(jìn)行分類,對(duì)每個(gè)問題都進(jìn)行五等分評(píng)量,那么,即使要花費(fèi)時(shí)間看問題,也不用花費(fèi)時(shí)間看選項(xiàng)。然而,這個(gè)做法就會(huì)有隨便回答、懶得回答、慣性作答以及作答催眠(越到后面,越不能集中精神)4種降低信度的情況。
此外,訪談問題的回答方式盡量多樣化。結(jié)構(gòu)化問題能夠保證各種超越個(gè)人、時(shí)間及研究者等來源的資料之間的可比性,因此在回答變量問題時(shí)特別有用,變量問題研究的是事情之間的差異。相反,非結(jié)構(gòu)的方法允許研究者集中研究特定的現(xiàn)象,這些現(xiàn)象不同于其他現(xiàn)象,因此分別需要有針對(duì)性的方法。他們放棄普遍性與可比性,而追求內(nèi)在效度與情境的理解,所以在揭示導(dǎo)致特定結(jié)果的過程方面非常有用。
5.6如何有效回收問卷?
時(shí)間、地點(diǎn)、人力、禮品、經(jīng)費(fèi)和外部因素都是回收問卷要考慮的。但是回收問卷還更需要考慮方便性。能不能有效回收取決于問卷從受訪者到研究者所需要的步驟和時(shí)間。例如:①郵寄問卷調(diào)查的回收,包括放入回郵信封、粘好封口、詢問信箱、找到信箱、投遞,至少6個(gè)步驟。②電子問卷調(diào)查,則需要記得這回事、找到網(wǎng)址、(經(jīng)作答后)點(diǎn)擊完成,至少3個(gè)步驟。③面對(duì)面訪談,無論是約定時(shí)間回收,還是訪談中填寫,都需要記得回收或訪談時(shí)間、找到研究者,至少兩個(gè)步驟。④電話調(diào)查則不需要這些步驟。有趣的是,需要回收的步驟越多,相對(duì)地,允許問卷內(nèi)的題目就越多。郵寄問卷的缺點(diǎn),就是母體名冊(cè)上沒有正確的現(xiàn)居地址,而且回收的步驟對(duì)受訪者而言也太麻煩。然而,相對(duì)于不能問太多問題的電話訪談、以及無法確定收信人的電子問卷(而且母體數(shù)據(jù)不提供電子郵件地址)而言,問卷調(diào)查適合采用郵寄問卷。而訪談?wù){(diào)查,考慮到人數(shù)較少,采用面對(duì)面訪談。
5.7如何追蹤未回復(fù)的抽樣樣本?
理想的情況下,不需要追蹤問卷,因?yàn)榧词棺粉櫟絾柧恚辽龠€需要進(jìn)行一次假設(shè)檢驗(yàn):假設(shè)最近一次回收的問卷答案和前一次沒有差別。在隨機(jī)抽樣的研究過程中,即使不需要追蹤問卷,也要對(duì)“失蹤問卷”和“無效問卷”進(jìn)行分析,討論是否具有影響抽樣的失蹤樣本特征,亦即:是否有系統(tǒng)性誤差的問題。
追蹤問卷的方式和當(dāng)初發(fā)放回收問卷的方式有關(guān)。不過,大體上不外乎通過電話、追蹤?quán)]遞問卷、電子郵件、再次拜訪訪談地點(diǎn)以及通過第一第二聯(lián)絡(luò)人間接轉(zhuǎn)達(dá)這幾種方式。這些無一例外涉及到母體名冊(cè)的準(zhǔn)確性。理論上,大家都相信通過多樣而且不同的聯(lián)系方式,總會(huì)“追蹤”或者“找到”該位被抽樣或者選中的未作答受訪者。但是實(shí)際上,由于母體名冊(cè)的不準(zhǔn)確性,反而使得最后研究數(shù)據(jù)具有高度的“危險(xiǎn)性”。
在《型人》研究之前,充分考慮了以下問題:①輕微錯(cuò)誤的可能性:母體名冊(cè)上充滿了“虛假”信息,當(dāng)時(shí)就有很多人不提供真實(shí)數(shù)據(jù),所以抽樣調(diào)查進(jìn)行到一半,發(fā)現(xiàn)抽樣無效,需要臨時(shí)修改計(jì)劃。②中度錯(cuò)誤的可能性:后來通過上述許多方式,輾轉(zhuǎn)聯(lián)絡(luò)到受訪者,受訪者知道研究者很“較真”所以給予回復(fù),但是里面充滿了涂涂改改的“認(rèn)真”作答,事實(shí)上對(duì)研究者來說,增加了無效問卷率,甚至回答問卷的根本不是其本人。③重度錯(cuò)誤的可能性:研究團(tuán)隊(duì)成員不考慮上述可能發(fā)生的統(tǒng)計(jì)錯(cuò)誤,而把數(shù)據(jù)同其他數(shù)據(jù)一起編入數(shù)據(jù)庫中,等到描述統(tǒng)計(jì)甚至推論統(tǒng)計(jì)都結(jié)束之后,由于理論模型的不穩(wěn)定,導(dǎo)致重新擬合數(shù)據(jù),結(jié)果發(fā)現(xiàn)數(shù)據(jù)庫中出現(xiàn)大量的可能性錯(cuò)誤數(shù)值。此時(shí),需要重新進(jìn)行數(shù)據(jù)清理,從頭分析一遍,還要分析出錯(cuò)誤率(對(duì)比兩次分析的結(jié)果)。而最糟糕的是,如果先前沒有對(duì)初始數(shù)據(jù)存檔,那么連重做的機(jī)會(huì)都沒有,研究者無法進(jìn)行“偵錯(cuò)”與“除錯(cuò)”的工作,導(dǎo)致整個(gè)研究功敗垂成。
5.8如何有效降低抽樣誤差?
在《型人》研究中,采取了以下兩種方式:①使各層的抽樣比例,與母體中國(guó)科學(xué)院研究生院北京地區(qū)的系所結(jié)構(gòu)比例維持均等(等比例),使得樣本問卷調(diào)查對(duì)象的構(gòu)成可使母體構(gòu)成做等比例抽選(比例抽樣法)。因此,誤差會(huì)比單純的隨機(jī)抽樣少。②彈性地改變各層的抽樣比例(不等比例),因?yàn)橹袊?guó)科學(xué)院研究生院北京地區(qū)的各個(gè)系所規(guī)模大小不一,按照學(xué)生人數(shù)規(guī)模大小來改變抽樣比例。規(guī)模大者,抽樣比例就較高。這樣也達(dá)到減少抽樣誤差的目的。
5.9采用何種問卷發(fā)放與回收方式?
在問卷題項(xiàng)測(cè)量方面,《型人》以分類(category)尺度法來測(cè)定調(diào)查對(duì)象的態(tài)度、意見、評(píng)價(jià)、印象等心理層面的反應(yīng)。 采用郵寄問卷法是基于在中國(guó)科學(xué)院研究生院北京地區(qū)進(jìn)行調(diào)查的特殊情況:①因?yàn)檎{(diào)查對(duì)象多半忙于工作,不便或較多不易接受面談法問卷調(diào)查,因此郵寄問卷可以節(jié)省他們的時(shí)間,不需要他們額外拿出時(shí)間與研究者聯(lián)系和等待。②因?yàn)橹袊?guó)科學(xué)院研究生院北京地區(qū)各個(gè)系所的分布并不集中,這使得樣本分布過度分散,唯有郵寄問卷法相對(duì)較為適合在這樣的分布式學(xué)術(shù)機(jī)構(gòu)中進(jìn)行調(diào)查。③中國(guó)科學(xué)院的研究生是在各自相對(duì)獨(dú)立的研究所中學(xué)習(xí)、研究或工作,因?yàn)橹袊?guó)科學(xué)院本身匯集了多所國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室,出入門禁、安全檢查標(biāo)準(zhǔn)、信息保密規(guī)定等,相當(dāng)仔細(xì)與嚴(yán)格,因此如果要訪問某一研究所時(shí),程序相當(dāng)繁瑣,對(duì)調(diào)查多所研究所的本調(diào)查而言,用郵寄法來進(jìn)行調(diào)查較為適當(dāng)。④在缺乏經(jīng)驗(yàn)豐富的調(diào)查員的情況下,郵寄法是減少人力又能獲得可靠信息的有效方式之一。
5.10如何避免無反應(yīng)偏差?
郵寄法的回收率低,容易出現(xiàn)無反應(yīng)偏差(non-response bias),換句話說,郵寄法的受訪者對(duì)調(diào)查主題的興趣會(huì)較容易左右整個(gè)調(diào)查結(jié)果。為了防止這種情況出現(xiàn),當(dāng)初研究采取了幾個(gè)有效方法:①避免使用主題模糊不清的問卷,將主題定義為與研究生相關(guān)的題目“中國(guó)科學(xué)院研究生使用網(wǎng)絡(luò)服務(wù)調(diào)查問卷”增加受訪者參與感。②從“未回卷”的樣本中隨機(jī)抽樣,進(jìn)行當(dāng)面訪談。③使用高回收率的固定樣本(monitor sample)彌補(bǔ)實(shí)查階段的誤差。由于本次調(diào)查之前,研究者參與或者進(jìn)行過3次不同時(shí)間與主題的問卷調(diào)查,因此有建立信任關(guān)系的研究生作為朋友,他們彌補(bǔ)了部分無反應(yīng)偏差所可能造成的調(diào)查誤差后果。
5.11采用何種深度訪談?
當(dāng)初因?yàn)樾枰趩柧碚{(diào)查的基礎(chǔ)上,分析出不同行為的用戶,試圖從這些用戶的訪談中,獲得其行為的原因解釋,所以采用深入面談法。因?yàn)橐话闳藷o法接受長(zhǎng)時(shí)間的面談,但深度面談法需要一段較長(zhǎng)的時(shí)間,所以一方面需要從目的抽樣中選取較大樣本,另一方面也需要從這些樣本的訪談意愿回饋中,識(shí)別適合進(jìn)行訪談的對(duì)象,采取配額法來進(jìn)行目的抽樣。
5.12如何確認(rèn)問卷調(diào)查結(jié)果與訪談?dòng)?jì)劃的緊密結(jié)合?
定性研究可以采用固定問題組訪談(nonscheduled-structured interview)。在《型人》中,調(diào)查問題是根據(jù)問卷調(diào)查結(jié)果而確定的。所以,訪談對(duì)象的選取是根據(jù)問卷調(diào)查分析結(jié)果所歸類的4類用戶群來確定的。不過,訪談問題的表述形式、順序或回答方式等都沒有嚴(yán)格規(guī)定,因此,允許訪談?wù)哂米约旱恼Z言和根據(jù)訪談具體環(huán)境來表述問題,允許訪談?wù)吒鶕?jù)訪談具體環(huán)境來決定問題順序,允許被調(diào)查者用自己的語言和方式來回答問題,允許訪談?wù)邔?duì)不清楚的答案或可能有關(guān)聯(lián)的其他問題作進(jìn)一步的詢問。但整個(gè)訪談要緊密圍繞固定內(nèi)容,所詢問的各個(gè)問題不作實(shí)質(zhì)變動(dòng)。
在匯總資料方面,以表格化的方式整理。除匯總表之外,研究者將每一個(gè)受訪者的回答反復(fù)精確,待對(duì)其生活及行為形成整體印象之后,再結(jié)合數(shù)據(jù)表格及事前假設(shè)等來進(jìn)行分析。事實(shí)上,上述錯(cuò)誤可以出現(xiàn)在任何一個(gè)研究步驟中,唯一能做的就是在研究過程中,詳細(xì)地記錄工作日志以及妥善地保管好每一次的數(shù)據(jù)文檔,然后在研究結(jié)束后,仔細(xì)思考研究過程的細(xì)節(jié)。如果不遵守研究倫理,如果研究態(tài)度很隨意,那么不可能確實(shí)完成整個(gè)研究計(jì)劃。
6合理推論原則
采用合理的競(jìng)替假設(shè)是探索性研究的主要方式之一。當(dāng)研究者要開發(fā)新的研究領(lǐng)域時(shí),常常借由探索性研究產(chǎn)生新的觀點(diǎn),然而它的缺點(diǎn)在于很少能圓滿地回答問題。克服方法就是融會(huì)“假設(shè)驗(yàn)證”和“合理競(jìng)替”兩套完全不同的思路,在《型人》中,因?yàn)榭紤]到探索性研究可以提供的是對(duì)于研究問題的提示以及研究方法的觀察,以確切地回答研究問題,而不能提供絕對(duì)性的答案;所以,在理論建構(gòu)的過程(目前還是假說階段)里,嘗試在后半段考慮方法、程序和人群的影響要素,判斷調(diào)查結(jié)果與之前假設(shè)檢驗(yàn)的對(duì)應(yīng)關(guān)系。
在《型人》后半段中,采用的基本策略是“評(píng)估合理的競(jìng)替假設(shè)”,即檢驗(yàn)和評(píng)估某特定現(xiàn)象是否存在著其他的替代性解釋。此策略的適用范圍不分其資料性質(zhì)為量化或質(zhì)化;不分研究方法的類型是實(shí)驗(yàn)法、橫斷法設(shè)計(jì)、縱貫法設(shè)計(jì)還是個(gè)案研究法;也不分資料收集方法是觀察法、問卷法還是其他。因此在心態(tài)上,預(yù)期有其他詮釋發(fā)現(xiàn)的方法,且視任何詮釋在經(jīng)過進(jìn)一步檢驗(yàn)后都是可修改的。不過,合理的競(jìng)替假設(shè)仍然有一定的推理限制與條件要求。
這種推理與它的“分析單位”息息相關(guān),并且應(yīng)該避免與分析單位有關(guān)的“區(qū)位謬誤”和“化約主義”。分析單位可以劃分為:個(gè)人、團(tuán)體、組織以及人為事實(shí),所以當(dāng)《型人》分析單位是個(gè)人,即每一個(gè)用戶,而不是中國(guó)科學(xué)院或者工程熱物理研究所等組織時(shí),則沒有因?yàn)楦鶕?jù)某個(gè)研究所或團(tuán)體的觀察,來對(duì)個(gè)人作出結(jié)論的“區(qū)位謬誤”的錯(cuò)誤。同理反論,《型人》的研究出于郵寄問卷調(diào)查,回函也僅僅代表一部分人的情況,從這部分人當(dāng)中選擇受訪者進(jìn)行訪談所得出的結(jié)論,不適合推論于所有中國(guó)科學(xué)院研究生或者全中國(guó)人;所以,操作上又將它對(duì)應(yīng)到《型人》前半段的假設(shè)檢驗(yàn)中,通過反例舉證原則,把網(wǎng)絡(luò)用戶行為的“常識(shí)”打破,得出可能具有差異化用戶群體的情況,繼而為后半段創(chuàng)建型人提供理論發(fā)揮的空間。在《型人》后半段中,先考慮到“化約主義”的影響(傾向于認(rèn)定某一個(gè)分析單位或變項(xiàng)比其他分析單位或變項(xiàng)重要或相關(guān),所以如果使用了不當(dāng)?shù)姆治鰡挝粫?huì)造成謬誤結(jié)論),所以采用合理的競(jìng)替假設(shè),從不同的領(lǐng)域?qū)ふ也煌拇鸢福诒姸啻鸢钢校x擇對(duì)研究結(jié)果(證據(jù))最有可能的(likeliest)說明。因此,合理的競(jìng)替假設(shè)不僅僅包括了來自圖書情報(bào)學(xué)的假設(shè)(如信息搜尋行為),也來自于其他領(lǐng)域(如心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、人類學(xué)、教育學(xué)等)的假設(shè)。
換句話說,“合理競(jìng)替”不是按照自己的意思隨意解釋,因?yàn)椤昂侠硇浴辈皇莵碜匝芯空咴趺捶奖憔驮趺聪耄趺聪刖驮趺磳懀趺磳懢驮趺窗l(fā)表,而是“競(jìng)爭(zhēng)”和“替代”的結(jié)果。學(xué)術(shù)理論并非真理,只是相對(duì)合理性,而這種合理性來自辯證和競(jìng)替。如此一來,反復(fù)苛求的結(jié)果就是《型人》研究?jī)r(jià)值與貢獻(xiàn)的最后呈現(xiàn),即完成一套能夠驗(yàn)證和簡(jiǎn)單操作的假說。
7工具:關(guān)于SPSS v12的操作
研究沒有捷徑,唯有多思考、多嘗試、多實(shí)戰(zhàn)。不過,按圖索驥可以節(jié)省部分摸索時(shí)間,以下是整理自相關(guān)教科書,并且在攻讀博士期間(2006-2009年)實(shí)際操作過SPSS v12的筆記。如前所述,工具操作一點(diǎn)也不難,按部就班,即可實(shí)現(xiàn)數(shù)據(jù)和圖表產(chǎn)出。關(guān)鍵是研究倫理與態(tài)度:如果立意良善,即便是簡(jiǎn)單描述統(tǒng)計(jì),也能產(chǎn)出令人尊敬的研究;同理,如果一味強(qiáng)調(diào)應(yīng)用了絢麗的數(shù)學(xué)方程式而忽略了思考樸質(zhì)的研究倫理,則漂亮圖表下的解釋內(nèi)容必定破洞百出。
#61548;簡(jiǎn)單描述統(tǒng)計(jì)
①打開文件
②Statisticsà Summarize à Descriptives
③選擇變項(xiàng),按“szlig;”Variable(s)
④Options à選Statistics的所有選項(xiàng) à Continue
⑤OK
Mean算術(shù)平均值
Variance方差
S.E.mean平均數(shù)的標(biāo)準(zhǔn)誤差
Skewness偏度
Range最大至于最小值的差
Kurtosis峰度
Sum總和
Minimum最小值
Maximum最大值
Std.deviation標(biāo)準(zhǔn)差
#61548;b. 如何知道定類變項(xiàng)和定類變項(xiàng)有無關(guān)系?——卡方分析(不用SPSS)
①與假設(shè)相反的零假設(shè)
②自由度df=(r -1)(c-1)
r行的欄目數(shù);c 列的欄目數(shù)
③根據(jù)df和顯著水平(0.01或0.05或0.1)查“卡方分布表”
④得到“檢驗(yàn)參數(shù)“
⑤利用公式
⑥得到“卡方值”
⑦比較“檢驗(yàn)參數(shù)”和“卡方值”
差距過大,否認(rèn)零假設(shè),從而假設(shè)成立
無顯著差異,支持零假設(shè),從而假設(shè)不成立
#61548;如何知道定類變項(xiàng)和定距變項(xiàng)有無關(guān)系?——單因素方差分析
①打開文件
②Statisticsà Compare Means à One-Way ANOVA
③選擇因變項(xiàng),按“à”Dependent List
④選擇自變量,按“à”Factor
⑤OK
差距過大,否認(rèn)零假設(shè),從而假設(shè)成立
無顯著差異,支持零假設(shè),從而假設(shè)不成立
#61548;如何知道定距變項(xiàng)和定距變項(xiàng)有無關(guān)系?——利用皮爾遜相關(guān)系數(shù)——R系數(shù)
①打開文件
②Statisticsà Correlate à Bivariate
③選擇要分析的變項(xiàng),按“à”Variables
④Correlation Coefficients à Pearson
⑤Test of Significance à Two-tailed
⑥Options à選Statistics的所有選項(xiàng) à Continue
⑦OK
0<[R]<0.3無相關(guān)
0.3<[R]<0.5 低度相關(guān)
0.5<[R]<0.7 中度相關(guān)
0.7<[R]<1高度相關(guān)(可以進(jìn)行一元回歸)
#61548;如何測(cè)量?jī)蓚€(gè)變項(xiàng)的變化趨勢(shì)?——一元回歸
①打開文件
②Statisticsà Regression à Liner
③選擇因變項(xiàng),按“à”Dependent
④選擇自變項(xiàng),按“à”Independent(s)
⑤Method à Stepwise
⑥Standardized Residual Plots àHistogram
⑦OK
#61548;如何描述對(duì)一個(gè)個(gè)體有關(guān)的多個(gè)變項(xiàng)(變項(xiàng)之間不相關(guān))——因子分析、聚類分析
①打開文件
②Statisticsà Data Reduction à Factor
③Descriptivesà選Univariate descriptives、Initial solution、Coefficients、Significance
④Extraction à Principal components
⑤Extract à Eigenvalues over à“>1”
⑥D(zhuǎn)isplay à選Unrotated factor solution、Scree plot
⑦Factor Scores à Save as variables
⑧Method à Regression、Display factor score coefficient matrix
⑨OK
#61548;如何描述對(duì)一個(gè)個(gè)體有關(guān)的多個(gè)變項(xiàng)(變項(xiàng)之間不相關(guān))——聚類分析
② 在因子分析后,獲得“fac1-1”和“fac2-1”
②Statisticsà Clussifyà Hierarchical Cluster à選“fac1-1”和“fac2-1”
③Plotà Dengrogram、All clusters、Verticalà Continue
④Methodà Between-groups linkage
⑤Save New Variablesà Single solution 3 clusters
⑥OK
用戶行為研究的經(jīng)驗(yàn),來自博士研究期間的導(dǎo)師、老師們和朋友們,他們對(duì)研究者產(chǎn)生許多直接和間接的影響。相關(guān)指導(dǎo)性圖書,可以參考張曉林《信息管理學(xué)研究方法》、Earl Babbie《社會(huì)科學(xué)研究方法》等。在3年中,進(jìn)行6次大規(guī)模社會(huì)科學(xué)調(diào)查研究的經(jīng)驗(yàn),雖然只限于位于北京市的中國(guó)科學(xué)院,但是對(duì)筆者日后在香港城市大學(xué)支援經(jīng)濟(jì)金融系的工作、在“國(guó)立”臺(tái)灣大學(xué)的機(jī)構(gòu)排名與科學(xué)家行為研究以及為本土公司和跨國(guó)企業(yè)開發(fā)市場(chǎng)客戶群等工作都有幫助。
雖然終端用戶在各地區(qū)各個(gè)機(jī)構(gòu)的屬性不同、特征不同、行為不同,而且服務(wù)于不同的工作崗位,他們的立場(chǎng)各有不同,但是因?yàn)閷?duì)用戶行為的敏感度高,便能夠快速進(jìn)入研究前沿或者突破市場(chǎng)障礙,在各種職場(chǎng)上貢獻(xiàn)自己的能力,為圖書情報(bào)事業(yè)盡一份綿薄之力。拋磚引玉,是以為文。
[作者簡(jiǎn)介]顧立平,男,1978年生,博士,發(fā)表論文33篇。