摘 要:網絡媒介的發展促進了網絡閱讀的發展,數字閱讀作為一種新型的閱讀形式,其閱讀量的統計方式和方法還未形成標準。文章通過梳理國內外數字產品使用統計指標和方法,以及國內外現有數字期刊閱讀量統計方法,從數字期刊有效瀏覽量的角度,以龍源期刊網為例,提出了關于數字期刊閱讀量的統計路徑及計算方法的構想。
關鍵詞:數字期刊 閱讀量 統計路徑 統計方法
中圖分類號: G255.2 文獻標識碼: A 文章編號: 1003-6938(2012)02-0018-05
Exploring the Statistical Path and Method of the Digital Journal's Reading Quantity
Abstract The development of network medium has promoted the development of online reading, as a new way of reading, the statistical method of digital journal's reading quantity demands forming a standard. This paper taking qikan.com.cn for an example, using the statistical index and method of the digital products both domestic and abroad for reference, and also referring to the existing statistical method of the digital journal's reading quantity, to put forward the conception of digital journal's reading quantity and its calculation method from the angle of efficient page views.
Keywords digital journal; reading quantity; statistical path; statistic method
從20世紀90年代中期開始,個人電腦和互聯網絡在我國民眾中迅速普及。據中國互聯網信息中心(CNNIC)統計,截止到2011年12月底,中國網民規模達到4.57億[1]。這不僅僅體現了信息技術的發展,實際上,計算機網絡應用的大眾化也正在悄然改變著人們獲取信息、學習知識的途徑,也深刻影響著人們的閱讀習慣和思維方式。同時,網絡的蓬勃發展所形成的新的讀者群和內容生態環境,給傳統期刊帶來了巨大的發展空間。根據中國新聞出版研究院發布的《2010-2011中國數字出版年度報告》[2]數據顯示,2010年中國數字出版產業總體收入為1051.79億,其中數字期刊7.49億,這說明數字期刊和期刊數字化閱讀已為廣大讀者所接受。
在這一大背景下,出現了多家頗具規模的專業期刊網絡傳播平臺和眾多的個性化期刊數字化傳播網站,許多期刊在進行傳統出版的同時,也實現了數字化傳播發行,一個新的內容產業已經形成。但是目前為止,在這個領域,還缺乏對數字期刊的發行統計規則,這對行業轉型的把控、產業的估量、著作人的版權收益統計、內容編輯加工質量評估、傳播的人群對象分析等一系列問題顯得缺乏依據,已阻礙了中國數字出版發展的進程,因此需要盡快制定一個統一的標準,對數字期刊的閱讀量進行科學的統計分析,以此促進各方的利益分成,以科學發展觀推進數字出版。
1 目前國內外數字出版物使用/瀏覽統計指標和方法
1.1 網頁瀏覽量的主要統計指標和方法
新聞出版總署2010年發布的《關于加快我國數字出版產業發展的若干意見》(新出政發[2010]7號)[3]文件提出:數字出版是指利用數字技術進行內容編輯加工,并通過網絡傳播數字內容產品的一種新型出版方式,其主要特征為內容生產數字化、管理過程數字化、產品形態數字化和傳播渠道網絡化。只要使用二進制技術手段對出版的各個環節進行操作,應該都屬于數字出版的范疇。因此,數字出版是傳統出版業在內容和形式上的延伸和擴展,不僅大大豐富了出版物的內容和形式,也改變了傳統出版物的生產方式和消費理念,直接創造出一些新的出版媒體形式。
作為開展數字出版的主要平臺,各種類型的網站成為目前較為典型的數字出版物。目前,國際上提供網絡訪問數據分析和統計的網站主要有AC尼爾森、Google analytics、Alexa。從這些網站的排名機制中,可以看出它們并不是單單以網頁瀏覽量(Pageviews)為排名依據,還會考慮到UB(Unique Brower)獨立訪問者、TS(Total sessions)全部會話即網站訪問次數、ASD(Average session duration)平均停留時間、新訪問次數百分比、跳出率、Search%來自搜索引擎的用戶比例等等。所以,網站排名統計方法是多元性、多渠道的,這對數字期刊閱讀量的統計具有一定的參考價值。
1.2 圖書館界對各類電子服務使用情況的統計
《國際圖書館統計標準ISO2789》(以下簡稱《標準》)是國際標準化組織(International Organization for Standardization)與國際圖書館協會聯合會(International Federation of Library Associations)為圖書館統計制訂的國際標準,該標準既規定了傳統圖書館服務的統計測量定義,又從服務類型、使用統計、附加調查方法三方面對電子圖書館服務使用情況提供了標準的統計測量定義[4]。
為了及時了解和掌握圖書館提供的各類電子服務使用情況究竟如何,《標準》從圖書館提供電子服務的利用形式、使用地點和對電子服務的分項數據收集等三方面提供了被認為最能反映圖書館電子服務使用情況并需要測量的數據項。在利用形式方面,《標準》確定了四個核心數據組:任務數(Number of Sessions)、文獻下載數(Number of Documents Downloaded)、檢索記錄下載數(Number of Records Downloaded)和虛擬訪問數(Number of Virtual Visits)。除了這些核心數據組提供電子服務使用基本信息外,圖書館在可能的情況下也應收集一些相關附加的數據。這些附加數據是:任務檢索時間(Session Time)、被拒絕訪問任務數(Number of Rejected Sessions)、檢索次數(Number of Searches)、通過因特網訪問的任務數(Number of Internet Sessions)。上述核心數據項與附加數據項較為清晰地反映出圖書館電子服務不同利用形式的情況,也是圖書館電子服務使用統計的主要內容。另外,《標準》還提出圖書館電子服務要區分三種使用地點。即(1)在圖書館內部使用;(2)雖在圖書館外部,但卻在機構內部或授權范圍內使用;(3)在機構或授權范圍之外使用。通過電子服務三種使用地點的統計數據,能夠進一步了解圖書館電子服務多大程度上擴大了圖書館服務的范圍,在多大程度上增加了市場輻射力。第三,對于各項服務,如OPAC、電子館藏、網站等,由于利用形式和測量方式的不同,還應該分類收集各服務形式的數據。主要包括OPAC數據、電子館藏數據、圖書館網站訪問數據等。
對于圖書館所提供的電子服務,我國圖書館統計標準為GB/T13191-2009,《標準》建議收集以下三種核心數據集:會話次數、下載的次數(細分為內容下載和記錄下載)、虛擬訪問的次數。除了這些提供電子服務利用基本信息的核心數據集之外,《標準》建議盡可能采用其他一些數據收集:會話時間、被拒會話(受阻進入)次數、檢索次數、因特網會話次數??梢?,以上所有的數據都是對圖書館館藏、圖書館網站、聯機目錄和經由圖書館提供的因特網訪問利用的統計,而不統計用戶在圖書館內登錄因特網獲取的公開免費的網絡文獻。
2 數字期刊閱讀量及其統計思路的提出
2.1 數字期刊閱讀量的提出
閱讀是從書面材料中獲取信息的過程,是讀者和文本的對話。閱讀是一種主動的過程,是由閱讀者根據不同的目的加以調節控制的。對于傳統期刊的閱讀,無論是發行者,還是廣告商,都主要以該期刊的發行量為考量指標。同理,對于數字期刊的閱讀,主要是考量閱讀主體(讀者)與數字化文本相互交流信息與知識的程度,也即數字期刊中數字內容被網民獲取的信息量多少。通過前面對網頁瀏覽量以及圖書館各類電子服務使用情況的統計,可以看出,對于數字內容而言,瀏覽量與閱讀量還是有所不同的。由于瀏覽包括主動、被動瀏覽(如自動彈出網頁等),瀏覽時讀者對呈現內容的接受程度也有所不同,因此,本文建議將“有效瀏覽量”與“閱讀量”等同起來,如在讀者進行數字期刊瀏覽時,只有進行有效的瀏覽,才可以作為數字期刊閱讀量進行統計。
為了做到數據的科學性和全面性,在數字期刊閱讀量這一計算體系中,核心是“付費點擊”,也就是說,只要是用戶通過付費模式的點擊都可以成為數字期刊閱讀量的有效組成部分。另外,點擊瀏覽量,包括搜索引擎抓取數字期刊服務提供商的相關頁面的點擊次數(是指網絡用戶通過搜索引擎而找到的相關雜志付費頁面),也應該成為期刊網絡閱讀量的有效組成部分。
2.2 國內外數字期刊閱讀量統計方法概覽
在MPA美國雜志發行公會的統計中,期刊的網絡閱讀量主要是指通過網絡發行的原貌版電子期刊的總量。蘋果公司是在2010年4月發布IPad的,而美國發行調查局(Aduit Bureau of Circulations,簡稱ABC)在IPad發布前,就意識到了IPad將給數字報刊領域帶來巨大的影響。于是,在2010年的3月15日,ABC就提前修改了自己對“數字報刊閱讀量”的定義,以適應IPad為數字報刊行業帶來的變化。ABC的規定是:只要包含印刷版的所有內容和廣告,付費數字報刊用戶就可以計入報刊閱讀量。而之前的規則是,數字報刊的內容只有與印刷版的報刊完全相同,才能被計入閱讀量。
根據ABC的規則,統計數字報刊閱讀量有兩個必要條件:內容(包括文字和圖片)和廣告。之前,雖然有一些報刊可以在亞馬遜Kindle上閱讀,但是并不被計入到它們的有效閱讀量中,原因就是它們不具備廣告。紙版雜志上的小廣告,如分類廣告,或者是不超過版面1/3大小的廣告,可以不出現在雜志的數字版上。只要保證電子版上必須出現紙質版的廣告,那么數字版雜志同樣可以刊登紙版雜志上沒有的廣告。
網絡電子資源在線使用統計標準COUNTER的開發源于英國的PALS。2002年3月,在AAP、ALPSP,ARL,ASA,BIC/ED IT EUR,JISC,NCLIS,NISO,PA,STM等專業研究機構以及Blackwell Publishing, EBSCO, Elsevier Science, ProQuest, Oxford University Press等國際著名出版商的支持下,正式開展網絡電子資源在線使用統計標準COUNTER的研究。2002年12月,發布了COUNTER工作規范的第一個版本,該版本主要用于期刊和數據庫在線使用統計信息的記錄和交換。其工作規范的主要內容包括:定義用戶計量的術語和數據元素;定義期刊和數據庫使用報告的內容和格式;定義數據處理和審計要求;明確使用的指導原則等。其用戶對包括圖書館、出版商、聯機銷售商及其它中介服務機構。COUNTER工作范圍建立在現有的一些研究倡議和標準的基礎之上,主要有:ARL NEW Measures Initiative、ICOLC Guidelines for Statistical Measures of usage of Web-based Information Resources、NISO Forum on Performance Measures and Statistics for Libraries and NISO Standard Z39.7[5]。
2.3 國內數字期刊閱讀量統計方法
在目前國內從事期刊數字出版的行業有中國知網、萬方、維普、龍源、悅讀、讀覽等企業,作為國內數字期刊的領跑者之一,龍源期刊網積極參與、促進期刊的網絡傳播,在多年的發展中,龍源從2005年開始每年10月份對過去一年各刊的訪問進行統計分析,并做公開發布,從而形成了龍源期刊TOP100文章排行榜、TOP100期刊排行榜等數據.同時,龍源還依靠強大的技術支持,為3000多種合作期刊定期提供詳細的內容傳播數據。這些數據均來自于計算機網絡系統對用戶閱讀行為自動進行的統計,科學、客觀、真實。
龍源期刊網在向社會開放的內容具有豐富多彩的呈現方式,可以大大豐富讀者的閱讀體驗。比如,原文原貌版,保留了雜志原有版式,用戶可以翻頁閱讀,仿佛一冊在手。另外還有文本版,文本版則將雜志中的文字還原到網頁上,可以復制、粘貼,保留每一篇文章和重要的圖標和圖片,最適合邊閱讀、邊收藏的網絡讀者。人聲語音版充分利用網絡多媒體的特色,聘請電臺專業的播音員把優秀的雜志內容變成可用手機、MP3、MP4下載的有聲雜志,可以向無暇上網的人以及盲人提供服務。此外,還有手機版和PAD版閱讀。其中,用戶在閱讀原文原貌版時,可以進行瀏覽,也可以放大閱讀。在龍源期刊網的顯示數據中,放大閱讀量即為用戶付費整刊閱讀量,瀏覽量是用戶點擊瀏覽雜志的數量(除封面外用戶只能放大瀏覽四頁)。用戶在閱讀文本版時,有文本全文閱讀和片段閱讀兩種模式,與原貌版閱讀類似,全文閱讀為付費閱讀,而片段閱讀是用戶對文章的一部分進行瀏覽(在龍源期刊網中,片段瀏覽字數是全文首字起到300字之后的第一個句號止)。另外手機版閱讀則是指對期刊的付費閱讀。
其中,用戶在龍源期刊網上付費點擊的期刊次數包括對整本刊物(原貌版)的付費點擊次數、對期刊中單篇文章(文章版)的付費點擊次數、以及對其他類型(語音版、手機版等不同產品版本)的付費點擊次數之和,這些都是基于服務器的技術統計數據經過精確的計算而生成的;對于讀者的點擊瀏覽,龍源認為,網絡閱讀量不能沿襲傳統紙媒的算法——賣掉一本算一本,網絡閱讀過程中不管讀者有沒有購買,他封面看到了、目錄看到了、甚至每篇文章的開頭看到了,雖然沒有看到全文,但是達到了一定傳播效果,這個也應該算作一種閱讀,與付費閱讀的閱讀量若作區別的話,可稱之為次有效閱讀量。
故用戶在龍源期刊的閱讀量由兩部分組成:一是有效閱讀量,即用戶在期刊網上付費點擊的期刊次數;另一種是次有效閱讀量,即讀者點擊瀏覽次數,其中包括讀者通過搜索引擎抓取的龍源相關頁面從而進行點擊的次數。其中,用戶在龍源期刊網上付費閱讀的期刊次數包括對整本刊物(原貌版)的付費點擊次數、對期刊中某篇文章(文章版)的付費點擊次數、以及對其他類型(語音版、手機版等不同產品版本)的付費點擊次數。而用戶在龍源期刊網上點擊瀏覽的期刊次數包括對整本刊物(原貌版)的瀏覽,對期刊中某篇文章(文章版)的片段閱讀次數。龍源在統計其期刊的閱讀量時,會根據讀者瀏覽的“有效性”,綜合考慮這兩種閱讀量數據。
總之,以上的幾種統計方法,對我們開展數字期刊閱讀量的統計具有一定的借鑒意義。但是,對于數字期刊瀏覽量以及閱讀量的統計和評價,不管是龍源期刊網還是相關業界目前并沒有較為科學和權威的標準。數字化內容的瀏覽與閱讀量之間有何關系,如何較為科學地統計數字期刊的閱讀情況?本文,將以龍源期刊網為例,對數字期刊閱讀量統計方法提出構想。
3 數字期刊閱讀量統計方法的構想
3.1 數字期刊閱讀量統計要素組成
根據對龍源期刊網數字閱讀數據分析可以看出,不管是文本版閱讀還是原貌版閱讀,有很大一部分用戶會選擇片段閱讀、期刊瀏覽。根據前面我們對數字期刊閱讀量概念的界定,數字期刊閱讀量主要是考量閱讀主體(讀者)與數字化文本相互交流信息與知識的程度,也即數字期刊中數字內容被網民獲取的信息量多少。因此,除了全文閱讀文本版期刊文章、整本下載閱讀原貌版文章以及手機閱讀文章的數量外,讀者對期刊文本片段的閱讀量以及對期刊原貌版的瀏覽量應該也成為數字化產品閱讀量統計的有效組成部分。
通過前面的論述可知,目前國內外對于如何統計數字內容產品(如網頁)的瀏覽量,已有一些較為公認的方法和指標,那么,如何對瀏覽的“有效”性進行考量,即對本文提出的“數字期刊閱讀量”進行統計,是本文要研究的重點。筆者認為,數字期刊閱讀量的統計,應以人們閱讀數字期刊中的文章數為基本單位,包括對整本刊物(原貌版)的付費點擊次數、對期刊中某篇文章(文章版)的付費點擊次數、對其他類型(語音版、手機版等不同產品版本)的付費點擊次數以及用戶對期刊中某篇文章(文章版)的片段閱讀次數、對整本刊物(原貌版)的瀏覽次數等各種要素。
3.2 數字期刊閱讀量統計公式
前面提到,龍源期刊網目前統計數字化產品閱讀量的方式是以付費與否為取舍標準的,這從TOP排行的角度,有一定的道理。但作為數字期刊的閱讀量統計方式,有必要提出一種更為全面的統計方法來計算數字期刊的閱讀量。
前面,我們已經提出數字期刊閱讀量的概念。這里將對期刊閱讀量的計算方法給予說明。
由于數字期刊閱讀量以文章數為基本單位,對于龍源期刊網相關的換算,可以分為兩類,一類是關于原貌版的換算,包括對整本刊物(原貌版)的付費點擊次數、整本刊物(原貌版)的瀏覽次數進行換算,另一類是對文本版進行換算,即對某篇文章(文章版)的片段閱讀次數進行換算。首先,對原貌版進行換算:
(1) 對整本刊物(原貌版)的付費點擊次數的換算。一本期刊一般會有40-50篇文章,但針對某一本期刊,文章數各不相同,用系數λ表示。
(2) 對整本刊物(原貌版)的瀏覽次數進行換算。龍源期刊網上對于原貌版整本刊物的放大閱讀除封面外只能有四頁,把其換算成期刊數,應為■。再根據我們對于原貌版整本刊物的換算方式,把原貌版瀏覽次數換算成數字期刊閱讀量應該是■。那么,對于一般的原貌版期刊,其數字期刊閱讀量是■。
(3) 對某篇文章(文章版)的片段閱讀次數的換算。龍源期刊網上的片段瀏覽字數是全文首字起到300字之后的第一個句號止,根據這一情況,取一個中間值350字。針對每一篇不同的文章,字數各不相同,所以用變系數來表示某篇文章片段閱讀次數的換算:■。那么,對于一般的文章版期刊,其片段閱讀次數是■。
另外,由于語音版的數據非常少,不將其作為計算數字期刊閱讀量的組成成分。
那么,整本刊物(原貌版)的付費點擊閱讀與整本刊物(原貌版)的瀏覽次數之和換算成閱讀文章數即為原貌版的有效閱讀量,期刊中某篇文章(文章版)的付費點擊次數與期刊中某篇文章(文章版)的瀏覽次數之和即為文本版的有效閱讀量,二者之和再加上手機版的付費點擊次數即為期刊的有效閱讀量。
用字母表示數字期刊閱讀量的計算方式,其中,
Q:數字期刊閱讀量
A:期刊中某篇文章(文章版)的付費點擊次數
B:期刊中某篇文章(文章版)的片段閱讀次數
C:整本刊物(原貌版)的付費點擊次數
D:整本刊物(原貌版)的瀏覽次數
E:其他類型(語音版、手機版等不同版本)產品的付費點擊次數
λ:對整本刊物(原貌版)的付費點擊次數的換算系數
由此得出數字期刊閱讀量的計算方式為:
Q=A+■B+?姿C+■D+E
4 結語
本文以龍源期刊網為例,對其數據進行分析,從數字期刊的有效瀏覽量的角度,提出了數字期刊的閱讀量的概念以及計算方法。這對于制訂數字期刊閱讀量的統計標準,具有一定的借鑒意義。但由于數字閱讀是一個涉及讀者分布的區域性、讀者閱讀的目的性、原刊品牌影響力、期刊的產品形態、網絡推介方式以及期刊收費情況等因素的復雜系統,因此本文對其閱讀量的統計只涉及了讀者對期刊文章的直接點擊情況,對數字內容提供商提供服務的類型和方式,以及讀者對數字期刊的利用形式、閱讀的地點以及閱讀路徑等因素及其影響還未涉及。這也為今后數字期刊及其他數字出版物閱讀量的統計路徑及方法的完善提供了新的思路和視角。
總之,標準化數字期刊閱讀量的統計方法,不僅可以擴大期刊營收的市場份額,同時也是期刊業走數字化出版之路的必然要求,它對于期刊社在互聯網環境下吸引新生代讀者和廣告主,以及圖書館進行數字內容服務使用情況統計、用戶分析和開展相關研究等都頗有意義。
參考文獻:
[1]CNNIC發布《第29次中國互聯網絡發展狀況調查統計報告》[EB/OL].[2012-01-29].http://www.cnnic.net.cn/dtygg/dtgg/201201/t20120116_23667.html.
[2]2010-2011中國數字出版年度報告[EB/OL].[2012-01
-29]. http://wenku.baidu.com/view/96aa8b0202020740b
e1e9b89.html.
[3]版署關于加快我國數字出版產業發展的若干意見[EB
/OL].[2012-01-29]. http://www.techweb.com.cn/news/2010-09-16/683222.shtml.
[4]金明華.國際圖書館統計標準ISO2789:2003(E)電子服務使用統計評析[J].現代圖書情報術,2006,(1).
[5]National Information Standards Organization[EB/OL].[2012-01-29].http://www.niso.org/home/.
作者簡介:陳丹(1969-),北京印刷學院新聞出版學院教授,研究生導師,研究方向:數字出版,數字閱讀;楊萌(1987-),北京印刷學院2011級傳播學研究生。