許晶晶(上海師范大學圖書館 上海 200234)
?
理工科圖書出版同質化問題研究
——以“C語言”、“C++”及“混凝土結構”圖書為例
許晶晶
(上海師范大學圖書館上海200234)
〔摘要〕文章以“C語言”、“C++”及“混凝土結構”圖書為例,利用內容分析法和直接閱讀法,分別提取出參照樣本和其他樣本圖書同質化的十個指標,為指標設置權重并進行計算,按照計算結果判斷這三類圖書同質化程度,以期為圖書采訪人員工作提供理論依據。
〔關鍵詞〕同質化內容分析法
〔分類號〕G253
〔引用本文格式〕許晶晶.理工科圖書出版同質化問題研究——以“C語言”、“C++”及“混凝土結構”圖書為例[J].圖書館,2016(3):56-59
所謂“同質化”是指同一大類中不同品牌的商品在性能、外觀甚至營銷手段上相互模仿,以至逐漸趨同的現象。出版同質化主要表現在出版產品的內容層次,同一類型的出版產品品種重復,且內容替代性強。圖書出版是高校圖書館資源建設的上游環節,圖書出版狀況的好壞直接影響著圖書采購工作的質量[1]。當代圖書出版的同質化趨勢日益嚴重,圖書質量良莠不齊,選擇高質量異質化圖書成為目前大多數圖書館館藏資源建設的難題。目前,業界有很多成果都涉及到圖書同質化問題,但對于如何利用科學的研究方法判斷圖書同質化程度,鮮有涉及。
計算機類圖書和建筑類圖書是理工科圖書的重要組成部分,近年隨著計算機技術在各行業的日益普及,計算機類圖書成為高校館藏資源建設的重點[1],計算機類圖書同類圖書數量明顯過剩,內容嚴重同質化[2],“C語言”尤甚,因此,本文將“C語言”圖書作為同質化問題研究的第一個案例,再隨機選擇計算機類圖書中的“C++”圖書為第二個案例。而建筑類圖書品種豐富,近年“混凝土結構”圖書數量越來越多,其同質化程度影響建筑類圖書的采購,故本文選擇“混凝土結構”圖書為同質化問題研究的第三個案例。以“C語言”、“C++”及“混凝土結構”三類圖書為例,用實證研究的方法對其同質化程度進行客觀判斷,以期能夠為館藏資源建設提供依據。
2.1數據來源及樣本確定
2.1.1數據來源
考慮到理工科圖書時效性強的特點,本文選擇2010-2014年最近5年的圖書數據。數據源于歷年采訪數據較全面的中標書商的采訪數據,主要有北京人天書店有限公司、湖北三新有限公司、北京百萬莊圖書公司,幾家書商的采訪數據相互補充使得選取的圖書數據較全。
2.1.2樣本確定
對數據以“C語言”為檢索詞進行文本篩選得到772種圖書,對數據以“C++”為檢索詞進行文本篩選得到379種圖書,對數據以“混凝土結構”為檢索詞進行文本篩選得到183種圖書[3]。根據高校圖書館館藏建設:不采購面向高職高專的圖書、不采購考級考證類圖書、不采購習題集及圖集等原則確定研究對象。根據書目上提供的信息或是根據書名信息判斷,進行刪除,具體刪除如下圖書:①各類高職、高專、職業教育、成人教育類教材;②各類職業認證考試、等級考試教材;③各類教學輔導材料、習題集等。 刪除后得到“C語言”圖書536種,“C++”圖書298種,“混凝土結構”圖書137種;并采用隨機抽樣的辦法抽取樣本,在“C語言”、在“C++”和“混凝土結構”圖書中隨機抽取各100種圖書。
2.2同質化影響因素確定
影響圖書同質化的因素很多,主要表現在兩方面,一是書名,二是內容。在抽取樣本時已經對書名進行了限制,如在選取數據時以“C語言”、“C++”“混凝土結構”為檢索詞,所選圖書書名均有“C語言”、“C++”“混凝土結構”關鍵詞,則視為書名同質化。因此接下來重點考慮內容因素。為了便于研究,本文在“C語言”、“C++”及“混凝土結構”圖書樣本中各抽取一本書為參照樣本。
對于“C語言”、“C++”圖書參照樣本的選取,參考“基于引文統計的我國計算機類學術性圖書出版情況分析”一文[2]的研究結果,即計算機類圖書第一核心出版社為清華大學出版社。基于此,用關鍵詞“清華大學出版社”進行刪選,對于刪選結果進行隨機抽樣。在“C語言”圖書樣本中抽取2014年清華大學出版社出版、田麗華主編的《C語言程序設計》為參照樣本(在表1中用“樣本1”表示),在“C++”圖書樣本中抽取2012年清華大學出版社出版、田秀霞主編的《C++高級程序設計》為參照樣本(在表2中用“樣本1”表示)。對于“混凝土結構”圖書參照樣本的選取,參考筆者“基于引文分析的核心作者研究——以建筑類圖書為例”一文的研究結果,即建筑類圖書中“建筑結構”方面核心作者單位主要有大連理工大學、同濟大學等。基于此,用關鍵詞為“同濟大學”進行刪選,對于刪選結果進行隨機抽樣,抽取2011年同濟大學出版社出版、顧祥林主編的《混凝土結構基本原理》(第2版)為參照樣本(在表3中用樣本1表示)。
圖書內容是需要深入挖掘和認真分析的部分,本文采用內容分析法和直接閱讀法來確定內容的要素。“內容分析法是一種對具有明確特性的傳播內容進行的客觀、系統和定量描述的研究技術。實質是對傳播內容所含信息量及其變化的分析。”[4]通過對《C語言程序設計》一書的直接閱讀并用內容分析法分析將該書的內容提取為十個關鍵詞,分別為:C語言概述、數據類型、運算符、表達式、程序設計、預處理命令、函數、數組、指針、文件,將這些關鍵詞設置為:要素一、要素二、……要素十,其余99種圖書(用樣本2、……樣本100表示)同樣依照這種方法設置要素。例如任意抽取2013年電子工業出版社出版、李俊主編的《C語言程序設計》,與參考樣本圖書內容進行對比,對于內容主題相同但是語言表達方式不同的可提取為同一個關鍵詞,對于內容主題不同的可提取為不同關鍵詞。李俊主編的《C語言程序設計》一書第一部分是對“C語言”基本內容的概述,主要內容與參考樣本圖書“C語言概述”主題基本一致,因此該書的第一個關鍵詞提取為“C語言概述”。同樣,通過閱讀發現李俊主編的《C語言程序設計》沒有“運算符”、“程序設計”、“預處理命令”、“函數”、“數組”、“指針”等內容,卻多出了“流程控制”、“基本輸入/輸出語句”等內容,對于與參考樣本圖書內容相異的部分,將關鍵詞提取為“無”。由此確定李俊主編的《C語言程序設計》內容按照參考樣本關鍵詞的順序提取十個關鍵詞分別為:C語言概述、數據類型、無、表達式、無、無、無、無、無、文件。
“C++”圖書關鍵詞的提取方法與“C語言”相同。同理,通過對《C++高級程序設計》一書的閱讀將該書的內容提取為十個關鍵詞,分別為:數據類型、流程控制、函數、數組、指針、結構體、類與對象、繼承、多態、異常處理,并設置為:要素一、要素二、……要素十,其余99種圖書(用樣本2、……樣本100表示)同樣依照內容分析法閱讀全書后設置要素。其余樣本圖書要素的提取與李俊《C語言程序設計》要素提取方法相同。以2013年機械工業出版社出版、溫宇杰主編的《深入實踐C++模板編程》為例,該書內容不涉及“數據類型”、“流程控制”等內容,則十個關鍵詞分別為:無、無、函數、無、無、無、類與對象、無、無、無。
“混凝土結構”圖書關鍵詞提取方法同樣如此。通過對《混凝土結構基本原理》一書的閱讀將該書的內容提取為十個關鍵詞,分別為:混凝土基本性能、軸心受力構件、受彎構件、偏心受力構件、構件斜截面、構件扭曲、構件受壓、預應力、構件使用性能、混凝土結構耐久性,分別設置為:要素一、要素二、……要素十,其余99種圖書(用樣本2、……樣本100表示)同理,與李俊《C語言程序設計》要素提取方法相同。以2014年清華大學出版社出版、李斌主編的《混凝土結構設計原理》為例,提取為十個關鍵詞,分別為:混凝土基本性能、無、受彎構件、無、無、構件扭曲、構件受壓、預應力、無、無。
2.3同質化程度判斷
分析發現影響同質化程度的內容指標,即反映圖書內容做十個關鍵詞(要素一、要素二、……要素十),這些指標為平行關系,對于內容同質化的影響同樣重要,用B1、B2、……B10表示,采用直觀判斷法把B1、B2、……B10指標權重設置為1、1、……1。其余樣本2、……樣本100中指標與樣本1對應位置的指標相同可將該指標權重設置為1,其余情況該指標權重設置為0。例如李俊《C語言程序設計》指標權重為:1、1、0、1、0、0、0、0、0、1;而溫宇杰《深入實踐C++模板編程》指標權重為:0、0、1、0、0、0、1、0、0、0;李斌《混凝土結構設計原理》指標權重為:1、0、1、0、0、1、1、1、0、0。
對于同質化程度的判斷,需要對指標進行權重計算:結果= B1+B2+……+B10,結果<5,視為圖書同質化程度較低;結果≥5,視為圖書同質化程度較高,結果大于5越多同質化越嚴重;結果=10,視為兩本書完全相同。50%的樣本結果≥5則認為該類圖書同質化程度較高,反之則認為該類圖書同質化程度較低,結果≥5的樣本數量越多說明該類圖書同質化現象越嚴重。
3.1“C語言”圖書同質化程度分析

表1 “C語言”圖書同質化程度
根據上述分析列出表1,由表1所示,指標B1同質化達到99%,其余指標分別為:B2 86%、B3 71%、B4 43%、B5 33%、B6 62%、B7 55%、B8 52%、B9 51%、B10 43%。說明“C語言”圖書內容同質化主要集中在B1、B2、B3、B6等幾個方面,指標B1同質化程度最高,指標B5同質化程度最低。這與“C語言”類圖書有關,“C語言概述”是它的基本內容,大部分圖書都會有所涉及,而其他方面的內容如“表達式”等著作過程中會根據側重點不同而有所取舍。70%的“C語言”圖書權重計算結果≥5,因此可以判定:“C語言”圖書同質化程度較高。
3.2“C++”圖書同質化程度分析
以同樣的方法分析列出表2,由表2所示,指標B1同質化達到65﹪的比例,其余指標分別為:B2 57%、B3 35%、B4 65%、B5 51%、B6 48%、B7 15%、B8 60%、B9 53%、B10 48%。這說明“C++”圖書內容同質化主要集中在B1、B4、B8等幾個方面,指標B1同質化程度最高,指標B7同質化程度最低。這與“C++”類圖書有關,“函數述”方面的內容是它的核心內容,而其他方面的內容如“結構體”、“類與對象”等屬于非核心內容,有些作者會舍去。49%的“C++”圖書權重計算結果>5,可以判斷出:“C++”類圖書同質化程度較低。

表2 “C++”圖書同質化程度
3.3“混凝土結構”圖書同質化程度分析

表3 “混凝土結構”圖書同質化程度
以同樣的方法分析列出表3,由表3所示,指標B1同質化達到54﹪的比例,其余指標分別為:B2 18%、B3 54%、B4 9%、B5 40%、B6 43%、B7 9%、B8 31%、B9 3%、B10 13%。這說明“混凝土結構”圖書內容同質化主要集中在B1、B3等幾個方面,指標B1同質化程度最高,指標B9同質化程度最低。這與“混凝土結構”類圖書有關,“混凝土性能”包括物理性能和材料性能等方面的內容是它的基礎內容,而“構件使用性能”等方面的內容很多圖書都不涉及。26%的“混凝土結構”圖書權重計算結果>5,可以判斷出:“混凝土結構”圖書同質化程度較低。
4.1“C語言”、“C++”及“混凝土結構”同質化現狀
統計顯示,“C語言”圖書同質化嚴重,有19%的“C語言”圖書同質化現象非常嚴重,基本達到雷同。統計顯示“C++”類圖書同質化程度雖然較低,但是49﹪的比例接近界定同質化程度高低的臨界值,這說明“C++”圖書目前雖然同質化較低但是有同質化惡性發展趨勢。統計顯示,“混凝土結構”圖書同質化程度明顯較低。
統計結果說明,“C語言”圖書出版質量較低,圖書內容大同小異;與“C語言”圖書相比,“C++”圖書出版質量稍好;“混凝土結構”圖書出版質量相對最好。主要原因有:①“C語言”圖書中學術專著極少,教程類圖書占多數,因此難有創新,不同作者之間相互模仿借鑒,核心內容不變,造成內容上的低水平重復;②研究中涉及到30家以上的出版社,但不同出版社“C語言”圖書內容同質化仍然嚴重,對此出版社負有不可推卸的責任:為了獲取高額利潤,搶占市場份額,走跟風出版的捷徑;對于圖書知識產權的保護不到位等等,缺少高質量的原創圖書。
4.2“C語言”、“C++”及“混凝土結構”圖書同質化對采購決策的影響
為了提高文獻資源的收藏質量,必須采用科學的方法進行篩選,才能保證圖書采購的“全而不濫”。目前,圖書采購方式主要有兩種:一種是以書展為依托,采訪人員根據樣書或庫存進行的現貨采購;一種是以各種書目信息為依托,以書目預訂為渠道的期貨采購。現貨采購無法同時對館藏圖書進行有效對比和分析,往往會造成時間和精力的浪費, 因此在“C語言”和“C++”圖書采購中宜采用期貨采購搭配科學的采購策略,“混凝土結構”則可采用現貨采購和期貨采購相結合的采購策略。
“C語言”圖書同質化嚴重,甚至有雷同現象,采購人員在采購該類圖書時不僅要慎重,還要減少該類圖書的采購。筆者對所在圖書館“C語言”館藏圖書進行了統計,出版時間在2008-2012年的接近百種,說明該類圖書館藏豐富,能夠滿足讀者需求,后期只需部分更新即可;將采購重點放在讀者薦購上,根據讀者的實際需求有效補充館藏,避免同質化帶來的資源浪費。
“C++”類圖書雖然同質化程度較低,但采購人員要注意:認真對比書目信息與館藏圖書信息的異同,借此判斷新書是否與館藏圖書同質化,若是則不予采購,反之則正常采購;可以采用“核心出版社”的方法進行采購,利用既往研究成果,對清華大學出版社、機械工業出版社、電子工業出版社等核心出版社的計算機類圖書進行采購;考慮到“C++”圖書有同質化惡性發展趨勢,采購人員也要適當減少該類圖書的采購。
“混凝土結構”圖書同質化程度較低,采購人員可以根據采購政策正常補充館藏。但是該類圖書的采購對采購人員的知識儲備要求很高,采購人員要熟悉這類圖書內容的知識要點,因此要積極補充這方面的專業知識[5],在知識背景的指導下才能更加科學合理的采購圖書,有效防止入藏圖書同質化的出現。
(來稿時間:2015年12月)
參考文獻:
1.林雅萍, 劉惠敏, 蔡迎春, 等.從出版統計和館藏分析看圖書采購策略 ——以2002-2005年國內出版的計算機類圖書為例[J].圖書情報知識, 2009(3):117-121
2.陸怡洲.基于引文統計的我國計算機類學術性圖書出版情況分析[J].圖書館論壇, 2009(4):165-167,145
3.蔡迎春.回眸與展望:民國檔案學術研究的發展現狀與特征[J].上海師范大學學報(哲學社會科學版), 2015(5):110-117
4.蔡璐.基于學科主題進行細分的高校圖書館館藏質量研究——以高等教育學科為例[J].圖書與情報, 2011(2):118-121
5.吳志榮.論我國圖書館學研究中的外部反思現象[J].上海師范大學學報(哲學社會科學版), 2015(5):103-109
·實證研究·
A Study on the Homogeneity of Science and Technology Books Publication——Taking“C Language”“C++”and“Concrete Structure” as Examples
Xu Jingjing
( Library of Shanghai Normal University )
Abstract〔〕Taking“C language”、“C++”and“concrete structure” as examples, and by content analysis method and directly reading method, this paper respectively extracts ten indexes of reference sample and other sample books and calculates the set weights for indexes according to the calculation results to determine the degree of homogeneity of these books in order to provide theoretical basises for our purchasing personnel.
Keywords〔〕HomogenizationContent analysis method
〔作者簡介〕許晶晶(1982-),女,碩士,上海師范大學圖書館資源建設部館員,研究方向:圖書館知識服務、采訪策略等。