林培德
(廣東省醫學學術交流中心 廣東省醫學情報研究所《廣東醫學》編輯部,廣東廣州510180)
應用大數據思維對科技論文信息價值整合再利用的探討
林培德
(廣東省醫學學術交流中心 廣東省醫學情報研究所《廣東醫學》編輯部,廣東廣州510180)
摘要:應用近年興起的“大數據”思維,從稿件中提取研究類型、基金課題、欄目、所在???、當前身份、所在地等信息,整合并分析這些信息與作者的投稿行為的關系,為科技期刊編輯部辦刊提供數據化的參考.
關鍵詞:大數據時代;科技期刊編輯部;辦刊
2013年十分暢銷的《大數據時代:生活、工作與思維的大變革》指出,在大數據時代,人們不再認為數據是靜止和陳舊的.但在以前,一旦完成了收集數據的目的之后,數據就會被認為已經沒有用處了[1].大數據時代的來臨使人類第一次有機會和條件,在非常多的領域和非常深入的層次獲得和使用全面數據、完整數據和系統數據,深入探索現實世界的規律,獲取過去不可能獲取的知識.例如,2014年初,央視晚間新聞“據說春運”特別節目,首次采用百度地圖LBS定位的可視化大數據,播報國內春節人口遷徙情況[2].目前,大數據時代思維在科技期刊辦刊方面的應用還鮮有報道,對科技期刊編輯出版印刷的革命性影響是否存在、何時到來還是個未知之數.但就筆者看來,大數據主要是大量數據的儲存即再利用,既然已經身處在這樣的時代,不妨應用這樣的思維對科技期刊編輯工作進行再思考.《廣東醫學》從2010年起改半月刊,在國內的省級醫學雜志中,屬于刊期較短的那極少數期刊之一[3],2013年收稿7 800余份,近3年年均收稿量已接近7 000份,應也屬于收稿量較大的那極少數期刊之一[4].對于期刊編輯部,期刊的生命之源就是稿件,筆者認為,面對如此大的數據,對編輯部發展而言應該是一筆財富.現就如何應用大數據思維對科技論文信息價值的整合再利用進行如下探討.
1.1研究類型
根據研究類型不同,大致可劃分為體外研究、體內研究、臨床研究.目前國內科技期刊有4 758本,其中醫學類期刊又占了較大比例,987本[3],差異化發展是必然局面,因此,每本期刊都有自己的選稿偏好.比如廣東醫學編輯部選稿以臨床研究為主,雖然從每期刊發的版面即可體現,但筆者在平時工作中發現還是有相當部分作者投稿前對該雜志知之甚少.如果通過對稿件此項目數據的再分析,發現投稿本身的構成比與每期刊發的研究類型所占版面的構成比有較大出入的話,則應考慮是否調整選稿范圍,或者在《稿約》或者網站適當提醒,引導作者.
1.2基金課題
基金課題按所申請部門的級別可以分為:國際級、國家級、省級、市級.按是個否有基金資助可以分為有基金資助、自籌經費.由于課題申報是有一定審核程序的,如果稿件標記了課題,則提示稿件涉及的研究內容已經經過專家審核,內容具備一定新穎性.并且,從級別以及有無經費資助也可以一定程度再對新穎性做劃分.如果通過對稿件此項目數據的再分析,發現某類課題的稿件少了,可以對此進行分析,是否該課題驗收的要求中,又或者是之前對此課題稿件的處理不當,打擊了作者再次投稿的積極性,進一步總結出原因和相應的應對措施.
1.3欄目
生物醫學類期刊論文按照論著、綜述、短篇3種欄目[5].論著多為前瞻性的研究,或者內容較多且有一定深度的回顧性研究,而綜述多為開展某項研究前對該領域的研究狀況進行一定匯總分析,以找到該選題尚有研究價值的突破口.短篇報道和病例報告多為涉及內容深度較淺或病例數過少無法展開較有說服力的論證,只為及時報道傳播一定信息的文獻類型.由于論著類文章可能閱讀價值總體更大些,所以對來稿構成比的分析上,也應注意按類型進行一定的分析.
2.1所在???/p>
由于傳播閱讀方面的特點[6-7],對于具體從事某??蒲芯康膶W者,中華醫學雜志社各??破诳奈绕渌C合性期刊大,將自己的研究成果在更有利于交流的平臺發表是情理之中.但隨著科學研究的深入,所涉及的面也會更窄,甚至分化出新的學科,對于部分新興學科還沒有對應的??齐s志的情況,較有影像力的綜合性期刊則是他們較好的選擇.因此,作為綜合性期刊,定期分析所收稿件的??品植?,可能有利于爭取優質稿源.另外,由于科技期刊繁多,不同的科技期刊的要求也不完全一致,有時作者會因為較熟悉某科技期刊的流程,而將自己相當一部分的稿件投給該科技期刊,如果科技期刊的處理過程產生了良好的口碑,則可能該專科的同行也會較多考慮該科技期刊作為投稿首選.時刻關注??频姆植?,也有利于排查既往處理稿件有無不當之處,維護刊物在該??漆t生中的口碑.
2.2當前身份
就目前而言,將自己的研究成果總結成一篇科技論文,是一個較為適當的方式,也是目前較多評審里所需考核的環節.因此,了解不同作者的身份,有助于了解目前科技論文在發表交流之外的作用以及趨勢.假如在數據統計時發現第一作者所署單位是高校非教研室、即學生身份者或在職求學者,則提示此科技論文與畢業、學位獲取有較大關系.如果作者職稱是中級或副高級職稱,參照該單位或所在省份晉升職稱的相關要求,則可推測此科技論文是否與晉升職稱有一定關系.而如果是高級職稱或者在單位里擔任一定職務的,則可能此科技論文與年度考慮有一定關系.總之,充分了解科技論文的其他用途,也有利于爭取優質稿源.
2.3所在地
分析稿件作者所在地,與分析稿件作者身份作用類似,也是通過投稿的數量、質量來分析當地的相關政策要求是否對刊物收稿造成影響.其中需要考慮諸如省份、所在工作單位,其中醫院又可劃分為附屬醫院和非附屬醫院,高校以及其他科研院所.如果前后兩年某省份、地區或某高校的稿件較少,則應警惕該地區或單位對刊物的認定出現了變化.
3.1數據的核實
要想得出科學的分析結果,首先肯定需要確認數據的真實性.在日常工作中,筆者發現,可能由于理解上的錯位,有部分稿件的基金課題的標注并不嚴謹,所標課題的研究內容并非所投稿件的核心內容.但由于作者郵寄單位證明和基金批復復印件與編輯部對稿件相關信息的錄入有時間差,所以如果編輯部在查收了基金批復復印件,發現兩者研究內容并不相關,應及時在科技期刊采編辦公系統中進行修正,以利于后期的數據分析.
3.2數據量
顧名思義,“大數據”的分析依據是數據,而且是大量的數據.在接觸這個概念的時候,比如書籍、新聞報道,其中提及的數據分析者均為著名企業.作為單個科技期刊編輯部,從各方面的能力上是無法與那些企業相提并論的.尤其是從數據量上,有著天壤之別,而數據量一旦不夠大,則分析的基礎不牢靠,推理出來的結論適用性和實用性可能會受影響.如果全年的收稿量不多的編輯部,可考慮延長收集數據的時間窗.
3.3數據殘缺
雖然近年來很多同行已經引入了辦公系統,設立了自己期刊的官方網站,但對數據的處理以及獲取仍未重視,目前應用大數據時代思維收集本刊編輯部數據進行分析,為自身發展方面提供依據的探索還鮮有報道.廣東醫學編輯部于2007年啟用科技期刊采編辦公系統,隨后則開始了漫長的登錄官網投稿和電子郵件投稿共存的時期.通過官網投稿的稿件,由于投稿程序相對完整,投稿者提供給給編輯部的數據相對齊全,而且編輯部對重點關注的項目可以通過流程上的設置而讓每個作者在完成投稿之時即提供完整,規范作者的投稿操作.相對而言,電子郵件投稿,在簡化了投稿步驟的同時,也丟失了大量的數據.假如作者通過自己的電子郵箱發送一份電子郵件給編輯部,附件即為其所投稿件的電子版,雖然關鍵的稿件電子版編輯部已經采集完整,但編輯部必須從這份電子郵件提取各種數據填寫進采編系統,鑒于2013年廣東醫學編輯部的收稿量已接近8 000份,如果有一半的稿件的信息需要編輯部去后期補充的話,工作量是巨大的,而在人員相對不足的情況下,電子郵件投稿的稿件,則以殘缺的數據量錄入進了采編系統.需指出的是,對4 000篇稿件相關信息完整的數據進行分析,與對8 000篇稿件中一半的相關信息完整的數據進行分析,雖然工作量可能接近,但是后一種分析效能會較差.
3.4相關硬件的支持
不管是安裝了科技期刊采編辦公系統的各個編輯的辦公電腦,還是維持官方網站運行的服務器以及數據庫,都是不可忽略的硬件支持.在2007年,廣東醫學編輯部購買的全套辦公軟件在當時是相對先進的,但可能軟件在設計之初只考慮了業界大部分編輯部的辦公情況,在本刊編輯部收稿量超過5 000份的時候,科技期刊采編辦公系統的運行已不如當初,數據量的增速與基數已超出了軟件設計之初的范疇,軟件運行報錯、卡頓等情況已時有發生,對編輯部的日常工作造成了不可忽略的影響.而以收稿量穩定增加的態勢,2014年的全年收稿量有可能超過8 000份.并且,軟件設計之初未處于“大數據時代”,可能未考慮編輯部對數據的再利用,所以部分功能仍不完善.是否需要更換能支持大數據量運行的辦公系統是個值得思考的問題.
3.5服務意識的延伸
筆者認為,在投稿環節上體現編輯部的服務意識,是讓作者在投稿操作上減少不必要的操作.作者是可以合理交流的朋友,而不是高高在上的“上帝”,此處的“必要”也應嘗試從編輯部角度進行思考.如果編輯部的工作強度并無法支撐大量殘缺數據的補充錄入,則在投稿時提示作者錄入對編輯部日后發展可能有用的信息,比如前文提及的一些項目,對分析可能用處不大的信息則無需作者填寫.以并不讓作者厭煩的程度讓零散的各位作者花極少的時間補全信息是可取的,“化整為零”的思路是處理此矛盾的關鍵所在.如果說紙稿時代確實難以支持對稿件大數據的分析,只能著眼于具體稿件的認真處理,以此來體現服務意識的話,那么在有條件分析大數據的時代,對來稿數據的科學分析有助于提高編輯部的競爭力,提高編輯部服務作者的能力,才是新時代的服務意識,或者說舊時代服務意識的延伸.
綜上所述,雖然單個編輯部并無法完成像google或百度那種大企業有條件收集大量的數據并進行分析,但是,既然已是“大數據時代”,那么作為科技期刊編輯工作者,完全有必要了解這種思維,思考是否稿件研究、作者信息等數據背后還蘊藏著什么能利于編輯部發展的財富,嘗試運用新事物、新思維為傳統的編輯出版行業添加新的活力.目前同行在此方面的探索還較少,本文的思考可能還有欠成熟的地方,還有待同行們予以指正.
參考文獻:
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].楊燕,周濤,譯.杭州:浙江人民出版社,2012:7.
[2]中國新聞網.央視攜手百度看春運:大數據下的中國人口遷徙[EB/OL].(2014-01-26)[2014-04-20]http://finance.chinanews.com/ it/2014/01-26/5782141.shtml.
[3]郭玉,趙新力,潘云濤,等.我國科技期刊基本狀況統計與分析[J].編輯學報,2006,18(1):1-4.
[4]劉振興,郭志明,萬玉玲.中國科學院科技期刊編輯隊伍的現狀、問題與建議[J].中國科技期刊研究,2007,18(1):34-37.
[5]李宏偉,張威.科技論文題名字數統計分析及建議[J].中國科技期刊研究,2012,23(5):821-824.
[6]王慧瑾,鄧德靈.醫學研究生科研意識狀態分析[J].華夏醫學,2012,25(6):963.
[7]杜利民.科技期刊進行刊后跟蹤報道的研究[J].中國科技期刊研究,2007,18(3):421-423.
(責任編輯:邵曉軍)
中圖分類號:G23
文獻標識碼:A
文章編號:1007-5348(2015)02-0066-04
[收稿日期]2014-09-22
[作者簡介]林培德(1984-),男,廣東汕頭人,廣東省醫學學術交流中心,廣東省醫學情報研究所《廣東醫學》編輯部編輯;研究方向:編輯學.
Methods of Editorial Department of Academic Journals Management in an Age of Big Data
LIN Pei-de
Abstract:Based on recently popular Age of Big Data methods,study patterns,fund projects,columns,departments, identity,and areas were collected from articles.Above information were combined and analyzed,in order to reveal the relations between the behavior and the information,thus to provide digital information for editorial department of academic journals.
Key words:Age of Big Data;editorial department of academic journals;management