文/李 靜
2019年2月,某獲得博士學位的影視明星在直播中以一句“知網是什么”陷入輿論風波。受其牽連,作為當前我國學術期刊數據庫領域的領軍者,中國知網(以下簡稱“知網”)也隨即引發輿論關注。有媒體及網民質疑知網的壟斷地位及其所謂的霸王條款,還有其給知識傳播及學術論文版權帶來的損害。對于這起事件,我們不應只停留于質疑的表面,更要深入到整個行業去觀察,探討學術數據庫領域當前面臨的普遍性問題,并尋求合理的解決方案。
盡管數據庫已經不是新鮮事物,但從國內外法律法規以及規制來看,其概念尚無統一界定。1992年的伯爾尼公約備忘錄里最早提及了數據庫,并把數據定性為“信息(數據、事實等)的編纂物”,至于表現形式則“不論其是以印刷形式、計算機存貯單元形式還是其他形式存在”,這一描述并沒有明確提及數據庫的表現形式,只是一個大致的概念界定。
同年,歐共體委員會通過的《關于數據庫版權指令草案》對數據有更加清晰的定義。這一草案把數據庫定義為“一種作品、資料的集合,按電子形式組織、存貯、檢索以及用于操作數據庫所需的電子型資料”。顯然,這一定義把數據庫限于“電子型”,不再包含傳統的印刷出版型數據庫。而且,這一草案還明確提出了詞表、索引、提供信息的系統等互聯網數據庫的基本形式,在互聯網尚未高度發達的年代,做出這一定義十分難得。
我國相關法律對數據庫以描述性文字為主。在著作權法中,與數據庫有關的提法是:匯編若干作品、作品的片段或者不構成作品的數據或者其他材料,對其內容的選擇或者編排體現獨創性的作品,為匯編作品。如果以這條規定為依據,那么我國數據庫的版權保護主要是作為一種“匯編作品”存在的,版權由匯編者享有,這一法律界定某種程度上對當下數據庫的版權爭議有著直接影響。
在學術上,我國有學者對數據庫提出了各種不同的定義。總體來看,主要圍繞集合、電子等關鍵詞展開。所以,我國對數據庫的理解符合當下數據庫的普遍形式,即互聯網建立的數據庫。
經過20多年的發展,我國學術數據庫已經基本成熟,并形成了較為穩定的競爭格局。筆者認為,當前我國學術數據庫處于“3+1”的競爭格局中:3是指知網、維普、萬方,號稱中國數據庫“三駕馬車”;1是指國家哲學社會科學學術期刊數據庫,盡管是新興的數據庫,但其意義重大。
在“三駕馬車”中,就收錄范圍來看,知網無論在期刊種類、引文數量、更新周期、用戶規模等方面都占據著絕對的優勢,目前已經建成世界上中文全文信息量最大的 CNKI數字圖書館、中國知識資源總庫、CNKI網絡資源共享平臺,成為國內數據庫行業的領軍者。相比之下,萬方數據庫的優勢在于全文數據國際戒規性好,而維普數據庫的特點在于收錄量大、范圍最廣、標引質量高。不過,總體來看,維普和萬方的影響力較弱。
在較長一段時期內,知網、維普和萬方領跑于學術型數據庫,但隨著數字化出版的發展以及知識、學術的公益性色彩,三者的產業化運營模式及壟斷性弊病開始顯現。在此背景下,由中國社會科學院調查與數據信息中心建設的國家哲學社會科學學術期刊數據庫于2013年正式上線,如今已經建成為一個國家級、公益性、開放型的國家哲學社會科學數據庫,這一數據庫全部免費使用,公益色彩十分明顯。
數字化出版的大趨勢下,未來的圖書、學術期刊等必然會更加重視數據庫平臺,數據庫建設也顯得愈加重要。而當前我國在數據庫建設領域,盡管已有幾家發展得不錯,但是在版權方面存在的問題已經成為輿論關注的焦點,并成為數據庫發展的瓶頸。從當前形勢來看,其過度商業化和壟斷格局是我國學術數據庫面臨的兩個主要問題。
1.公益事業商業化運作的費用之爭。學術論文屬于公共知識資源,具有公益性的特征。為了保障學術資源能夠為公眾所獲取,真正服務公眾,理當從市場行為角度對數據庫進行一定的約束,避免數據化進入純商業化運作。然而,目前幾大數據庫幾乎都是商業化運作,在收費上引發輿論廣泛質疑。
知網之所以能夠建立龐大的數據庫,主要原因在于它是國家知識基礎設施,并借此以低價獲取國內絕大多數期刊的學術資源。憑借著這些學術資源,知網進行全盤商業化操作,不僅數據庫變現,而且還向其用戶收取較高的閱讀費用,甚至設定最低充值額度,獲取利潤。根據媒體公開報道,知網的漲價幅度每年都在10%以上,多年來毛利率高于50%。北京大學曾宣布知網即將停用,原因正是“數據庫商漲價過高”。同時,知網收費模式也引發用戶的不滿。2018年,蘇州一名大學生因知網最低充值額度的霸王條款,將中國知網訴諸法庭,可見這一矛盾已經逐漸進入白熱化。
2.壟斷格局之下作者的權益保護難。在當前我國的數據庫格局中,知網無疑已經是規模最大、內容最全的學術數據庫,占據了學術數據庫的市場支配地位,處于實質性的市場壟斷狀態。在壟斷格局之下,作者的權益幾乎得不到保障。在知網在低價收購學術期刊資源后,期刊一般會在刊物上明確表示,作者同意在其刊物上發表文章,就意味著同意版權歸屬雜志社。對于作者來說,有的可能獲得雜志社少量稿酬,有的甚至沒有稿酬,但文章發表之后會統一上傳知網,知網以閱讀卡代替稿酬支付作者。整個過程中,作者始終處于被動局面。
知網的壟斷地位及其做法,涉嫌以不公平的低價購買商品行為,引起了輿論質疑。事實上,知網壟斷現象并非個案,如美國的lexis、荷蘭的愛思唯爾,都具有一定的壟斷地位。但之所以沒有產生類似知網面臨的爭議,是因為上述國家均有一個公平競爭的數據庫發展環境,有利于知識的傳播和管理。所以,要保障作者的權益,維護消費者利益,就需要建立起一個公平競爭的環境,彰顯學術數據庫的公益性。
隨著數據庫的發展和科研隊伍的壯大,數據庫所涉及的各種版權問題已經到了必須解決的時候。特別是在信息化和數字化出版的大趨勢下,面對社會輿論的質疑和公眾的期待,學術數據庫應進一步強調學術數據庫的公益屬性,加快開放獲取平臺建設,加強對知識生產者權益的保障。這也將是學術數據庫發展值得探索的發展方向。
1.在推動數據庫發展之時,必須考慮到其公益屬性。學術性數據庫不同于其他數據庫,具有強烈的公共服務屬性,是學術研究和公眾獲取知識最為重要的信息來源基地。因此,在發展學術數據庫時,必須要保障其公共屬性,在這點上,國家哲學社會科學學術期刊數據庫的運行是一個積極信號。
在未來的發展中,有必要考慮把學術數據庫納入到公共文化體系建設之中。尤其部分學術期刊是在財政資金支持下運行的,其成果應普惠于學術界和社會公眾。學術數據庫作為學術期刊的集散地,其盈利方式不能以這些資源為主,而應探索建立在學術期刊資源基礎上的其他商業價值開發。
2.要加強對知識生產者的權益保護。當前學術界對數據庫的研究,大多集中在對數據庫運營方、制作者的版權保護上,而對數據庫的數據來源,如學術期刊、學術論文作者的權益保護少有研究。事實上,相比于數據庫自身的版權保護而言,其數據來源方的權益保護更處于弱勢狀態,需要相關政策法規予以一定程度的保護。
在具體做法上,首先是要打破壟斷競爭格局,推進數據庫的多元化、多樣化發展。其次,在未被壟斷的基礎上,改變數據庫與雜志社、數據庫與作者、雜志社與作者之間的霸王條款,讓雜志社、作者有更多的選擇空間,而不是被動接受數據庫提出的各種要求。
3.要加快推進開放獲取平臺(OA)建設。為了打破出版單位對科技知識的壟斷,使其得到廣泛傳播,國際科技界于21世紀初提出了科技信息開放獲取的理念。相比傳統的學術出版,OA期刊強調開放傳播,用戶通過互聯網可以免費閱讀、下載、復制和傳播作品。
這一理念有助于提升學術期刊的影響力和學術成果的傳播,因此在世界范圍內迅速推廣,如今已有250多家機構加入,我國也建立起了“中國科技期刊開放獲取平臺”。在未來的學術數據庫發展中,有必要在已有的三大數據庫中推行“開放獲取”理念,同時加快人文社會科學領域的開放獲取平臺建設,以此促使學術數據庫真正服務于公眾。當然,在這一過程中,也要注意其在國內面臨的“水土不服”困境,從認知、經費、人員、平臺、政策等方面不斷進行完善。
總之,學術論文與學術數據庫是公共知識資源。在發展學術數據庫之時,不僅要考慮通過市場運作,推動數據庫繁榮發展,更要牢記學術數據庫的公益屬性。作為學術數據庫,要考慮自身商業法則,也要充分保障各方利益;而作為頂層設計,相關管理部門應不斷完善政策法規,并探索建立開放獲取的學術期刊數據庫。