聶靜 沈菁


摘要 數字出版技術的飛速發展,日益強化對辭書版權的保護力度。以信息網絡作為產品傳播途徑的數字出版技術,已經能夠有效地保證對辭書的使用必須事先獲得權利人的授權;有效防止對整部辭書的非法復制;嚴格監控對辭書條目的分批復制,及時制止惡意復制傾向;對侵權者不惜成本、用原始手段抄襲辭書條目的行為,也能較便捷地查核??梢哉f,隨著現代數字化信息技術的快速發展而形成的數字出版方式,已經能夠為數字化辭書提供比紙質辭書強大得多的版權保護支持。
關鍵詞 數字出版 信息技術 辭書 版權保護
關于數字出版,目前國際上還沒有一致公認的定義。在我國出版界,較為通行的觀點認為“數字出版是指利用數字技術進行內容編輯加工,并通過網絡傳播數字內容產品的一種新型出版方式”(新聞出版總署《關于加快我國數字出版產業發展的若干意見》)。筆者也認同這一觀點,所以,下文的“數字出版”都僅指上述意義上的出版方式。
數字出版的產品采用的是符合國際標準的編碼數字形式,不需與具有一定外在形態的物質載體固定在一起。出版者將各種信息(文字、圖片、聲音、活動影像等)轉換成編碼數字集合體,再以數字流的形式傳輸給消費者。消費者接受、使用數字出版產品,都需要利用自己預先配備的電子設備進行解碼,把編碼數字還原成人可以感知的信息形式。通俗地說,數字出版是“只售內容,不賣載體”。這與其他各種出版物的銷售是根本不同的。
不少人認為,數字化的辭書具有無損復制、易于分發等重要特征,因此容易被人隨意非法復制并通過各類信息網絡分發、傳播,這必將給辭書作者和出版者造成嚴重的損失。然而筆者以為,隨著現代數字化信息技術的快速發展而形成的數字出版方式,已經能夠為數字化辭書提供比紙質辭書強大得多的版權保護支持。本文試對此進行分析,以求教于方家、學者。
一、數字出版能保證對辭書的使用必須得到授權
數字出版能通過數字版權管理(Digital Rights Management,以下簡稱DRM)系統對辭書的使用進行控制。這一系統依靠數據加密、訪問控制、身份認證、密鑰管理等一系列技術手段,只允許得到合法授權的消費者使用相應辭書。
DRM系統采用密碼學原理,將數字化內容打包、加密,使之成為標準DRM內容格式文件。這種文件須利用相應的密鑰解密后,才可以反轉為人類感官能夠辨識的信息內容。數字辭書上網之后,DRM系統還能夠控制消費者對該辭書的訪問。消費者如果要查閱某種辭書,必須先向DRM系統的“許可證管理”子系統提出申請并履行一定手續(如付費),才能得到密鑰和授權證書,同時系統自動將消費者的身份信息和終端設備信息記載在案。消費者使用某種辭書時,DRM系統首先根據由消費者所登錄的“DRM代理”子系統發來的密鑰、消費者身份及其終端設備信息,判斷該消費者是否有權使用這種數字辭書。如果判斷結果為“否”,系統就會自動拒絕消費者的登錄請求;如果結果為“是”,系統便自動創建版權對象。版權對象的作用是根據授權證書的描述對有關辭書內容的使用權利進行限定。版權對象中也包括內容密鑰,以保證消費者只有拿到相應的“鑰匙”才能開啟對應的內容。版權對象本身也由DRM系統加密,以防止他人非法修改授權的種類和范圍。在版權對象創建后,系統應消費者的請求將有關辭書的內容打包,與版權對象一起,通過一定的機制、形式傳遞給“DRM代理”子系統,再由“DRM代理”解析、解密內容并提供給消費者使用。這個過程大致如圖1所示。
由上可見,出版者將數字出版產品傳輸給獲得有效授權的消費者時是“一對一”地嚴格定向的,授權過程相當嚴密。傳輸過程中承載數字流形式產品的臨時物質載體是電流、光電波或電磁波,而傳輸過程結束后,相應的編碼數字集合體在臨時物質載體上就不再存在,任何第三方都不可能接觸到。至于在消費者自備的終端設備上,相應的數字出版產品是僅僅臨時存在還是可永久存儲,可由出版者利用數字技術實現有效控制。這就可以有效地保證使用數字化辭書的消費者都是獲得合法授權的,從而保證辭書著作權人和出版者的利益不受侵害。同時,雖然過程繁復,但因為都是由計算機系統自動完成的,不需人工處理,并且數據量小,所以速度很快,營運成本也非常低廉。
二、數字出版能對整部辭書的版權實現保護
辭書版權保護的重要作用之一,就是防止非法復制(包括打?。绕涫欠乐箤φ哭o書的非法復制。采用電子出版物形式(即知識內容、消費者操作系統和載體都結合在一起銷售的產品)出版數字辭書,數字辭書遭受盜版的危險性非常大。當年光盤版《中國大百科全書》被非法復制的不幸遭遇,辭書界人士都還記憶猶新?,F在,數字出版可以有效防止整部辭書被非法復制。
消費者對辭書的正常使用,一般都是查閱其中的某些條目,而不是通讀整部辭書。因此,利用與“云技術”相結合的數據庫出版技術,是辭書數字出版的主要方向。在這種出版環境中,消費者可以從儲存海量信息的在線數據庫中選擇獲得自己所需要的信息,但是不能獲取數據庫的全部內容。
出版者可以把定稿的辭書內容進行數字化結構標引,建立基礎數據庫,并通過統一規范的平臺管理和運營。目前,主要采用“可擴展標記語言”(Extensible Markup Language,以下簡稱XML)對數字內容進行結構化標引。XML是國際上通用的標引工具,具有良好的自描述性、可擴展性等優點,可以對異質的多個數據源進行結構化,以統一的數據格式重現給讀者。同時,標準化的數據庫內容,便于實施查詢、插入、更新、刪除等操作。
運用與云技術相結合的數據庫出版方式,能使辭書的每個條目都相對獨立地存在于數據庫中,儲存在出版者的服務器上。消費者使用辭書時,服務器的數據庫搜索查詢系統按照查閱需求,只把相應的一個或若干個條目的內容加密后發送到消費者終端設備,而不會顯示整部辭書的結構和所有條目的內容。同時,出版者服務器發送的內容僅僅是臨時性地進入消費者終端設備內存并在屏幕上顯示,當消費者退出閱讀界面后,內存中的信息即自動清除,不能長久保存。就是說,消費者通常不可能把整部辭書下載并保存到自己的終端設備上。此過程如圖2所示。
這樣,未得到作者或出版者授權的任何人就難以擅自復制某種數字化辭書的全部內容,甚至由于不能觀看到整部辭書,所以連剽竊辭書的總體框架結構都是很難的。
相比紙質辭書或光盤版電子辭書經常被人輕易地整書復制的高風險,數字出版技術對辭書版權的保護無疑有巨大的進步。
三、數字出版能對辭書內容的部分復制進行有效監控
辭書中的條目具有相對獨立性,除了少量的副條(參見條)外,絕大部分正條能夠對某個知識點或信息項提供相對完整的解釋,具有知識自足性。所以,辭書條目常常能夠獨立使用,而依據某種特點選擇一定數量的條目按一定次序匯編在一起,即能組成一部辭書。也正是因為這個特點,以往的辭書版權侵權者大都是從若干部辭書中大量抄襲條目,然后重新編排一下,就將其作為自己“編纂”的辭書。
在數字出版中,辭書條目的內容是要按照消費者的查閱需求在其接收終端屏幕上顯示的。這樣,如果有人利用獲得正常授權的機會,將屏幕上顯示的條目內容逐一復制后粘貼到一個自己新建的文件中,那么,經過多次反復操作,豈不是仍然能夠把某種數字辭書的內容全部變成自己能夠掌控并隨意使用的電子文件?這種可能性是存在的。我們日常上網查詢到的內容信息,往往都能用類似方法將之復制下來,然后保存為一個新的電子文件,雖然有時會丟失一些格式。
然而,目前數字出版技術已經可對消費者復制屏幕內容的行為進行有效控制。如位于上海浦東張江國家數字出版基地的上海精靈天下數字技術有限公司針對數字出版物版權保護需求開發的軟件系統,就能對消費者的復制行為進行控制。其中最為嚴格的控制,是不允許消費者對屏幕上出現的內容進行包括打印在內的任何方式的復制,甚至連一般計算機操作系統自帶的或第三方軟件提供的“截屏”功能、屏幕錄像功能等,都被禁止。當然,考慮到消費者在進行研究、創作的過程中常常會產生的文獻引用和搜集相關資料的善意需求(這屬于著作權法允許的合理使用范圍),這個數字版權保護系統也能夠允許消費者少量復制屏幕上顯示的內容,但是權利人(著作權人或出版權享有者)可以結合使用時間、操作次數、內容數量制定相應的授權范圍。例如:對每天可以復制的次數、每次可以復制的字符數量進行自動控制,一旦某個消費者對某部辭書內容的復制超過限額,系統就自動不再允許復制。假如有人企圖通過在許多天內多次復制的方法來獲得一部辭書的全部內容,系統也能根據該消費者復制同一部辭書內容的總次數和復制字符總量等操作記錄,及時發現這種惡意復制的征兆,并提出警告;如果該消費者繼續進行這種惡意復制,系統就會自動取消其查閱、使用該辭書的權利。
允許消費者有限復制辭書的部分內容,既有利于消費者對辭書的參考使用,又能較有效地防范侵害權利人權益的不法行為。這可以說是數字出版對辭書版權保護的重要貢獻。
四、數字出版便于查核辭書遭侵權的事實
辭書的使用價值在于它所承載的精神文化內容,而這些內容絕大部分是用文字表述的;同時,辭書作為出版物需要向社會傳播,讓公眾能夠認知其承載的精神文化內容,從而實現價值和使用價值。這樣,從根本上說,只要允許他人看到辭書的內容,就無法避免被人復制。譬如:將屏幕上顯示的條目內容逐一抄寫下來或直接錄入另一臺計算機;組織許多人利用不同的終端設備分別訪問同一部辭書,然后按分工在有限復制的額度內復制部分條目,再把這些條目匯總成書;分別登錄訪問若干部屬于同一學科或專業領域的不同辭書,先將其中涉及某一分支領域的部分條目復制下來,再重新組合成書,等等。對類似的復制行為,顯然,無論采用什么技術都不能絕對禁止。雖然復制者為此需要付出很高的人力成本和時間成本,但還是能夠規避數字版權保護技術,把他人的辭書作品據為己有。
可見,數字出版能夠防范侵權者利用電子手段輕易地非法復制辭書,卻無法禁止他們用比較原始的手段剽竊已出版的辭書,只是增加了剽竊的難度,并極大地提高了侵權的成本。因為看不到數字化辭書的現成詞目單,侵權者僅僅為弄清楚某部辭書的收詞狀況,就必須將成千上萬個字符作為關鍵字逐一進行查詢,需要花費很多精力和時間,而要調查一部紙質辭書的總體框架結構則幾乎是輕而易舉的。
數字出版技術雖然不能達到絕對禁止剽竊辭書內容的目標,但是,一旦侵權行為發生,在查核侵權事實上,與紙質辭書相比還是具有很大優勢的。
20世紀90年代,中國曾發生過《語言大典》剽竊《辭?!啡舾筛戒浐汀冬F代漢語詞典》《中國成語大辭典》中許多條目的辭書侵權大案。因為涉案辭書都是紙質本,人民法院在審理此案時,為了查核清楚侵權的事實,曾委托許多專家花費數月時間對這些辭書的內容逐一進行人工比對并按內容的相同程度進行統計。最后,法院根據剽竊的事實依法認定《語言大典》確實侵權,并判侵權人承擔相應的法律責任。
在數字出版條件下,如果A辭書的權利人懷疑B辭書存在侵權嫌疑,可以先按A辭書的詞目單(可集中于某一部類的詞目,也可隨機抽取各類詞目)搜集B辭書中相應的若干條目作為樣本,然后利用文本比較軟件對比分析這些樣本條目的內容,統計出完全相同、部分相同和基本不同的條目各占多少比例,從而大致上判斷某辭書是否存在侵權的嫌疑。
經過樣本對比基本確認B辭書有侵權嫌疑后,A辭書的權利人可以先申請對樣本條目的來源、內容對比結果進行公證,然后向法院申請訴前證據保全,由法院責令侵權嫌疑人提交B辭書全部條目的電子文件。這時,A辭書權利人就可以利用文本比較軟件比對B辭書中與A辭書所收詞目相同的全部條目,并對軟件統計出的相同程度為40%~80%(若條目中相同的內容不足40%,一般可視為屬于合理使用的參考、借鑒)的那部分條目進行人工復核,主要是核查那些相同的部分是否屬于條目的實質性內容,從而為法院依法審理、判決提供充分的證據。
可見,與完全由人工核查紙質辭書的條目相比,利用數字技術核查數字化辭書的條目內容需要花費的人力較少,而且速度非???。此外,如果A辭書在發布前對每個條目都進行過數字水印技術(即在文字、圖片等媒體材料中嵌入人類感官不能直接感知的隱蔽型版權標志)處理,而在B辭書相應條目中軟件中檢測到了相同的版權標志,那就為認定侵權提供了鐵證,而且速度更快,核查操作也更便捷。
當然,對于印刷型的侵權嫌疑辭書,核查的過程會稍復雜一些。權利人需要先把相應辭書的樣本條目轉換成電子文件并進行人工校對,然后才能利用文本比較軟件進行條目內容比對。當然,在向法院提起訴訟后,可以申請法院責令侵權嫌疑人提交印刷型辭書的電子排版文件,從而再對全部條目內容進行數字化比對。
(責任編輯 李瀟瀟)