耿相新
在出版學教科書中,我們找不到有關“出版對象”的章節。但在具體的出版活動中,作為出版人,我們卻每天都在和出版對象打各種各樣的交道。這是一個司空見慣的現象,也許還是一個不值得一問的問題。然而,出版對象到底是什么?難道它就是我們桌子上或者計算機屏幕上的文本稿件?抑或是等待校對的書稿清樣?或許,我們還可以根據出版社的不同類型將出版對象區分為圖書館分類法中的各類圖書,甚至還可以將其劃分為音像電子出版物和紙質出版物等。不過,以上歸類依然沒有解決問題。出版對象到底是由什么構成的?通過對現實出版世界的理解,尤其是對世界出版50強的對比性觀察,我認為,在數字時代,出版對象已經發生重大位移。無疑,重新界定和討論出版對象的問題,具有重要的現實意義。本文擬從出版符號、出版符號被傳遞物內容類型和出版符號傳遞物介質形式三個方面,試圖厘清出版對象的問題,并試圖喚起學界和業界對此問題的重視。
出版活動實質上就是人類符號的一個傳遞過程。德國哲學家恩斯特·卡西爾(Ernst Cassirer)說:“人是符號的動物。”①為了說明“符號”,卡西爾區分了信號和符號,他認為“信號是物理的存在世界之一部分,符號則是人類的意義世界之一部分”,人之外的動物可以感知信號,“動物具有實踐的想象力和智慧,而只有人才發展了一種新的形式:符號化的想象力和智慧”,“符號化的思維和符號化的行為是人類生活中最富于代表性的特征,并且人類文化的全部發展都依賴于這些條件”。②他進一步認為,人自覺地創造并運用符號,由此創造了文化,創造了一個“符號的宇宙”,人、符號、文化三位一體,因此“人是符號的動物”。符號是中介和媒介,它架起了人與文化之間的橋梁。而出版作為一種人類文化活動,它使用的工具和作用的對象就是人所創造的各種各樣的符號。
既然符號構成了人的意義世界,那么符號究竟是由什么構成的?或者,我們應當直接提問:什么是符號?簡單地說,符號是攜帶意義的記號。英文中symbol(符號)這個詞“來自希臘文里代表token(象征)或token of identity(身份的象征)之義的詞,它結合了兩個詞根:sum(一起)和動詞ballo(丟擲),對‘符號’一詞較寬松的詮釋是‘放在一起’”③。放在一起的可以是人也可以是物,其本源的意指是某人證明某人的關系。美國《韋氏詞典》對符號的定義是“由于關系、聯想、習俗成規或偶然而非有意的類似,來代表或使之聯想到其他事物的某種事物”④。這個定義強調了“某種事物”能夠代指另一種事物,與羅曼·雅各布森(Roman Jakobson)的觀點十分一致。雅各布森認為符號具有兩個方面:“一個是可以直接感覺到的指符(signals),另一個是可以推知和理解的被指(signature)。”⑤這個觀點與費迪南·德·索緒爾(Ferdinand de Saussure)關于符號是能指與所指之間的關系異曲同工。美國哲學家查爾斯·桑德斯·皮爾斯(Charles Sanders Peirce)對以上的符號概念進行了大大的拓展。皮爾斯認為,整個宇宙充滿了符號。他給符號的定義是:“符號,或代表項,是對于某人在某一側面或能力方面代表了某物的東西。它對某人說話,也就是說,它在此人的思維中創造了一個相對應的符號,或者一個更加發展了的符號。那個被創造出來的符號我稱之為第一個符號的解釋項。”⑥這個定義突破了符號的能指和所指二元結構而成為“符號、符號的對象與符號的解釋項”三元結構,符號活動就是一個三元過程,也即“符號首先是一種解釋項,是一種響應,通過這種響應的解釋,另外某種東西才能被看作符號,從而成為被解釋項,而且,還能夠生產一個開放的、由其他符號組成的符號鏈”⑦。沿著由符號的解釋與被解釋并產生新的符號這一邏輯,任何事物,凡是能夠聯系在一起的,就是符號。皮爾斯在《關于意義的論文》中列舉了大量的符號例子,如:畫像、圖片、圖表、手指、眨眼、手帕結、回憶、幻想、概念、指示、標志、數字、信件、詞、短語、句子、篇章、書籍、圖書館、信號、命令、顯微鏡、立法代表、音符、音樂會、表演、自然哭喊,等等。⑧同時,皮爾斯還將數學、化學、心理學等17門學科也歸入符號學的研究范疇。基于以上認識,我們可以將符號理解為一個能夠解釋的標記或者記號,這個解釋就是意義,符號就是表達意義的載體和表達意義的條件,而“意義就是一個符號可以被另外的符號解釋的潛力”⑨。換句話說,人的世界就是符號的世界,也是意義的世界。而出版活動的目的正是表達和傳播意義,自然而然,符號必然也必須成為出版的表達和傳播工具。因此,出版的對象就是人所創造的符號和對符號的解釋。
毫無疑問,人是符號的制造者,也是符號的接受者。人的嗅覺、味覺、觸覺、聽覺、視覺五種感官的任何活動都具有作為符號或者成為符號的潛能。雅各布森尤其重視視覺和聽覺,他說:“人類社會中最社會化、最豐富和最貼切的符號系統顯然以視覺和聽覺為基礎。”⑩作為符號系統的聽覺,其最明顯的表征是口頭語言和音樂藝術,聲音成為符號意義的載體。而視覺符號系統則更傾向于身體姿勢、書面語言、文本作品、圖像、造型藝術等。當語言被文字符號記錄而成為文本性的書籍,或者綜合運用了空間場景的表演藝術,如演講、課程、戲劇、歌劇、電影、電視等視頻式藝術,則是整合了聽覺符號和視覺符號。隨著數字計算機圖形軟件技術的發展,虛擬現實和增強現實的虛擬影像也一同成為符號意義的載體。基于以上認識,我們將出版符號歸類為五個系統:文字符號系統、圖像符號系統、聲音符號系統、視頻符號系統和虛擬符號系統,此五類符號系統構成了總體的出版符號。
出版是一種符號生產和消費。文字符號的出版自出版誕生以來即為出版的主流。文字符號系統是人類的重要發明之一。在人類古文明時期,不同的文明發明了不同的文字符號系統。人類的語言有7 000種左右,但進化到記錄語言的文字系統卻只有幾百種。文字是人類使用聲音、語言的代號或符號進行視覺交際和傳遞信息的系統,這些符號或代號與聲音或語言單位的意義約定性地相對應。最早的文字符號系統起源于圖形符號,也可稱之為象形符號,它是一種象征性代號,這些代號或符號可以提煉一個人或一件事情的特征、特點、特性,并以形象的圖畫形式進行表示,這些符號也對應于口語中的人或事物,約定俗成并形成慣例后便成為文字符號。迄今,人類所發明的成熟的文字系統主要有三種類型:詞符與音節符并用的文字、音節文字和字母文字。如果一個符號代表一個詞,使用大量的符號即可形成詞符文字系統,但此勢必造成詞符數量巨大,而且抽象詞也難以表達。蘇美爾人、古埃及人、中國人把一部分詞符改成不表意、只表音,并將其置于詞符之間,用來表示其他與此讀音相同或相似的詞。蘇美爾楔形文字、古埃及象形文字、赫梯文字、中國甲骨文字是發明最早也是最典型的詞符和音符并用的文字系統,從甲骨文字流變而來的漢字目前依然是中國日常使用的書寫文字和出版符號。音符也即音節符號、語音符號,相對于詞符數量較少并相對穩定,如果舍棄數量巨大的詞符而全部使用音節符號,那就成為“音節文字”,音節文字以楔形音節文字,西部閃米特音節文字(腓尼基文字、希伯來文字、阿拉米文字),愛琴海音節文字,日本音節文字(假名),埃塞俄比亞文字(阿姆哈拉文字)為代表。其中,日文是詞符和音節符并用的文字,但其假名是音節符號。文字符號可概分為表形、表意和表音三種類型。古埃及象形文字中開始使用表音的限定符號,大量和重復使用的26個單輔音符號(每個符號代表一個輔音)成為世界上最早的字母表。早期的輔音符號幾乎全部與詞符、音符和限定符號一起使用,公元前2000年前時埃及人開始只用輔音字母書寫,這一符號書寫原則很快傳入西奈半島和黎凡特地區的閃米特族人中。?從古埃及的輔音字母表,演化為閃米特語的原始字母表,最后演變為西方今天廣泛使用的拉丁字母表。公元前1000年左右,閃語字母演變為南閃語字母系統、迦南語字母系統、亞蘭語字母系統和希臘語字母系統四大支系。迦南語系又再分化為早期希伯來文和腓尼基文。亞蘭語系中的閃語字母系統包括方體希伯來文(現代希伯來文原型)、新西奈阿拉伯文、帕爾米拉字母、古敘利亞景教文、摩尼文等,非閃語分支中從亞蘭字母衍生出的文字主要有印度婆羅米文、佉盧文、波斯文、粟特文、青帳突厥文、維吾爾文、蒙古文等。希臘人在西閃米特輔音字母表中,加入元音而創造出人類歷史上第一個完整的字母文字體系,古希臘文又演化為伊特拉斯坎字母、斯拉夫語系的西瑞爾字母,拉丁字母(羅馬字母)是伊特拉斯坎字母的支系。拉丁字母成為基督教官方文字后,被應用到許多不同的語言上,如日耳曼語系的英文、德文、瑞典文、丹麥文、挪威文、荷蘭文;拉丁語系的意大利文、法文、西班牙文、葡萄牙文、羅馬尼亞文;斯拉夫語系的波蘭文、捷克文、克羅地亞文、斯洛文尼亞文;芬蘭語系的芬蘭-烏戈爾文、匈牙利文等。?從詞符-音符文字、音節文字和字母文字的溯源可以看到,音節文字很早就被字母文字替代了,現在流傳下來并仍在使用的文字系統只剩下中國的漢字系統(日文源于漢字)和源于埃及輔音字母的字母文字及其各種變種。人類歷史上的書籍均是由不同的文字系統書寫的。印刷術發明之后,漢字書籍(包括日本、朝鮮、越南的漢籍)主要使用雕版印刷和銅活字印刷,字母文字書籍使用古登堡鉛活字印刷機印刷。19世紀以來的工業印刷機和20世紀中葉以來的計算機數字技術逐步淘汰和挑戰紙質出版,但這只是出版技術的演替而已,書籍出版的符號系統依然是詞符—音符的漢字系統和字母文字系統。通過對文字符號的探究,我們不得不說,不同書籍使用不同文字符號而呈現內容,這是出版活動的根基,實際上,某一語言文字的邊界也就是某一出版活動的疆界。同理,突破原有出版符號版圖的翻譯活動,始終是推動文化交流的一種動力。在此,文字符號不僅是出版對象,在一定程度上它也是對出版的一種限制。
出版的本質是為了促進文化和語言交流。廣義上的文化語言交流,有學者將其分為三大類型:科技指示符碼—科學語言(數學語言、音樂、化學、物理、邏輯語、曼瑟爾表色系統、音標系統)與機器語言(C語言、Java、二進制、二維碼);文化規約符碼—自然語言(圖像、自然語言、網絡生成符號、藝術創作語言);混合理據符碼—傳播語言(公共標識系統、手語、旗語、各種指示符號、圖像混合語言、圖像化音樂記譜語言)。?從這個相對系統和完整的語言符碼角度出發,我們可以看到計算機時代傳播和出版符號的廣度。除文字符號外,包括計算機圖形符號在內的圖像符號越來越凸顯其重要性。圖像不再單純是傳統意義上的圖畫、繪畫、照片、雕塑,現在也應包括計算機條件下的設計、圖形和鏡像等。
圖像進入書籍內部的時間十分久遠。從時間性上說,圖畫早于文字誕生。書籍誕生之后,插圖也緊隨其后進入書籍內部結構。早在戰國時期,中國的竹簡書籍中就已出現插圖,出土于長沙的戰國楚帛書也可以被視為一本圖文結合的書籍。出土于馬王堆漢墓中的帛書,制作于漢代初年,其中的《天文氣象雜占》等書籍是圖文并茂的。《山海經》在漢代是圖文相間的。雕版印刷術發明不久,雕版圖像就已成為雕印書籍的一部分,如雕印于唐咸通九年(868)的《金剛經》,在書首就置有一幅精美絕倫的題為《祇樹給孤獨園》的圖畫。明清時期,雕版繡像插圖更成為書籍美學呈現方式的普遍現象。世界上最早的書籍插圖可追溯到古埃及的《死者書》(Book of the Dead)中的圖畫。在西方,現今存世最早的附有插圖的手抄本是荷馬史詩《伊利亞特》和古羅馬詩人維吉爾的《埃涅阿斯紀》,是公元4世紀或5世紀時制作的。?中世紀的手抄本中大多手繪有極其精美的“裝飾畫”。古登堡發明鉛活字印刷術之后,西方的印刷版畫開始興起。出版于1493年的《紐倫堡編年史》一書中附有插圖1 809幅,堪稱插圖書杰作。文藝復興時期,阿爾勃萊希特·丟勒(Albrecht Durer)是最著名的書籍插圖家。與木版版畫相比,后起的蝕刻凹版印刷技術銅版版畫線條更加纖細優美,18世紀后凹版插圖逐步替代了凸版插圖。1843年,英國人安娜·阿特金斯(Anna Atkins)出版了世界上第一本使用攝影照片的書籍《英國藻類圖片集:氰版照相法印制》。?從此,攝影照片開始大量涌入書籍內部,在工業印刷最鼎盛的20世紀,專業的攝影書籍甚至成為一個重要的出版門類。在數碼攝影技術崛起后的21世紀,照片的生產量達到令人吃驚的程度,僅社交網站Facebook上一天上傳的圖片就有數億張,數字照片開始成為重要的出版對象。圖像作為一種出版符號將有可能超越文字符號而成為最重要的出版存在。
聲音作為一種人類交流和傳播媒介,其起源與人類語言的誕生同步。聲音的易逝性特點決定了其作為一種出版符號的困難,但人類努力記錄聲音的探索卻一直未曾停止。依據記錄聲音的技術,我們將聲音符號分為間接記錄聲音符號和直接記錄聲音符號,前者主要指需要用文字或其他符號記錄的聲音,后者指模擬信號的錄音、無線電廣播和數字化數據音頻。以書籍形式記錄的聲音符號在錄音技術發明之前,主要類型有音樂樂譜,戲劇劇本和說唱、講唱、彈唱文學底本。中國最早記錄曲譜的書籍出現于漢代,《漢書·藝文志》中記載的《河南周歌聲曲折》7篇、《周謠歌詩聲曲折》75篇就是最早的樂譜,聲曲折是一種古代的歌詩演唱時對曲調的記錄方法,是依據曲調高低上下而繪制的一種樂譜,具體形態已不可知。中國古代最初是用文字記譜,現存的唐代手抄本《碣石調·幽蘭》是目前僅見的一首用文字記述彈奏手法的琴曲,此文字譜用了4 954個漢字。?唐代曹柔創新古琴記譜法為減字譜(指法譜),沿用至今。同樣起源于唐代的還有“燕樂半字譜”(工尺譜),在敦煌遺書中發現有數種四弦四相琵琶曲子譜,即燕樂半字譜。南宋詞人姜夔的詞曲譜集《白石道人歌曲》(6卷)中有17首詞姜夔自注工尺譜,是“至今傳世的唯一詞調曲譜”?。明清時期,民間雕印了大量琴曲小冊子,而雕版印刷的戲劇劇本和民間唱本,更多達數千種,這些都可以被歸類為間接記錄聲音符號的出版物。錄音技術被發明后,尤其是廣播技術和數字音頻技術被廣泛應用后,聲音符號迅速發展成為人類最重要的大眾媒介之一。錄音技術和錄音機(留聲機)是美國發明家T.A.愛迪生(Thomas Edison)于1877年發明的,其后,錄音和放音介質發展為力學介質(留聲機唱片)、磁性介質(錄音帶)和光學介質(電影的聲道與數字式小型光盤),與書籍出版關聯度較高的是磁帶,磁帶錄音主要分為開盤式和盒式兩種,以學習語言為主的教學帶主要使用盒式磁帶,在數字技術和互聯網興起之前,盒式磁帶曾是音像出版業的主要產品。廣播是利用電子技術向公眾播送無線電或電視信號,它實現了遠距離、實時、一對多的單向傳播,無線電廣播只傳播音頻,電視則同時傳播視頻和音頻,二者向廣大聽眾和觀眾傳播的內容主要是教育、新聞和娛樂等節目。廣播系統、電視系統是與出版系統并行的大眾傳媒,廣播系統興起于20世紀20年代,電視系統大約興起于20世紀50年代,它們與圖書出版的關聯部分主要在教育方面,遠程的廣播和電視大學所使用的教材和教學輔助材料通常以紙質圖書的形式出版。中國自宋代開始流行的口頭講說表演藝術,如說書、講書、評書、講古、評話、評詞等不同稱呼的說話藝術,在廣播、電視興起后,也開始成為廣播和電視的節目,但表演藝術家們的底本(話本),通常還會以紙質介質的形式出版和傳播。1983年建成的國際互聯網,于90年代崛起為一個具有覆蓋媒介功能的超級大眾媒介,以數字化、電子化的文字、圖像、音頻、視頻形式覆蓋了以往的圖書、雜志、報紙、攝影、錄音錄像、電影、廣播、電視等媒介,以往的媒體內容逐步遷徙到互聯網和移動互聯網上,數字音頻成為互聯網和移動互聯網上必不可少的一個角色。聲音符號直接轉換為數字形式之后,聽書成為一種開始崛起的出版產品。1997年中國的網絡廣播誕生,2004年基于移動互聯網的博客、網絡聽書網站興起,2012年規模化的音頻聚合網絡平臺出現,基于聲音符號的音頻介質開始朝垂直化、社群化、產業化的方向發展。?數字音頻越來越成為一種商業化的出版對象。
視覺符號影像或視頻成為出版對象的時間相對較晚。視覺是人類最原初的感知感官之一,也是人類初始信息交流的媒介之一。在口語時代,面對面的視覺交流是最有效的信息傳遞方式。即便是在通過網絡進行遠距離即時視頻交流十分便捷和發達的今天,面對面的視覺交流依然不可替代。將人體的姿勢、手勢和表情記錄下來成為視頻符號,起源于1888年T.A.愛迪生和他的助手發明的第一個實用的活動圖片攝像機,之后他們還發明了活動電影放映機。1903年之后,隨著技術的不斷進步,電影成為一個大眾媒體并形成了巨大的產業。緊隨電影之后,以影像為媒介的電視媒體崛起于20世紀50年代。英文單詞“Television”(電視)1900年被法國人康斯坦丁·伯斯基創造,本意是“遠距離觀看”“用電來看”。?與電影不同,電視與無線電廣播和有線電話是近親,屬于電子媒體。電視是活動圖像和其聲音的電子信號傳輸。電視攝像機將圖像和聲音轉換為電脈沖信號,這些高頻無線電載波信號由發射天線發出,被接收天線拾取并再轉化為光的亮度變化,在接收機的熒幕上顯示出來。1936年11月2日,英國廣播公司正式播出電視節目,被視為電視正式誕生日。20世紀七八十年代,有線電視、衛星電視分別加入電視網,直到21世紀初以計算機網絡為技術基礎的移動互聯網的崛起,兼顧了視頻和音頻優勢的電視媒體才開始衰落。電視視頻和圖書出版相結合的部位主要體現在教育出版領域的教學課堂和課程上,視頻課與紙質書互相支持對方。但在電視視頻和數字圖書分別遷徙到移動互聯網上時,它們雙方都重新找到了新營地。圖書出版將原有的紙質圖書內容轉化成了視頻形式的教學課程、軟件和學習材料,文字作者開始直面鏡頭而轉化為演講時的影像,視頻符號開始大規模地進入出版領域。視頻符號成長為出版對象,并開始朝專業化、垂直化、知識化、課程化、產業化的方向發展。
虛擬符號是由計算機創建和產生的。隨著計算機技術的發展,虛擬符號攜帶意義的場景應用越來越多并越來越具有商業性。計算機虛擬符號已經開始成為重要的出版符號,其商業價值越來越凸顯。從我們熟悉的虛擬現實(VR)中追尋一下它的技術基礎,可以得知虛擬現實的技術支撐是計算機圖形和圖像。虛擬現實(VR)是“計算機創造并以計算機為媒介的對真實或想象的環境的模擬”,它是一種虛擬環境,通過三維(寬度、高度和深度)圖像的體驗來提供對現實的幻覺。?三維圖像是關鍵技術,三維圖像的顯示可以通過頭戴式顯示器、立體眼鏡、耳機、運動平臺、數據服裝(數據手套)和其他互動裝置呈現。計算機的硬件和軟件構成一種交流媒介,通過人機互動裝置像交流文字符號和聲音符號一樣交流圖像、聲音和動態模型以形成仿真模擬。三維圖像的底層技術是計算機圖形和圖像,計算機圖形是由計算機繪制的直線、圓、矩形、曲線、圖表等外部線條構成的矢量圖,計算機圖像是由像素點陣構成的位圖,計算機可以將一件現實存在的或想象的視覺信息以數字化的圖形和圖像形式表達為仿真的形象,運用透視線條、隱藏表面消除等技術使二維的計算機屏幕能夠有效地模擬三維世界,從而形成虛擬現實式的計算機模擬世界。虛擬現實(VR)已被廣泛應用于藝術、工程設計、娛樂游戲、工業仿真、培訓實訓、課堂教育、醫學、軍事、航空航天、能源交通、生物、水文地質、事故還原、工業制造等領域。和傳統出版關聯度較高的是教育領域,虛擬現實技術能夠為學生提供一個生動、逼真的學習環境,可以為學生提供諸如物理、化學、生物等虛擬實驗,也可以為職業學校的學生提供各種虛擬演練和動作操作。數字技術發展的現實,讓我們不得不重新審視計算機所創造的虛擬圖形和圖像,它們也同樣起到了攜帶意義的中介符號的作用,已經演變成一種出版符號。
如果我們將出版符號理解為出版活動中的外在表現形式,那么,我們隨之要進一步思考的是,作為中介的出版活動在時間和空間上要傳遞的內在形式是什么?符號學中將符號的傳遞分為遺傳和傳統兩種類型。遺傳屬于生物學中基因代碼的范疇,而傳統則被視為“一種文化可被看作是一個有機體群體,其行為方式受制于特殊傳統,即經由學習獲得之,并在創造性的修正之后將其傳至下一代”?。關于遺傳和傳統,《符號學手冊》的作者認為:“兩種傳遞類型(遺傳和傳統)都是記號過程,而且被傳遞物(知識、態度、生產技能和制造物的使用),在很大程度上也是以記號為基礎的。”?符號的創造過程也就是記號的過程,由記號(符號)的生物性所決定,符號傳遞既具有一代一代的時間性,也具有地理概念下的空間性。無論是傳遞的生命力,還是傳遞的廣度,出版活動中的核心要素是首先要界定清楚傳遞什么,換句話說,被傳遞物是什么。我們認為,出版活動中的被傳遞物是數據、信息、知識和智慧。
狹義的數據指數字或數值,是人類通過觀察、實驗、檢驗、統計或計算,通過對客觀事物的邏輯歸納而得出的結果,也指用于進行各種數學統計、計算、查證、決策、科學研究、技術設計等的數值。英文單詞data(數據)是指“一個有意義的事實和數值總體”,中文的“數據”定義是“指對客觀事物進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合”?。從數據的表現形式上可將其分為離散數值和連續數值,即數字數據和模擬數據,數字數據主要為各種統計或量測數據,模擬數據指在一定的區間內連續變化的物理量,包括圖形數據、符號數據、文字數據、圖像數據等。如果依數據的物理性質,還可以將其分為定位的坐標數據、定性事物屬性的定性數據、反映事物數量的定量數據和反映事物時間特征的定時數據。在計算機數據庫時代,數據被定義為“描述事物的符號記錄”,“描述事物的符號可以是數字、文字、圖形、圖像、聲音、流數據、HTML(hypertext markup language)、XML(extensible markup language),即數據有多種表現形式,數據可以是結構化的、半結構化的和無結構的”?。結構化數據是指可以被計算機識別的數據,是“具有一定結構性、可以劃分為固定的基本組成要素、能夠通過一個或多個二維表來表示的數據”?。結構化數據主要是應用于關系型數據庫和面向對象數據庫中的數據。半結構化數據主要應用于XML(可擴展標記語言)和計算機網絡網頁。非結構化數據是指不是以一種預先定義好的方式進行組織的數據,在表現形態上主要包括文本、圖片、音頻、視頻等,“世界上大約80%的數據是以文本、照片和圖像等非結構化數據的形式存在”?。通過對“數據”概念的理解,我們可以非常清晰地認識到,數據已經不再是單純的數學概念下的數字或數值,它實際上已經演化為記錄和描述一切事物的符號。自20世紀60年代以來,數據庫技術得到迅猛發展,數據庫出版迅速成為一種新的出版形式,數據隨之成為最富有前景的出版對象。
數據本身并不能完全表達事物的內容,需要解釋才能表達出完整的意義,對數據含義的說明既是一種數據解釋,同時也是對數據的一種加工。在計算機系統中,數據是所有能以二進制信息單元0、1的形式輸入計算機并被計算機程序處理的符號的介質的總稱。數據的價值在數據庫技術發明之后得到了充分體現。數據經過組織和加工產生價值和意義。對各種數據進行收集、存儲、加工、傳播、應用是一種數據處理活動,對數據進行分類、組織、表示、編碼、存儲、存取、控制、維護是形成數據庫的關鍵。數據庫就是用數據模型對現實世界的數據特征進行抽象、描述、組織和控制,是一種持久存儲在計算機內的有組織、可共享的數據集合。依數據庫管理模式,數據庫分為層次數據庫系統、網狀數據庫系統、關系數據庫系統、面向對象數據庫系統、演繹數據庫系統、分布式數據庫系統、并行數據庫系統、工程數據庫系統、Web數據庫系統、混合型數據庫系統等形式。按照應用領域、市場用戶需求和商業價值實現,已經進入市場并實現經濟效益的特定的、專業的、特種的數據庫大體有:與計算機并行和分布式技術結合的并行數據庫、分布式數據庫;與人工智能和計算智能結合的主動數據庫、演繹數據庫、模糊數據庫、知識庫等;與多媒體技術結合的圖像數據庫、圖形數據庫、文本數據庫、情報數據庫、多媒體數據庫等;與計算機硬件結合的內存數據庫等;滿足特殊需求的實時數據庫、空間數據庫、工程數據庫、生物信息數據庫等。?作為出版行為的數據庫出版,已經成為數字出版的基石,不僅僅是在底層技術上,在數字出版產品上它的盈利規模也遠遠超過了紙質出版。
數據通常被理解為未經過加工和組織的數字、文字、圖像、圖片、聲音、視頻等原始符號記錄,而信息則被視為通過人腦或計算機對原始數據進行篩選、加工和創造后產生的有意義的數據。在數據和信息的關系上,可以說,數據是信息的表現形式和載體,它們可以是符號、數字、文字、圖像、圖形、聲音、視頻等;而信息則是數據的內涵,是對數據有意義的表示,是對數據做出的具有含義的解釋,“信息是結構化的數據”。如此解釋數據和信息,是計算機時代的一個視角解讀,但究竟如何定義信息,或者說如何定義出版活動中的信息概念,其實還存在諸多難度。
在出版活動中,我們可以將信息視為用于傳遞、交流、傳播和反饋的關于客觀事物或意識、思維、思想的符號與內容。現代意義上的“信息”概念,最經典的定義是1948年克勞德·香農(Claude E.Shannon)在《通信的數學理論》一文中所表述的:“信息是用來消除隨機不確定的東西。”?香農的這篇論文從通信技術的發展角度開創了信息論,但他的這個定義卻是缺乏意義和語境的純粹數學概念,他將信息視為發送者傳遞給接受者的訊息,可以用0和1的符號串形式來編碼,信息是一個抽象的科學概念,可以用數學方法加以定量表征,“信息量等于不定性的負量”。香農的信息定義并不和意義產生關系,他認為:“通信的基本問題是在某一點上準確或大概復制在另一點上選擇的訊息。訊息常常是有意義的。換言之,它們根據某一系統指涉某些物理實體或觀念實體,或與之有關聯。通信的語義方面和工程問題沒有關聯。語義的方面是,實際的訊息選自于一套可能的訊息。”?對香農的信息概念進行闡釋和拓展貢獻最大的是沃倫·韋弗(Warren Weaver)和諾伯特·維納(Norbert Wiener)。韋弗從技術、語義和效用三個水平方面解讀了香農信息和通信研究的方向:“水平A.通信的符號如何能精確地傳送?(技術問題)水平B.所傳送的符號如何準確地傳達所希望的意義?(語義問題)水平C.所接收到的意義如何有效地以所希望的方式影響行為?(效用問題)。”?我們可以看到韋弗已經將信息理論拓展到了傳播學領域,他關注到了符號的發送者和接受者,關注到了信息產生方式、信息載體和信息內容,關注到了符號意義的傳送與反饋,為出版產業應用信息理論奠定了理論基礎。維納是控制論的創始人,他一再強調,他是用信息論工具來研究控制系統和建立控制論的,是用統計學的方法來研究信息論的,控制系統中的過程是通信,控制系統是由系統、信息、控制、反饋和通信組成的。維納的信息定義是:“信息是人們在適應客觀世界,并使這種適應被客觀世界感受的過程中與客觀世界進行交換的內容的名稱。”?這個定義是對香農信息概念的發展,它強調了借助反饋維持穩態的作用,也就是說,信息是關于事物運動的知識,信息是內容,信息是人們在與客觀世界之間建立聯系的內容,這些內容具有意義,通過控制物質領域的意義以減少世界的不確定性。通過“交換”(反饋)賦予信息以意義,信息表達目的是維納對香農信息概念的拓展。加拿大物理學家、傳播學家羅伯特·K.洛根(Robert K.Logan)更進一步認為“沒有意義的符號并不是真正的信息”,他與路易斯·斯托克司(Louis Stokes)提出的數據、信息、知識和智慧的定義,更成為知識經濟時代的理論基礎,這個基于信息的關于知識進化的理論模型,實際上也是數字出版理論探索的一個工具。洛根認為,“數據是純粹和簡單的事實,沒有特殊的結構或組織,是基本的信息原子”;“信息是有結構的數據,信息賦予數據意義,為數據提供語境和意義”;“知識是戰略上使用信息,以達成個人目標的能力”;“智能是在符合個人價值并在大社會語境里選擇目標的能力”。?在洛根的理論框架里,數據是信息發送者和接受者之間傳輸的信號、消息、符號,數據語境化之后附有了意義而成為信息,信息得到應用而轉化為知識和智慧。洛根的這個信息和知識模型是對香農、維納信息論和控制論的發展,有效解釋了數據、信息、知識和智慧(思想)之間的關系,它既是一個知識生成的模式,也是一個思考如何進行知識生產和傳播的方法論。
洛根在《什么是信息》一書中,還進一步將信息區分為微觀信息和宏觀信息,微觀信息是字符串或符號串,宏觀信息是生物有機體、語言和文化,并延伸到技術和經濟領域。這個新視角,對指導我們的出版活動具有更直接的理論意義。在符號域中,心靈、語言和文化,一直是人類書寫的主體和表達的主題,它們得以以書籍的物理形式出版和傳承,而到達信息社會和信息時代,計算機數字技術和通信技術的結合為出版業的發展提供了前所未有的機遇,攜帶意義的數據和信息與知識和智慧一樣成為重要的出版對象,其產品形態以數據和信息數據庫為主要出版形式,這是迄今為止出版史上最大的一次出版對象的轉移。自20世紀70年代以來,信息內容產業開始興起,通信網絡、互聯網提供商、計算機硬件和軟件提供商、信息內容提供商共同構建了一個龐大的信息產業,出版商也隨之成為信息業的一個組成部分。現在,信息產業所創造的商業價值已經遠遠超過傳統的紙質出版業。
知識是人類歷史上符號傳遞中最重要的傳遞內容。自文字發明以來,知識是最適合文字符號系統傳遞的傳遞內容。回顧一下出版歷史,我們很容易得出知識是書籍內容基本構成的結論。在計算機進入出版業之前,我們甚至可以說,一部出版史實際上就是一部知識出版史。從洛根的知識論模型,我們也可以看到電子計算機的影響因子,對數據和信息的深度關注正體現了對計算機語言的高度重視。洛根之后,王維嘉在《暗知識:機器認知如何顛覆商業和社會》一書中將知識區分為明知識、默知識和暗知識三類,也可以推導為人類知識和機器知識兩大類。所謂“明知識”,就是人類可以用語言表達或用數學公式描述的知識,也可以稱之為“正式知識”,“它們被記載在書籍、雜志、文章、音頻等各種媒體上”;“默知識”是只可意會、不可言傳的知識,屬于“默會知識”,絕大多數的知識無法用語言表達、無法記錄、無法傳播和積累,如大量的傳統工藝和技能;“暗知識”是人類既無法感受也無法表達的知識,屬于“機器知識”,是機器從視頻、圖片或其他場景中萃取的參數集之類的模仿人腦和模仿演化而產生的知識,是機器發掘出來的,人類無法理解和陳述,但機器可以記錄并通過網絡以光速傳遞給其他機器。?如果從數量上來衡量,盡管人類積累了5 000年的明知識,但其數量卻是有限的;其次是默知識;而由各類計算機所產生的暗知識則已經遠遠超過人類知識。2 000萬冊紙質書的總信息量相當于20TB,現在每年產生的文字大約為160TB,而每年僅上傳到社交平臺YouTube上視頻的量就大約有157 680TB,各種傳感器和計算機監測下所產生的數據和信息量則可達到天文數字。?以20世紀40年代末計算機誕生為分水嶺,知識開始被區分為人類知識和機器知識,這是知識史上的革命性變革,以出版知識為使命的出版業也可以隨之被區分為人工出版和人工智能出版、印刷機器工業出版與計算機數字網絡出版、紙質出版和數字出版,這一重大分野應當成為我們重新思考出版符號和出版對象的邏輯起點。
在計算機語境下,知識總是和信息密不可分,知識的概念、定義和內涵與信息、數據也緊密地聯結在一起。在計算機數據庫和知識庫的背景下,知識被定義為:“知識指人們對自然現象的認識和從中總結出的經驗,或指以各種方式把一個或多個信息關聯在一起的信息結構。”?可以說,知識是信息綜合處理的結果,信息通過相互比較,結合成有意義的關聯,信息是知識的內涵與實體,而數據符號則是信息的外延與形式,數據是表示事物、概念的一種符號,信息是數據所表達的事實,知識是信息經過加工、整理、改造而成的一般概念的信息,因此,“知識是經過消減、塑造、解釋和轉換的信息”?。其實,這個計算機時代的知識定義只是眾多定義中的一種,但這個重視關聯的定義內涵,我們卻可以追溯到知識起源時期的希臘,數學家畢達哥拉斯說“始基和萬物皆為數”,柏拉圖認為“科學知識來源于洞見理念世界,而這理念世界是由數和形的理念組成的,這就是說,科學認識就在于用數學概念的體系去把握自然”?。理念世界是“可知世界”,物理世界是“可見世界”,人類知識就區分為可見世界的意見和可知世界的科學,意見包括信念和猜想,科學包括推理知識和理智直覺,因此,柏拉圖認為“知識是一種被證實為真的信念”,而證實的途徑靠數學、邏輯、演繹推理、經驗和歸納。?用數學去把握世界和用數據、數值去建構世界知識,其邏輯思維是統一的,是一脈相承的。
無論如何定義知識,知識作為人類文明的內容傳遞是確定的。我們從人類的知識傳遞史和知識的分類史中就可以看到知識傳承和傳播在人類文明發展中是何等重要。在西方,亞里士多德將知識分為純粹理性(理論科學,形而上學、數學、物理學),實踐理性(實用科學,倫理學、政治學、經濟學)和技藝(創制科學,音樂、詩學、建筑)三大類別。17世紀,弗朗西斯·培根(Francis Bacon)將人類科學知識分為記憶科學(歷史學、語言學),想象科學(文學、藝術)和理智科學(哲學、自然科學)三大類別。20世紀,羅素將人類知識劃分為科學、神學和哲學。而在中國,孔子時代的知識分為六藝,即禮、樂、射(射箭)、御(駕車)、書(文字)、數(技術、技巧、數學)。漢代的知識分為六藝、諸子、詩賦、兵書、數術和方技。隋唐時期,中國的書籍知識分為經、史、子、集、道藏和佛藏。20世紀初,中國的學科知識分為七大類,即“七科之學”(文科、理科、法科、商科、醫科、農科、工科)。20世紀70年代,以計算機技術為基礎的數據庫、知識庫興起后,人類知識被分為敘述性知識、過程性知識、控制性知識、元知識,也被分為對象知識、元知識、進程知識、常識,就知識內容而言分為原理性知識和方法性知識,就知識形式而言分為顯性知識和隱性知識,就知識性質而言分為理論性知識和經驗性知識,就知識的確定性程度而言分為確定性知識和模糊性知識。2012年,Google推出面向互聯網搜索的大規模知識圖譜,知識圖譜通常將知識分為事實知識、概念知識、詞匯知識和常識知識。無論東方、西方,也無論古代、當代,知識一直是書籍最重要的內容。而書籍,正是出版的主要呈現方式。
出版是傳遞人類符號的中介,在數據、信息和知識之外,人類智慧也是出版傳遞的重要內容類型。1988年,運籌學家羅素·艾可夫(Russell Ackoff)畫出數據、信息、知識、智慧的金字塔知識模型,在此之前,提出類似觀點的還有工程師邁克爾·庫利(Michael Cooley)和教育家哈蘭·克利夫蘭(Harlan Cleveland)。艾可夫之后,管理學家維娜·艾莉(Verna Allee)、傳播學家洛根又強化了此觀點。艾莉在《知識的進化》中又豐富為數據、信息、知識、含義、原理、聯合智慧體的學習和管理模型。這個模型中的智慧,毫無疑問成為出版傳播中的重要組成部分。但什么是智慧?出版活動中的智慧包括什么類型?這正是需要我們厘清的關鍵。
概括而言,在出版內容的類型中,某種程度上可以說,在數據、信息、知識之外的都應屬于智慧的范疇。但這樣的判斷過于寬泛而流于空洞。在進一步界定之前,讓我們首先明晰一下智慧的概念。漢語中的“智慧”一詞,指“辨析判斷、發明創造的能力”,也指才智、智謀,最早見于《墨子》:“夫無故富貴、面目佼好則使之,豈必智且有慧哉!若使之治國家,則此使不智慧者治國家也,國家之亂既可得而知已。”?此之智慧,既指才智,也指能力。南北朝時期,“智慧”一詞也用于梵語“般若”和梵文“阇那”(Mati)的意譯,“泛指一切有分析和有決斷性的認識能力”,即“具有觀察對象和思維分析、斷除疑惑的認識能力”?。梵文的智慧,指向破除迷惑證實真理的識力和邏輯推理的能力。在古希臘,“Sophia”(漢譯智慧)一詞的原意指擁有“專業知識”或“技能”,“哲學”(Philosophia)一詞由“愛”(philein)和“智慧”(Sophia)構成,本意為“愛智慧”。?蘇格拉底說:“我假定,智慧使人們變得聰明”,“說人聰明不就是說他們對事物擁有知識嗎?”,“那么,知識與智慧是一回事嗎?”。?被稱為希臘“最智慧的人”的蘇格拉底并沒有解答清楚這個令人疑惑的問題。柏拉圖區分了“智慧”和“哲學”,他認為“哲學就是擁有真知”。亞里士多德進一步指出:“智慧是關于某些本原和原因的科學。”?他還認為:“智慧既是理智也是科學,在高尚的科學中它居于首位。”?哲學不等于智慧,但它卻可以是通向智慧的“真實的智慧”;智慧不等于知識,但它卻可以是至高的知識;智慧不等于技能,但它卻可以是理念的能力。20世紀末,艾莉給智慧的定義是“智慧就是獲得和運用知識的能力”,“智慧是看穿事物核心或實質的才能,它是處理知識以抽象出本質的規則和事實的一種高創造力的連接方式”。?
基于以上對智慧的理解,結合出版的歷史與當下數字出版的現狀,我們首先可以將默會知識和技藝性知識列入智慧內容的范疇,其次是哲學和文學藝術類內容,最后將自然科學、社會科學、人文科學中不能用數據、信息和知識表達的內容全部納入智慧內容。也許這不是一個科學的類分,但它表示了智慧出版內容的豐富性和廣泛的適用性。我們應當看到,紙質出版一定程度上限制了默會知識和技藝知識的表達方式,但數字化的聲音、視頻和虛擬技術,卻為今后的智慧出版提供了無限想象空間。
出版活動具有物質性和精神性。作為物質活動,它受時代技術的限制,作為精神活動,它受人的思維能力的限制。如果我們將出版理解為是將一定的符號及內容經過編輯加工復制于一定的載體形成產品并進行廣泛傳播的行為的話,那么,由符號、內容和載體構成的出版物就是我們通常意義上的出版對象。出版物的物質性、物理狀態、媒介形式由制作技術決定,出版物的精神呈現由符號、內容類型、意義價值決定。綜合起來,我們認為,出版對象的呈現方式會隨著出版技術的發展而出現多形態的特征。自20世紀下半葉以來,隨著計算機技術的發明和發展,出版對象的介質和呈現方式發生了天翻地覆的變化。概括起來,自紙被廣泛應用之后,其成為出版對象的主流介質,但當下電子介質卻異軍突起。因此,我們將重點討論出版介質中的紙質介質和電子介質,紙質介質之前或與紙質介質并存的泥質介質、石頭介質、莎草介質、貝葉介質、簡帛介質、羊皮介質等略而不論。
具有一定物理狀態的紙質書籍已經誕生1 900年。迄今,封裝型的紙質書籍依然是全世界讀者最喜歡的出版物。紙質書籍之前,還存在其他物理形狀的書籍。最早的書籍,是蘇美爾人以楔形文字書寫在泥板上的泥板書籍,之后有埃及、希臘、羅馬人書寫在莎草紙、羊皮紙上的莎草紙書、羊皮紙書,以及中國的書寫在竹簡、縑帛上的竹簡書籍和帛書,在南亞還出現了書寫在貝多羅樹葉上的貝葉書籍。在中國雕版印刷術發明前,書籍的物理形狀主要是卷子狀,莎草紙書、羊皮紙書、竹簡書籍、帛書和寫本時期的紙質書籍都是卷子狀,泥板書籍是塊狀,貝葉書籍是長條木夾狀。卷子狀書籍的規格受制于載體材料,如:“用以書寫一卷希臘文學作品的紙草,其單張的尺寸很少(甚至從來不曾)超過13×9英寸,而對于中等檔次的書來說,更為常見的尺寸是10×7.1/2英寸。另一方面,袖珍本詩集的紙高可能要短得多。”?自公元2世紀,羅馬開始出現冊子裝幀的紙草書籍,主要流行于基督教人群,至公元4世紀,紙草卷子和紙草冊子一并讓位于皮紙冊子。中國自東漢至唐代,紙質書籍的裝幀形式一直是卷軸狀,唐代末年出現雕版印刷冊子裝幀書籍,到北宋初中國完成由卷軸裝幀書籍向冊頁裝幀書籍的過渡,冊頁線裝是中國書籍的主要形態,一直延續到晚清。15世紀中葉,德國谷登堡發明鉛活字印刷術后,西方書籍一直是冊頁精裝。西方在19世紀開始普及紙皮精裝書籍,20世紀30年代開始廣泛流行紙皮平裝書籍,直到今天,精裝書籍和平裝書籍依然并行。中國自19世紀70年代開始引進西方印刷技術,尤其是石印技術的普及,加速了雕版印刷的衰落,書籍形態也引進了西方書籍的紙皮精裝與平裝形式,但由于經濟等原因,中國的書籍形式一直以紙皮平裝為主,進入21世紀,紙質精裝書籍漸多。20世紀80年代電子書籍興起之后,尤其是90年代互聯網普及之后,紙質書籍被替代的預言不絕于耳,但實際情況是,紙質書籍非但沒有被取代,其出版品種還實現了幾何級數的增長。我們可以用數據對比一下。1996年日本出版的紙質新書是63 054種,而2019年是71 903種。?1996年美國出版的紙質新書是68 175種,2019年是203 757種。?1996年中國出版的紙質新書是63 647種,2020年是213 636種。?盡管紙質書籍已經退縮為出版符號所呈現的一種內容載體形式,但我們堅信,延續了1 900年的紙質書籍傳統依然會繼續發揮它的功能。
與紙質書籍對應的出版符號主要為文字和圖像不同,電子書籍對應的出版符號還包括計算機圖形、音頻和視頻符號,因此,電子書籍作為出版符號的一種呈現方式,具有跨符號的綜合特征。所謂電子書籍(Electronic Book),就是指“通過計算機或類似設備,以數字代碼方式將圖、文、聲、像等信息存儲在磁、光、電介質上,并可復制發行的大眾傳播載體”?。電子書籍依賴的最底層技術是電子計算機技術,但電子書籍的誕生實際上是一系列新技術交互作用的結果,這些技術包括電子技術、計算機技術、軟件技術、信息處理技術、通信技術、激光技術、自動化技術、材料技術、精密機械技術、印刷技術、互聯網技術、數據庫技術、多媒體技術等。用數字來表現模擬,用離散來表示連續,將現實世界的模擬變量用大量的連續的二進制0、1的數字化方式表示,用數字表示一切,從而再現現實世界,將此原理運用于表示文字符號、圖像符號、聲音符號、視頻符號,由此而創制出電子書籍。電子書籍與紙質書籍最大的不同是符號信息載體截然不同,紙質書籍的符號信息載體是紙介質,電子書籍的符號信息載體是磁記錄介質、光記錄介質。磁介質包括軟磁盤(FD,Floppy Disk)和硬磁盤,硬盤有移動硬盤和固定于計算機或服務器中的固定硬盤兩種;光介質為光盤,包括只讀光盤CD-ROM、交互式光盤CD-I、圖文光盤CD-G、照片光盤Photo CD、高密度只讀光盤DVD-ROM等。在實際的出版活動中,依據內容符號系統的特征,我們將電子書籍分為文本電子書籍、靜態圖像電子書籍、動態圖像電子書籍、聲音書籍和綜合性的多媒體書籍等。電子書籍與紙質書籍的另一個顯著不同是,電子書籍的內容符號載體與閱讀終端是分離的,從物理形態上看,電子書籍由內容符號存儲載體、傳輸載體和閱讀終端載體三部分構成,存儲載體是磁盤或光盤,傳輸載體是計算機或計算機網絡或移動通信網絡,閱讀終端是計算機屏幕或類計算機屏幕,電子書籍需要三個載體的結合才能完成閱讀或觀看行為。因此,從閱讀終端的角度分析,我們還可以將電子書籍分為離線載體閱讀、在線載體閱讀和無線移動載體閱讀。離線載體主要是FD磁盤、CD-ROM光盤,在線載體主要是在線計算機、在線筆記本電腦,無線移動載體主要是手機、平板電腦、手持閱讀器。無論載體介質如何不同,也無論傳輸通道是計算機、計算機網絡或通信網絡,有一點是相同的,那就是閱讀內容都要通過終端的屏幕,終端屏幕成為我們可視的物理形態。
與紙質書籍相比,電子書籍對內容符號的呈現方式更趨多樣化。根據實際出版活動中的產品形式和市場行為,我們將電子書籍分為五個產品系統。一是單一符號系統型電子書籍。單一符號指純文字符號或純聲音符號,如1991年5月中國出版的第一部電子書籍《國共兩黨關系通史》就是純文字符號的,此書150萬字,由武漢大學出版社出版,同時出版了紙質印刷版和電子版,電子版可全文檢索,以軟盤形式呈現。再如1993年1月出版的中國第一張數據光盤《中國企業、公司及產品數據庫》也是純文字符號的。中國20世紀90年代的電子書籍以純文字符號呈現的方式為主,并且以軟盤載體為主,后期大規模的尤其是以PDF格式呈現的電子書籍多轉向以光盤為載體。二是多媒體型電子書籍。電子書籍往往綜合性同時呈現多種符號系統,如在一個出版物產品中同時出現文字符號、圖形設計、圖像符號、音頻、視頻、動畫等,構成多媒體、跨媒體或融媒體的產品,多媒體是電子書籍的重要特征。從概念上來說,“多媒體是將不同的媒體種類在個人電腦上融為一體呈現出來”,從產品的角度而言,多媒體“是指基于個人電腦的集文本、聲音、圖像、動畫和圖表于一體的出版產品”。多媒體產品可以是離線的,也可以是網絡在線的,離線的多以CD-ROM光盤的形式呈現,在線的主要是在互聯網上傳播。三是互聯網型電子書籍。電子書籍的載體可以是軟磁盤和光盤,也可以是計算機互聯網絡,書籍內容符號存儲于計算機硬盤或服務器硬盤中。互聯網分為計算機互聯網和移動通信互聯網兩類,電子書籍的閱讀通過PC端計算機屏幕和智能手機端屏幕實現。計算機互聯網的商業應用始于1991年,1994年中國接入全球互聯網。電子書籍內容通過互聯網傳播在2002年被新聞出版總署列為互聯網出版,并將互聯網出版定義為:“互聯網出版,是指互聯網信息服務提供者將自己創作或他人創作的作品經過選擇和編輯加工,登載在互聯網上或者通過互聯網發送到用戶端,供公眾瀏覽、閱讀、使用或者下載的在線傳播行為。”互聯網普及之后,迅速成為電子書籍的主要傳播載體和渠道,由此也導致了軟盤載體和光盤載體的衰落。2007年,蘋果公司推出通過移動通信網絡來實現無線網絡接入的智能手機,從此開啟了移動互聯網新時代,智能手機端電子書籍進入新的傳播時代,手機成為電子書籍閱讀最重要的工具,PC端互聯網的影響力開始下降。以無線通信技術為基礎的手機網絡平臺,還被學界和業界視為一種新的出版平臺,即手機出版平臺,手機出版也相應成為一種新的出版業態。四是手持閱讀器型電子書籍。電子書籍的閱讀和使用必須依賴閱讀專用軟件和硬件。電子書籍閱讀軟件的提供商主要是Adobe公司和微軟公司,Adobe電子書籍閱讀軟件以PDF格式為基礎,可以下載到各種PC計算機、筆記本計算機、掌上電腦(Personal Digital Assistance,PDA)和專用電子書閱讀器上,比微軟的閱讀軟件略勝一籌。像紙質書籍一樣可以便捷地拿在手里隨時隨地閱讀,是電子書閱讀器開發的動力。1986年美國富蘭克林電子出版公司(Franklin Electronic Publishers)研制成功的一種裝載《富蘭克林拼寫詞典》(Franklin Speller)的手持電子閱讀裝置,是世界上第一種手持電子閱讀器。之后,SoftBook出版公司推出了類似掌上電腦的第一代硬件Softbook閱讀器,NuvoMedia公司1998年推出了Rocket Ebook Reader(火箭電子書閱讀器),EveryBook公司推出了EB Dedicated Reader手持閱讀器,電子書籍手持閱讀器市場逐步成熟。日本的夏普公司、松下電器公司和索尼公司也分別研制并上市了自己的電子書閱讀器,但市場效果不佳。2007年亞馬遜公司發售的Kindle專用手持電子書閱讀器是“史上首次取得商業成功的電子書閱覽設備”,2010年蘋果公司的平板電腦也成為非常成功的電子書閱讀器。目前,與電子書籍一道,電子書閱讀器也成為一個產業。五是數字圖書館型電子書籍。傳統的以紙質文獻為主的圖書館是一個搜集、收藏、整理紙質圖書和文獻并提供查閱、咨詢服務的知識傳播實體機構,但自20世紀80年代以來,隨著計算機技術、通信網絡傳輸技術、互聯網技術、多媒體技術和數字出版技術的發展,信息和知識的采集、處理和傳播方式發生了革命性的巨變,傳統圖書館開始轉向信息資源數字化、信息檢索計算機化、信息傳輸網絡化、信息資源利用全時空化、信息服務個性化,數字圖書館開始成型并能提供全球性的平臺化服務。所謂數字圖書館,就是“指搜集、存儲、組織數字化形式的信息,通過計算機網絡提供各種咨詢、檢索等服務以及傳遞信息的系統”。數字圖書館自1998年起逐步成為一個技術系統,這個技術系統的解決方案IBM公司將其架構為資料加工生產與獲取系統、存儲與管理系統、搜索與取用系統、信息傳遞系統、知識產權管理系統,數字圖書館技術在資源建設和管理、用戶信息管理和信息服務方面形成了有別于出版技術系統的新知識管理技術系統。而與此同步,數字圖書館在提供公共信息和知識服務的同時,其性質也開始發生質的變化,一部分數字圖書館依然保留了公共服務性,一部分數字圖書館轉向了商業性。電子書籍、多媒體資源、數據庫等數字資源成為數字圖書館的數字產品,商業性數字圖書館分為三種類型:一是數字圖書館扮演了出版中介的角色,成為一種出版行為,如將紙質書籍數字化并有償提供用戶服務;二是出版商開發售賣性質的數字圖書館;三是技術提供商或網絡運營商聚集內容資源開發搜索或閱讀有償服務。由此,數字圖書館成了一個數字產品,同時它也成為數字出版活動的一個組成部分。
聲音符號既是出版對象,也是一種出版呈現方式。作為產品的聲音類書籍,其名稱還沒有獲得業界和學界的共識,有的名為“有聲讀物”“有聲書”“有聲書籍”,也有人稱之為“音頻書”“音頻書籍”。英文audiobook現在通常被譯為“有聲書”,美國有聲書協會對此詞的定義是:“包含不低于51%的文字內容,復制和包裝成磁帶、高密度光盤或單純數字文件等形式進行銷售的錄音制品。”由此,有聲書從載體上可以分為磁帶型、光盤型和網絡數字型三種,前兩種是有形的,后一種是在線的,但它們都是電子技術的產物,屬于可以用聲音表達的電子書籍形式。而在此之前,有聲書的源頭是唱片。最早的有聲書可以追溯到1931年美國盲人基金會和美國國會圖書館聯合推出的“有聲書計劃”,主要是小說,錄制為時長20分鐘的唱片供盲人使用。1963年,荷蘭飛利浦公司研制成功全球首盤盒式磁帶,1970年第一盤120分鐘的磁帶誕生,1971年Advent公司發售201型磁帶機,錄音和播放器成本和高保真質量大為提高。20世紀70年代,有聲書開始流行。20世紀90年代,CD光盤型有聲書開始流行。1997年,Audible.com推出世界上第一款面向大眾市場的數字聽書播放器,數字有聲書開始走向市場。2010年后,有聲書市場突然出現爆發式增長。2010年,美國有聲書出版品種數為0.62萬種,2015年達到了3.56萬種。2017年,美國有聲書出版數量達到4.6萬種。世界出版50強的大眾出版集團是美國有聲書出版的主力,如企鵝蘭登書屋、西蒙&舒斯特公司、哈珀·柯林斯出版公司的有聲書銷售增幅都超過了20%。中國的有聲書發展也超過了世界發展水平,“艾媒咨詢《2018—2019中國有聲書市場專題研究報告》數據顯示,2018年中國有聲書用戶規模達到3.83億,預計將在2020年達到5.59億人”。2018年市場規模達到46.3億元。目前,出版、生產和傳播有聲書的企業主要有三類:傳統出版社或集團,如中國出版集團、中信出版集團等;數字閱讀平臺加入聽書功能或新建聽書平臺,如掌閱聽書、閱文聽書、咪咕閱讀、QQ閱讀、微信閱讀、百度閱讀、網易云閱讀等;新興聽書平臺,如懶人聽書、得到、十點課堂、樊登讀書、喜馬拉雅FM、蜻蜓FM、荔枝FM等。作為數字時代電子書籍的一個品類,有聲書為紙質書籍和原創電子書籍內容轉換為聲音產品提供了可能并已經實現這一可能,有聲書已經成為出版產業新的經濟增長點。
以視頻方式呈現紙質書籍內容,在計算機數字化時代已經成為現實。與有聲書的書籍形態相對應,視頻書的概念呼之欲出。所謂視頻書,我們可以將其定義為:以二進制數字化方式記錄、存儲和編輯加工制作的具有一定長度和主題集中的、在計算機網絡或通信網絡傳輸、傳播的動態影像內容。簡言之,視頻書是數字化的動態影像的書。一定長度是相對于短視頻而言的,我們認為,無論什么形式的書籍,均需要主題和長度,如紙質書籍要求不低于49個頁碼,那么,視頻書的時長應當不低于30分鐘,也就是說長視頻以上才可以稱得上為書。關于視頻長短的界定,一般將5分鐘以下列為短視頻,6—30分鐘為中視頻,30分鐘以上為長視頻。一種視頻書,我們認為是長視頻的形式,它可以由大量短視頻和中視頻構成,也可以由一定數量的長視頻構成,與一部紙質書籍由若干章節構成同理。當前中國出版的視頻書,均是由數量不等的長、中、短視頻組成的,如2018年人民出版社出版的《不朽的馬克思》,是紙質書和視頻書同時出版的,紙質書為平裝16開,視頻以二維碼的方式印于書尾,讀者用手機掃描二維碼即可觀看視頻,視頻共有37集100分鐘。換言之,我們也可以說短視頻是視頻書的重要組成元素。短視頻的發達是視頻書的起點和基礎。短視頻應用最早出現在美國,2011年第一款短視頻制作應用軟件Viddy問世,“用戶可通過Viddy拍攝短片并添加音效和特效美化功能,最后剪輯成視頻短片在社交平臺分享”。美國三大社交平臺迅速跟進,Twitter推出Vine短視頻應用App,Facebook推出Instagram短視頻分享軟件,YouTube推出MixBit視頻分享軟件,短視頻隨即爆火。中國的短視頻用戶和分享數量在很短的時間內即成為全球第一,2021年短視頻用戶規模達9.34億,愛奇藝、優酷、騰訊視頻居于行業頭部位置。短視頻的快速發展,為視頻書的開發奠定了內容和素材基礎,但從出版的實踐活動看,視頻書還不是一個成熟的出版門類。隨著5G、6G時代的到來,長視頻將成為主要的傳播場景,視頻書的時代才可能真正到來。視頻書將會朝三個方向發展:一是紙質書籍的視頻化,這是初級階段;二是原創視頻書興起,出版者按照書籍的主題和邏輯制作視頻書,同時也可以還原為紙質書籍,進入融合出版階段;三是課程化視頻書崛起,將各門類知識制作為長視頻的課程,形成以視頻形式存在的課程式的獨立產品,課程將成為視頻書的主流,這是視頻書最重要的方向,進入場景化出版階段。
數據庫作為數據、信息、知識和智慧的呈現方式,并且成為一個出版活動,完全依賴于計算機技術的發展。20世紀60年代中期數據庫技術產生,歷經第一代層次和網狀數據庫系統、70年代第二代關系數據庫系統、80年代面向對象數據庫系統三個發展階段。按照提供數據的性質,數據庫分為文獻數據庫、數值數據庫、事實數據庫和多媒體數據庫;按照數據庫內容分為綜合性數據庫、專業性數據庫和專題性數據庫;按照數據庫載體類型分為磁帶數據庫、磁盤數據庫、光盤數據庫和聯機數據庫。與出版最直接關聯的是文獻數據庫,其主要分為兩類:“一類是收錄了論文、稿件等的目錄事項或摘要等,所謂二次信息的文獻參考(reference)數據庫;一類是收錄了數值、圖像、影像、聲音、圖書以及論文、稿件等文獻全文(fulltext)的事實(信息源)數據庫。”1961年1月,美國化學會《化學文摘》服務社創辦的新雜志《化學題錄》(雙周刊,一年24期)同時出版紙質印刷版和磁帶版,此磁帶版被視為世界上第一種電子出版物,此題隸屬于二次文獻性質,具有數據庫雛形。1964年,美國醫學圖書館利用計算機對《醫學索引》(Index medicos)進行排版并將數據轉換到磁帶上形成機讀數據,此數據庫通常被視為最早的計算機數據庫。此后,美國的《化學文摘》《生物學文摘》《工程文摘》《科學引文索引》等計算機數據庫建立。二次文獻型數據庫自此進入出版領域。全文數據庫出現稍晚,1973年“美國米德公司建成世界上第一個面向公眾查詢的大型全文數據庫Lexis”,自此,全文數據庫成為全球文獻數據庫的發展方向,并成為數字出版的重要門類。中國的數據庫開發稍晚于美國,1980年,中國化工信息研究所開始研究和建設第一批中文數據庫,至1991年,“全國共建成800多個數據庫”。1992年,北京大學發行英文版《中國對外經濟貿易法律全文數據庫》光盤,這是我國第一個CD-ROM全文數據庫。1993年,中國第一家數據庫專業公司“萬方數據公司”成立。2000年,原萬方數據(集團)公司由中國科學技術信息研究所聯合中國科技出版傳媒有限公司、科技文獻出版社等組建成立北京萬方數據股份有限公司,推出萬方數據知識服務平臺、萬方醫學信息服務平臺、萬方數據中小學數字圖書館、萬方視頻知識服務系統等數據庫產品,萬方公司成為中國最重要的數據庫出版公司之一。作為一種出版形式,數據庫出版已經覆蓋到出版物的各個門類,也已經覆蓋到社會科學、人文科學和自然科學的各個學科,甚至延伸到了人類生活的各個方面。
在出版符號和內容呈現上,數據庫不僅僅是一種呈現方式或出版形式,更重要的是它還是技術和工具。數據庫可以作為獨立的電子產品被銷售給機構和客戶,同時,它還為計算機互聯網(PC端互聯網)和通信互聯網(移動端互聯網)上的應用平臺(App)提供后臺技術支持,如后臺數字內容管理系統(Content Management System,CMS)、數字資產管理系統(Digital Assets Management,DAM)、數字權利管理系統(Digital Rights Management,DRM)等均屬于數據庫技術的范疇。平臺是一個用戶界面,各種應用程序(App)是一個個不同程度的用戶界面(平臺),這些平臺只有通過后臺的數據庫技術管理才可以實現應用。應用層面的搜索引擎、信息檢索、決策工具、咨詢服務、一對一解決方案、個性化服務等均依賴數據庫技術,數據庫實際上是數字出版的核心基礎和底層技術。在出版活動的實踐層面,三大領域的出版商,其數字內容、平臺、服務和應用無一不通過后臺數據庫技術來實現。專業出版領域,出版商一方面直接提供書目、索引數據庫和全文數據庫,一方面搭建在線數字平臺提供檢索工具、研究工具、決策工具和解決方案,如勵訊集團的ScienceDirect數據庫在線平臺,“收錄了自然科學、社會科學、醫學類別下22個學科的2 500多種期刊以及數千種圖書、1.2萬多個視頻、超過170萬張圖片等”。此數據庫既是全球最大的全文數據庫,也是在線的一個信息查詢和信息服務平臺。在教育出版領域,出版商同樣通過直接提供在線海量信息資源庫和推出在線平臺提供一系列教與學服務,尤其是在個性化學習和一對一學習解決方案方面,教育出版商更需要通過網站和教學平臺來實現。如培生集團的EQUELLA(數據庫)是一個“專業的教育內容數字在線倉庫”,MyLab是基于互聯網的在線學習和輔導工具,Pearson Learning Solutions在線平臺“是為用戶解決學習過程中各種需求和問題的個性化學習解決方案”。在大眾出版領域,出版商更偏重于建立自己的電子書資源庫和有聲書資源庫,直接在自己的平臺上分銷,而原創網絡文學平臺則選擇了直接搭建終端閱讀平臺,將作者創作的文學作品放在平臺上供用戶在PC端、手機端、平板電腦端直接閱讀或聽取,二者的后臺都需要一個數據庫來支撐。大眾出版的這兩種數字出版模式,前者以企鵝蘭登書屋為典型,后者以閱文集團的起點中文網為代表。由上可知,數據庫出版這種形式已經滲透到數字出版的各種形態之中。
總體而言,進入印刷時代,出版介質主要是紙介質;進入計算機時代,出版介質進入磁介質、光介質和紙介質并用時代,而出版物(書籍)則相應以紙質書、電子書、有聲書、視頻書、多媒體書、數據庫形式呈現。
綜合以上論述,我們認為出版對象由出版符號系統、被傳遞物內容類型和內容載體介質三要素構成,反過來說,符號、內容和介質共同構成了出版對象。出版對象就是由一定的符號系統表達一定的內容并承載在一定的介質之上,呈現出不同形態的出版物。構成出版物的三個要素缺一不可。譬如,漢代司馬遷的《史記》一書由作者書寫在竹簡上,他書寫的符號系統是文字,被文字傳遞給后人的內容是歷史知識,符號、知識和介質共同構成了《史記》這本書。紙被發明之后,其內容被重新書寫在紙上。雕版印刷術被發明后,其內容又被雕版印刷在紙上。石印、鉛印、數碼印刷機被發明后,其內容又被機械印刷機印刷在不同的紙上。計算機被發明后,其內容又以二進制的數字方式被存儲于計算機并被轉換到不同屏幕上而成為電子書,其內容還被數字化為有聲書、視頻書,以及被制作為數據庫以供檢索和研究。無論《史記》這本書的形態如何變化,但構成它的符號、內容和介質要素必須是完整的。然而,在實際的出版活動中,我們看到的往往是變化,出版符號系統在變化,內容類型在變化,載體介質在變化,這些變化都不同程度地來自技術的發明、發展和應用在出版對象的演進中起到了關鍵性的作用,技術影響到了符號系統的變化、內容類型的變化和載體介質的變化,由此也決定了出版對象的物理形態和呈現方式的變化,進而,所有的變化都影響到出版活動的意義和利益獲得。作為業界中人,我們必須隨著出版對象的變化而變化,必須找出出版對象變化的規律,必須理性地動態定義自己的出版行為,厘清這些變化正是我研究出版對象的目的所在。也許,也是意義所在。
注釋
① 卡西爾.符號形式的哲學[M].趙海萍,譯.長春:吉林出版集團股份有限公司,2018:216.
② 卡西爾.人論[M].甘陽,譯.上海:上海譯文出版社,1985:41,42,35.
③ 馬祖爾.人類符號簡史[M].洪萬生,洪贊天,英家銘,等譯.南寧:接力出版社,2018:2.
④ 見https://www.MerriamWebster.com/dictionary/symbol,查詢時間為2022年8月22日。
⑤⑩ 霍克斯.結構主義和符號學[M].瞿鐵鵬,譯.上海:上海譯文出版社,1987:129,139.
⑥⑦⑧ 彼得里利,蓬齊奧.打開邊界的符號學:穿越符號開放網絡的解釋路徑[M].王永祥,彭佳,余紅兵,譯.南京:譯林出版社,2015:28,5,28.
⑨ 馮月季.傳播符號學教程[M].重慶:重慶大學出版社,2017:3.
? 費希爾.書寫的歷史[M].李華田,李國玉,楊玉婉,譯.北京:中央編譯出版社,2012:30.
? 光復書局大美百科全書編輯部.大美百科全書[M].臺北:光復書局企業股份有限公司,1990:380.
? 胡易容.圖像符號學:傳媒景觀世界的圖式把握[M].成都:四川大學出版社,2014:82.
? 余鳳高.插圖的歷史[M].北京:中國文史出版社,2020:8.
? 凱夫,阿亞德.極簡圖書史[M].戚昕,潘肖薔,譯.北京:電子工業出版社,2016:184.
? 夏野.中國古代音樂史簡編[M].上海:上海音樂出版社,2010:75.
? 姜夔.姜白石詞箋注[M].北京:中華書局,2013:4-5.
? 孟偉.音頻媒體研究[M].北京:光明日報出版社,2020:2.
? 熊澄宇.媒介史綱[M].北京:清華大學出版社,2011:153.
? 瓊斯.新媒體百科全書[M].熊澄宇,范紅,譯.北京:清華大學出版社,2007:474.
?? 李幼蒸.歷史符號學[M].桂林:廣西師范大學出版社,2003:283,283.
? 百度“數據”詞條,由“科普中國”科學百科詞條編寫與應用工作項目審核。
??? 《數據庫百科全書》編委會.數據庫百科全書[M].上海:上海交通大學出版社,2009:11,662,848.
? 大數據戰略重點實驗室.塊數據2.0[M].北京:中信出版社,2016:39.
? 霍爾姆斯.大數據[M].李德俊,洪艷青,譯.南京:譯林出版社,2020:7.
? SHANNON C E.A mathematical theory of communication[J].The bell system technical journal,1848,27(3):379-423.
?? 洛根.什么是信息:生物域、符號域、技術域和經濟域的組織繁衍[M].何道寬,譯.北京:中國大百科全書出版社,2019:23,41.
?? 周昌忠.西方科學方法論史[M].上海:上海人民出版社,1986:438,13.
? 中國大百科全書出版社編輯部.中國大百科全書(簡明版)[M].北京:中國大百科全書出版社,1996(10):5441.
?? 王維嘉.暗知識:機器認知如何顛覆商業和社會[M].北京:中信出版社,2019:20-31,25.
? 何守才.數據庫綜合大辭典[M].上海:上海科學技術文獻出版社,1995:180.
? 肖仰華.知識圖譜:概念與技術[M].北京:電子工業出版社,2020:15.
? 方勇.墨子[M].北京:中華書局,2015:63.
? 任繼愈.佛教大辭典[M].南京:江蘇古籍出版社,2002:1182.
? 先剛.柏拉圖與“智慧”[J].學術月刊.2014(2):49.
? 柏拉圖.柏拉圖全集[M].王曉朝,譯.北京:人民出版社,2003:(2):656.
? 亞里士多德.亞里士多德全集(7)形而上學[M].苗力田,譯.北京:中國人民大學出版社,2016(7):29.
? 亞里士多德.亞里士多德全集(8)尼各馬科倫理學[M].苗力田,譯.北京:中國人民大學出版社,2016(8):127.
? 艾莉.知識的進化[M].劉民慧,等譯.珠海:珠海出版社,1998:83-85.
? 凱尼恩.古希臘羅馬的圖書與讀者[M].蘇杰,譯.杭州:浙江大學出版社,2012:111.
?? 羅紫初.比較出版學[M].武漢:武漢大學出版社,2006:60,60;魏玉山.國際出版業發展報告:2020版[M].北京:中國書籍出版社,2021:370,17.
? 中國出版年鑒1997[J]1997:8;中國出版年鑒2021[J].2021:836.
? 張立.數字出版學導論[M].北京:中國書籍出版社,2015:24.