毛文濤
讀者在手機、Pad 等移動終端上閱讀電子書的過程中,遇到生僻的字詞、生疏的知識,只要劃動手指選中它們,點擊“查詢”按鈕,詞條的讀音、釋義等內容瞬間就被推送到讀者的終端,并以彈窗的形式呈現出來。這種“屏幕選詞、釋義立現”的知識查檢功能因為查檢順滑快捷,而且不打斷閱讀過程,體驗極佳,深受讀者歡迎。彈窗底部的一行小字告訴人們,在這背后提供服務的,就是聚典數據開放平臺(簡稱“聚典”)。
聚典是上海世紀出版集團(簡稱“世紀集團”)規劃設計、上海辭書出版社研發運營的一款創新的互聯網數據服務產品,開創了傳統工具書數字化轉型的新模式。概括起來說,其基本業務邏輯是:①聚合各類優質工具書內容,形成系統可信的云端數據倉庫;②開放數據接口,授權應用開發商實時調用;③讀者發出查詢請求時動態載入詞條數據;④查詢落空時,及時增補優化,形成業務閉環。
聚典于2020 年8 月13 日正式發布上線,已穩定運行了三年,初具規模,還在快速發展。歸納而言,聚典取得了三方面的成果。
目前,聚典總用戶數超過4800 萬人,每月活躍用戶數超過600 萬人,已經成為一個比較成熟的互聯網應用平臺。在為用戶提供知識查檢服務的同時,用戶的查詢行為也都匯聚到聚典平臺。在聚典平臺,可以直接觀察到用戶對各類知識的查詢情況,也可以分析把握讀者閱讀行為的特點和規律,以及區域分布情況等。這些寶貴信息的獲得,在過去對出版單位而言是難以想象的。
目前,聚典已經聚合了世紀集團內外10多家出版社的近200 種權威工具書,共計430 多萬條詞條,已成為國內最大的工具書數據開放平臺,為各類工具書提供了一個一致且完整的數字化解決方案。未來,聚典還會不斷增補優質工具書,形成學科覆蓋更加全面、詞條數據量更大的工具書數據開放平臺。
隨著技術迭代,聚典還顯示了很強的輻射力。聚典已經從最初的數字閱讀場景,快速擴展到在線搜索、新聞資訊和智能硬件等多種應用場景,已經在近40 個品牌互聯網應用中落地使用,不少還是頭部互聯網應用。比如,在數字閱讀領域,有微信讀書、掌閱App、得到電子書、咪咕閱讀、起點中文網和七貓小說等;在新聞資訊領域,有澎湃新聞、學習強國和上觀新聞等;在在線搜索領域,有百度百科、百度漢語、搜狗漢語、抖音漢語等;在智能硬件領域,有小度詞典筆、小尋詞典筆、皮皮旸學習機等。
之所以能做到這一點,是因為聚典獨特的商業模式。一直以來,出版社多采用內容授權、內容交付的方式,通過互聯網應用開發商為讀者提供服務。這種方式的局限性是非常明顯的,很大程度上制約了出版社的數字化轉型發展。
聚典的商業模式不是典型意義上的B2B模式,也不是典型意義上的B2C 模式,而是獨特的BBC 模式,即在商業上是B2B,在數據流上是B2C。也就是說數據是直接發生在用戶的終端和聚典的云服務器之間的,這保證了聚典數據的安全。
商業模式的創新是聚典得以快速發展的根本。BBC 模式很好地解決了讀者在數字閱讀過程中的痛點,提高了閱讀效率,改進了閱讀體驗;很好地平衡了各方利益,C 端用戶無需付費,B 端客戶付費得到增值服務,在增加其用戶黏性的同時,無需進行大規模數據加工,極大節省了成本。聚典在總體上創造增量價值的同時,通過制度的設計很好地平衡了增量價值的合理分配,讓各方都分享到其中的一部分,調動了參與各方的積極性。
一言以蔽之,聚典是在辭海網絡版建設的過程中衍生出來的一個創新產品。
這一構想大約萌發于2018 年年初。產生這個想法的背景是,當時正在推進辭海網絡版這一重大項目的建設。因為世紀集團出版了大量的優質工具書,因此在建設辭海網絡版的過程中不可避免地就要思考如何系統解決傳統工具書出版的“整體轉型”問題,為各類工具書的數字化轉型提供一個整體解決方案。
當然,這只是基于出版單位自我發展需要的考慮。只有這個來自自身的動力是不足以設計出聚典的。在不斷摸索的過程中,我們也觀察到很多互聯網公司對《辭海》《漢語大詞典》《十萬個為什么》等優質出版資源的需求很強烈。這種需求不僅頻度高,而且范圍廣,這讓我們認識到工具書的核心價值所在,并形成向多方提供“數據服務”的設想。
有了“數據服務”這個設想之后,如何找到合適的應用場景和突破口成為另一道難關。巧的是,當時Kindle 推出了一個詞匯量有限的聯機詞典查詢功能,可以在Kindle 閱讀器上劃動手指選詞之后查詢聯機詞典。這個功能喚醒了我們對PC 時代屏幕選詞右鍵查詢的記憶,從而找到了工具書“數據服務”的落地場景。在這個場景中,海量內容都可以“隨身攜帶”“隨處使用”,使工具書在移動閱讀環境繼續發揮“工具”作用。
完整的構想就此形成:即打造一個依托世紀集團下屬各出版社豐富且權威的工具書出版資源,通過賦能B 端客戶進而滿足C 端讀者數字閱讀過程中的知識查檢需要,內容集成、場景泛適、多向賦能的開放性知識應用平臺—聚典。
從聚典誕生的整個過程不難看出,“強烈的使命追求、巨大的市場需要、恰當的應用場景”催生了聚典。
我們最重要的一個體會是,對傳統出版單位來講,數字出版一定要深深地扎根在長期積累的優質出版資源的基礎之上。對聚典而言,《辭海》《漢語大詞典》以及世紀集團各出版社長期積累的大量優質工具書資源,是聚典模式得以成立的物質基礎。可以說,沒有《辭海》,就沒有聚典。
同時,我們也深刻地體會到,如果沒有對互聯網發展規律的認識和把握,并按照規律辦事情,聚典也不會橫空出世,并發展到目前的水平。
隨著互聯網的普及,傳統行業在轉型發展過程中曾經爭論過一個問題:究竟是“互聯網+”還是“+互聯網”?對于出版行業來說,關鍵在于搞清楚互聯網規律究竟是什么,如何按照互聯網規律推動出版的數字化轉型發展。結合聚典幾年來的發展,在這方面,我們的體會主要有四點。
出版的數字化首先要回歸基本問題,即要首先聚焦于“用戶是誰”“用戶需要什么”“用戶在什么情況下使用”“如何方便用戶使用”這些最基本的問題。觀察出版行業,不少出版單位在開展數字出版工作的時候,往往還是將圖書內容電子化之后,簡單平移或者堆積,沒有很好地考慮用戶的實際應用場景和使用痛點,更疏于不斷打磨迭代產品,使得用戶體驗很不理想,只能落得無人問津的境地。相反,如果以場景化應用為切入口,以用戶需求為導向,小應用也會有大市場。聚典就是從一個很小的應用切入,解決了讀者一個小小的痛點,后來拓展到眾多場景并形成大范圍應用的。
縱觀20 多年來數字經濟發展潮流,平臺經濟占據重要位置,呈現蓬勃生機。出版行業推動數字化轉型,最為重要的就是把握平臺經濟規律,打造真正具有競爭力的數字出版平臺。通過平臺化實現規模效應,主要體現在:提供一站式海量選擇、達到極低的邊際成本、實現流量的非線性變現、實現病毒式品牌傳播。
行業內稱為數字出版平臺的數不勝數,真正由傳統出版單位建設的成熟的平臺,則又屈指可數。我們認為,一個成功的集成性數字出版平臺,應當具備三種能力:一是一體化融媒體編輯能力,這是實現傳統內容生產方式向數字化內容生產方式轉變,適應網絡化傳播所必須具備的工具和推動組織轉型的助推器;二是門戶級用戶響應能力,這是實現大規模用戶鏈接,形成廣泛應用的保證;三是技術驅動的知識服務能力,這是平臺依靠傳統出版長期積累的優質資源發展起步之后,能否自我造血、迭代前進的動力機制。三種能力缺一不可,三種能力的有機互動,將逐步推動平臺形成為一個數字出版生態閉環。
對于數字出版而言,數據不僅包括內容數據,還包括用戶數據和閱讀行為數據等,對這些數據的有效采集、高效存儲、科學分析、合理利用,乃至以數據驅動產品研發和服務,這是一篇大文章,是數字出版不能回避的一個重要問題。
用戶思維是從產品端考量的,著眼于怎樣把產品做得好用;平臺思維更多的是從商業端考量,著眼于如何構建一個合理的商業模式;而聯系這兩者的是數據,基礎則是技術。
“怎樣對待技術以及怎樣進行有效的技術管理”,這是一個長期困擾傳統出版人的問題。在傳統出版社數字化轉型的過程中,對待數字技術的應用有兩種極端的傾向:一是對技術感到恐懼,甚至不想面對它;二是認為技術無用,認為技術問題簡單外包給開發公司即可。
在發展聚典的過程中,我們要求持續培育并形成出版單位自己獨立、完整的技術隊伍和開發能力。其可行性在于,在推進數字化轉型的過程中,所需要使用到的都是相對成熟的數字技術,技術方面所做的更多的是集成,而不是做原始創新。對于這類技術,出版單位完全可以掌握。其必要性在于,一是技術要為產品服務、為商業邏輯服務,持續的技術迭代是保持產品和服務具備競爭力的基本要求,否則將制約產品和服務的自主性;二是技術不僅可以為產品提供更好的體驗、創新產品形態,甚至還使得某些商業模式得以成立,而這些創新在早期是需要在一定的保密情況下進行的。其實,如果不是因為4G/Wi-Fi 網絡提供足夠高的數據傳輸速率,屏幕查詞延時超過幾秒的話,用戶體驗就極為糟糕,聚典就不成立了。所以,出版數字化轉型一定要建立在技術能力的提升和技術隊伍的成長之上。
系統、優質的工具書出版資源是聚典發展的基礎。知識內容包羅萬象,涉及的學科門類眾多,僅一兩家出版社的工具書難以滿足用戶的查檢需求。因此,在設計聚典的時候,不僅需要考慮對下游客戶開放,為所有互聯網應用提供服務,也要對上游內容提供方保持開放。聚典不僅整合了世紀集團內幾乎所有優質工具書資源,還進一步吸收了世紀集團外其他出版社的優質工具書資源,并將繼續保持開放,目標是圍繞構建系統權威的知識體系,將聚典打造成數據量最大、學科和專業最齊全的工具書數據開放平臺。當然,在聚典整合工具書內容資源的過程中,也不是毫無選擇地將所有工具書都收入聚典平臺,而是要嚴格篩選經過市場檢驗的優質工具書,這也正是聚典與網絡百科最大的區別。聚典將為用戶嚴把質量關,過濾掉不可靠信息,在擴大平臺數據規模和為用戶提供準確內容間找到平衡,讓用戶既能“有問必應”,又能“有應必準”,讓用戶獲得可信賴的知識服務,降低信息過濾成本和錯誤信息帶來的潛在風險。
隨著應用的拓展,聚典已經開始聚合古詩文等非典型的工具書內容。可以預見的是,伴隨著聚典的成長,它將逐步整合其他類型的優質出版資源、優秀的經典著作,從“聚合詞典”延拓為“聚合詞典”與“聚合經典”并重,成為真正聚合中華優秀文化、構建完整知識體系的大平臺。
圍繞“查檢更有效、體驗更友好、服務更智能”的目標,歷時近10 個月,聚典完成了2.0 版的迭代工作,并于2023 年8 月15 日發布。
這次迭代主要在幾個方面做了改進。一是改進內容質量,豐富了數據類型。聚典對數據倉庫內詞條進行了去重、糾錯和規范化處理,還對查詢落空的情況進行分析篩選,及時補充新詞新語,還增補了古詩文等類型的大量內容。二是改善用戶體驗,通過改進參見系統、擴充同位詞和舉例詞等做法,改變了紙質辭書受限于版面而不得不采用的一些傳統做法,改善了用戶體驗。三是提高了容錯能力,對用戶的查詢內容進行智能化容錯,基本實現了對原文錯誤、切詞錯誤或者切詞遺漏等問題的智能容錯并提供分詞服務。
自2020 年聚典發布,三年來平臺迭代工作一直在不斷地推進。內容上,通過查詢落空反饋機制及時捕捉用戶需求,不斷充實和改進;技術上,不斷適應互聯網應用的極限挑戰,持續提高響應能力和技術水平;服務上,不斷豐富應用場景,改進用戶使用體驗,提高服務效能。聚典就是這樣堅守“一絲不茍、字斟句酌、作風嚴謹”的辭海精神,堅守“數據服務”的產品定位,不斷完善和迭代進步,努力去服務各類應用和最廣大的互聯網用戶。
1936 年《辭海》(第一版)的“編輯大綱”強調:“為辭書者,自當體察用者之需要,恰如其所需以予之。”聚典發端于《辭海》,也沿襲了《辭海》孜孜以求的事業。
聚典是一個賦能平臺,它的使命是“為閱讀賦能、為學習賦能、為搜索賦能”。長遠來說,我們希望聚典能夠像電力、自來水那樣,無論何時、何地、何種應用場景,都可以在讀者需要的時候以最為快捷、方便的方式,甚至無感地為讀者提供完美的知識查檢服務,努力“成為數字時代的文化基礎設施”。
以“數據服務”為產品定位,以“為閱讀賦能、為學習賦能、為搜索賦能”為使命追求,立志“成為數字時代的文化基礎設施”的聚典數據開放平臺,2023 年8 月在正式上線三周年之際發布了“查檢更有效、體驗更友好、服務更智能”的2.0 版。謹以此文,記錄聚典的誕生,回顧聚典的成長,總結聚典的特點,期許聚典的未來。