吳曉鳳,高 峰,蔡國瑞
(1.中國科學院蘭州文獻情報中心;2.中國科學院大學經濟與管理學院圖書情報與檔案管理系;3.賓夕法尼亞州立大學信息科學與技術學院)
冰山模型最早是由哈佛大學麥克利蘭提出的,他被任命挑選美國外交官一職的合適人選,他將人外顯的知識、形象、技能等這些易于被感知和培養的素質比作水上的冰山,把看不到的動機、態度、個性等不易被感知和培養的素質比作冰山在水下的部分 (見圖1)。[1]
美國學者萊爾·M·斯潘塞和塞尼·M·斯潘塞將麥克利蘭的冰山模型進行了細化分層,分為“基準性素質”和“鑒別性素質”兩層,前者對應于水上的冰山,即知識、形象、技能等,后者對應于水下的、用于支撐水上部分的冰山,它是績效好壞區分的關鍵,一般職位越高,它的影響就越大。[2]

圖1 麥克利蘭的“冰山模型”理論
美國學者博亞特茲結合了麥克利蘭冰山模型和萊爾·M·斯潘塞、塞尼·M·斯潘塞的理論,提出了“素質洋蔥模型”,并將其從內到外細化為三層,分別是“核心層”“中間層”“最外層”。“最外層”即冰山以上的部分,包括“知識、技能”等,冰山水下的部分分為“價值觀、態度、自我形象”等的中間層和“個性、動機”等的核心層(見圖2)。

圖2 素質洋蔥模型
我國學者鐘啟泉將冰山模型引申到了學力(學習能力和知識水平)領域。[3]日本知識管理專家野中郁次郎等提出了顯性知識和隱性知識相互轉換的過程。[4]王愛文等將這個相互轉化關系應用到創業實訓模式探討中,提出構建搭建創業實訓服務體系等模式構建對策。[5]蔣保偉等利用冰山模型區分出了對創業成功與否起決定作用的隱性素質,說明創業素質的提升在關注顯性素質的同時,還需要充分挖掘吸收隱性素質。[6]目前,冰山模型還被應用于高校輔導員勝任力模型的構建、公司領導層素質特征研究[7]、知能課程目標體系確定[8]、甄選培養人才的方法總結[9]等。
1985年,趙紅州等提出了從微觀角度分析普萊斯指數定律的理論,即知識結晶學理論,[10]認為科學發展的“非常時期”,吸收的熱即人類的智力投入,不再用來提升溫度即不是用來指數增加知識,而是用來使原來的晶體發生改變即用來改變知識結構。因此,知識增長也存在著飽和性。知識晶煉和情報學有密切的聯系,其研究對象和研究內容存在交集。王宏鑫討論了知識論情報測度的基礎,將布魯克斯情報測度,知識結晶學理論和“思想基因”理論聯系在了一起。[11]呂漢波等結合科學結構學、潛科學理論,將知識結晶學中的知識單元用于構建二元學科骨架知識結構理論模式,探析現代學科結構體系的建構方式。[12]齊秀梅發展了知識結晶學理論,她認為現代科學知識已經不是一個沒有結構的幾何點了,它有知識門類的宏觀結構,也有知識纖維、硬核、觀念勢場等的微觀組成。[13]
除了國內學者對知識晶煉理論的相關研究,國外的一些學者也做了一些深入的研究。Fischer基于知識管理系統的整個生命周期提出了“播種,進化增長,重播”的“SER(Seeding,Evolutionary Growth,Reseeding)模型”。SER模型是為了理解大系統可持續發展的集中式和分散式演進之間的平衡:播種需要將盡可能多的知識嵌入到架構的所有組件中;進化階段領域設計人員使用種子環境為客戶開展特定項目,這個設計過程當中可能會產生新的需求和新的組件;重新播種階段環境開發者重新與領域設計者合作來組織、形式化和推廣在進化生長階段添加的知識。[14]Mackinlay等于1999年提出知識結晶框架,為知識結晶指定三個要素:數據,任務和計劃。他們認為,知識結晶框架是針對一項任務,通過“尋找數據、搜尋計劃、實例化計劃、解決問題、對全過程創造簡練的描述”工序來完成。[15]Amitani等提出了“知識液化和知識結晶”的知識管理概念,設計了一個知識星云結晶器支持這個概念的實現,并且將這個方法論應用到展覽設計這一實際工作當中。[16]Koichi Hori等也研究了知識液化和結晶框架,該框架可以被看作SER模型“Evolutaionry-growth”階段的框架。知識結晶在相關單元之間發現一個新的內聚結構,知識液化將一個內聚結構分解成相關單元。他們設計和開發基于知識液化和結晶框架作為知識演進領域的計算機系統,包括知識星云結晶器KNV、livingOM和ART-SHTA,將這些系統作為表征世界,說明通過人際在概念世界、表征世界和現實世界的互動中來進行知識液化和結晶的循環演化。[17]Pollack等對臨床醫生在患者護理活動中使用的優先級過程招募了23名醫生進行模擬操作,發現了這個過程和Card等的知識結晶框架有著顯著的差異,并為此提出了一個新的模型,這個模型表示出了優先級過程如何受到數據收集和處理的影響。[18]2017年,蔡國瑞等提出了構建知識晶煉任務的概念框架。他認為知識晶煉的含義是針對有爭議的問題,能提取該問題的所有數據,并通過一個系統的過程,提取相關有價值的情報,通過凈化、提煉和壓實等技術,以創造一種可以被大眾理解和相信的最好的和最容易獲得的知識形式。[19]
總體而言,目前國內對于知識晶煉的研究還只是局限于一些理論研究的基礎上,并且理論研究也不夠完善,知識晶煉實際應用的研究則更是微乎其微。
大數據時代,獲取特定的知識以及該知識背后的數據、信息的加和可以被描述成一座冰山。肉眼能看到的冰山的比例大概只占10%,然而這個數字背后的抽象部分是不可見的,剩下的90%都是隱性的。正冰山模型是透過海上冰山探究該冰山的海下部分,即透過肉眼能看見并獲取的知識,從而探究其背后的數據、信息(見圖3)。反冰山模型是針對當前所存在的海量且凌亂的數據而導致了某種特定的知識獲取受阻的情況,即在參差不齊的海水中,已然看不見冰山頂角的情況(見圖4)。當前社會,由于信息量太大,人們看到的幾乎都是汪洋大海,顯性的冰山頂尖也已被充滿雜質的海水覆蓋,即某種特定需要被獲取的知識被周圍其他稀釋和凌亂的數據、信息所覆蓋。反冰山模型就是面對大數據從海底冰山晶煉出海面冰山的過程。

圖3 正冰山模型

圖4 反冰山模型
冰山在生成之后,還可能會升華和凝華或熔化和凝固,得到三種結果:① 重構原來的冰山;② 在重構原來的冰山基礎上還產生了新的冰山;③ 只產生了新的冰山,沒有重構原來的冰山,接著可能再升華和凝華或熔化和凝固。如此循環往復,將整個冰山晶煉過程構成了一個雙循環的過程,形成冰山雙循環模型(見圖5)。

圖5 冰山雙循環模型圖
國內外對于知識晶煉理論的探索以蔡國瑞的研究較為系統,他提出的基于問題的知識晶煉模型(Issue-Based Knowledge Crystallization,IBKC)(見圖 6) 較為完整地闡述了知識晶煉的過程,具有一定的先進性。具體的完整性與先進性在于IBKC模型除了體現是大眾的研究熱點的過程,即先從數據到信息,最后到知識晶體的晶煉過程之外,還體現了通過評估尋找探究晶體知識背后的數據和信息的晶煉過程,而這個過程在當今社會往往是被大眾所忽略的,但是該模型只是指出了有這個過程,并沒有做出重點的說明和實例化。此外,該模型的雙方向過程缺乏了聯系性與相關性,并且該模型只體現一次作業的過程。因此,IBKC模型仍有需要改進的地方。

圖6 基于問題的知識晶煉模型
本文通過冰山雙循環模型的啟發,從物理原理這個源頭出發,提出了知識晶煉雙循環理論,進一步完善知識晶煉框架。知識晶煉雙循環類似于冰山雙循環,它繼承了IBKC模型的雙方向過程的思維方式,通過引入知識碰撞和知識沉淀,即引入冰山的升華凝華過程,來實現知識晶煉兩個方向各自的循環的過程。從而根據冰山雙循環模型的啟發,知識晶煉雙循環包括正循環和反循環兩個過程。
(1)知識晶煉正循環。在信息化社會以前,人們在看到顯性知識之后即顯性冰山之后,會想去探尋與此顯性知識有關的背后90%的隱性數據、信息,在這個過程中通過尋找、提示等方式方法來進行探尋。當探尋到原始單位元素的時候,這些原始單位元素可能會凝華或凝固成新的顯性知識,凝華或凝固的意思是“將原始單位元素直接轉變為可用的顯性知識,重構原來的顯性知識,或(和)生成新的顯性知識”。接著,該顯性知識又進行尋找、提示探尋原始單位元素等過程,形成知識晶煉正循環過程。
(2)知識晶煉反循環。當下社會,大量知識被埋藏,以至于人們無法看到顯性部分,這時候需要將海水即海量信息蒸發冷凝構建出顯性冰山。對于普通受眾而言,顯性冰山即可滿足其信息需求。這里的海水是指海量隱性數據、信息或知識,蒸發冷凝即“剔除原始單位元素中無用的雜質部分,留下有用的部分,構成有用的顯性知識”,其中的顯性知識即對應于顯性冰山。并且冰山可能會升華或熔化,即“從具有一定結構的有用的顯性知識中分解出部分單位元素”。這些升華和熔化的氣態和液態部分就是新的原始單位元素。接著,該原始單位元素又進行蒸發冷凝等過程,構成知識晶煉反循環過程。
知識晶煉正循環過程與知識晶煉反循環過程彼此共存,形成知識晶煉雙循環模型。這個過程當中的每一個步驟的條件都是需要公民與外界進行思想碰撞交流。這個循環中的一個重要事實是,用戶有可能與這一知識晶煉過程的每一個步驟交互。[20]基于此,將IBKC完善為知識晶煉雙循環模型(見圖7)。

圖7 知識晶煉雙循環模型
知識晶煉雙循環模型由5個部件以及部件之間的邏輯關系組成。① 原始數據。與待解決問題相關的所有資料未處理的數據,包括文檔、圖表、視頻等。② 信息塊。利用網頁信息抽取方法在原始數據中抽取出與問題相關的信息塊。信息量較原始數據有較大幅度的降低。③ 知識晶體。前面兩個階段主要借助了機器的作用,但機器只能判斷篩選出可能相關的數據和信息,但真正是否相關還是需要人的參與。這個過程需要用到人工判斷,從而選出確實相關的數據信息材料。小組成員分別或單獨分析收集的信息塊,并將其編譯成基于事實和證據的更好的格式,該階段形成的是詳述。④ 精致的知識晶體。作為決策參考的信息,文本量還需要進一步壓縮提煉。這個階段就像做積木一樣,需要把多個片段綜合??赡芤恍┬畔K還存在邊角料,將所有這些材料打磨成可以互相拼接組裝的形狀,剔除一些不相關的邊角信息材料。這個階段一群人通過基于問題的信息系統模型(Issue-Based Information System,IBIS)、研討對話模型等語義方法(如優先排序)來整理實質,并拋棄浮渣,取其精華,形成更緊湊的陳述,即精述。⑤ 演示-知識珍寶。以上4個階段得出的信息并未結合使用者的需求,而語言要表述成各級決策者能夠理解的,根據不同的對象,采取最合適的調研方法,了解使用者的知識結構是怎么樣的,然后,使用語義方法管理陳述,使得陳述有條理和邏輯,以便表達成他們能夠理解、接受和喜歡的意思,即搭積木搭成用戶能夠理解、接受和喜歡的形狀。如借用比喻將陳述與決策者比較了解的事物進行比擬描述來表達。
用戶理解了所演示出來的知識后,會結合自身的研究或閱歷產生對該知識珍寶新的認識和理解,從而產生新的原始數據,接著信息塊和知識晶體隨之發生變化,如此循環往復,形成了知識晶煉反循環。知識晶煉正循環是指透過演示的知識珍寶,去一步步評估和尋找與之有關的知識晶體、信息塊和原始數據,當回到原始數據之時,能夠發現一些知識漏洞或是知識改進突破口,從而直接改變了知識珍寶,或者可能產生新的知識珍寶,如此循環往復,形成了知識晶煉正循環。
這5個部件之間的邏輯關系包括正向關系和逆向關系。① 正向關系包括閱讀和提?。ㄓ稍紨祿蛐畔K引出的連線)、蒸餾(由信息塊向知識晶體引出的連線)、簡化和提煉(由知識晶體向精致的知識晶體引出的連線)、個性化方式(由精致的知識晶體向演示—知識珍寶引出的連線)和升華或熔化(由演示—知識珍寶向原始數據引出的連線)關系。② 逆向關系包括再評估(由演示—知識珍寶向精致的知識晶體引出的連線)、尋找(由知識晶體向信息塊引出的連線)、提示(由信息塊向原始數據引出的連線)、凝華或凝固(由原始數據向演示—知識珍寶引出的連線)。
“互聯網預言家”凱文·凱利在《科技想要什么》里提到,在哥倫布去美洲之前,實際上美洲是已經有人了,但人們為什么說是哥倫布發現了美洲呢?因為是哥倫布把美洲這個知識和人類科學的“主流知識”聯系在了一起,“孤島式知識”是不行的。[21]在現實當中會或強或弱地出現知識晶煉雙循環的影子,但目前大眾還沒有將知識晶煉雙循環與人類科學的“主流知識”聯系在一起。
以互聯網公司某產品的宣傳知識晶煉作為案例。
(1)知識晶煉反循環。現要對公司某產品地圖App的宣傳文案出現的撰寫問題提出解決方案,在人員選擇上,通過對人員在公司的任職級別進行分層,然后按照所分的級別,利用分層抽樣法隨機選擇若干職員作為參與者,同時聘請兩個及以上的知識晶煉專家作為專家組。① 提取信息塊。產品如何做宣傳才能吸引更多的用戶前去下載和使用該產品呢?這對于產品的長期生存是一個問題。從所有網頁、學術數據庫等中利用能采用的工具與方法提取出關于該產品及其競爭品的所有數據和信息。② 生成詳述。參與知識晶煉的所有成員,每個人參考操作①提供的信息,均提出一個解決方案,生成對應的詳述。③ 生成精述。全部參與人員與專家一起通過語義方法從所有詳述中篩選出得到接受度最高的方案,通過語義方法對該方案做進一步的整理,拋棄浮渣,必要時添加其他詳述的精華,形成最全面、緊湊、系統的精述。④表達精述。通過訪談調研、問卷調查、機器學習等方法了解該產品用戶的知識結構、偏好等,個性化地形成用戶容易理解、接受和使用的表述方式。如華為手機應用商店的產品宣傳模式,以產品截圖加文字的形式進行表達。⑤ 循環更新。一些用戶在使用該產品之后,會在評論區留下評論(如地圖軟件可以通過設置評論區等措施了解用戶的使用體驗,減少重新定位所有路段并優化有問題路段的成本),產品工作人員可使用知識聚類等方法對評論進行分析,若采納評論留下的意見或建議對產品進行了改進,則關于產品的信息塊、詳述和精述都會按序發生改變,個別情況下甚至會產生新產品的精述介紹。如此,隨著時間推移,進行不斷地循環更新。
(2)知識晶煉正循環。① 評估精述。當人們要下載該產品時,會先瀏覽關于這個產品的精述,如“應用截圖”“小編推薦”等,這些是以不同形式表達出來的精述內容。② 評估詳述。當精述并不能讓他們產生下載該產品的動力時,他們會閱讀并評估這個產品詳細的描述。③ 尋找信息。對于部分用戶而言,即使看到了詳述,他們還會去“貨比三家”,通過各種方法尋找與該產品有較大相關性的信息。④ 尋找數據。對于一些科研人員或者企事業單位等人員為滿足其工作或學習需求,還會進一步尋找該產品所有的原始數據。⑤ 循環更新。當研究人員找到原始數據時,容易發現某些原始數據與精述新的融合方式,即內化出新的知識,從而將原產品的精述介紹改進,個別情況下甚至會產生新產品的精述介紹。接著,詳述、信息塊、原始數據也會跟著變化。如此,隨著時間推移,進行不斷地循環更新。
信息化社會,知識爆炸增長導致知識分散,進一步導致決策效率和合理性降低等問題。通過由冰山顯性知識挖掘隱性數據或信息的正冰山模型,推導出反冰山模型,即由于大數據導致的數據或信息全隱性化問題,從全隱性數據或信息中挖掘顯性知識,重現海上冰山的情況。由于冰山的升華凝華或熔化凝固進一步形成冰山雙循環晶煉過程。由此,啟發了知識雙循環晶煉理論的產生,用以解決大數據環境下知識分散的問題以及處理流程混亂而導致效率低的問題,從而幫助決策者高效、快速地做出更加合理的決策,降低和避免決策失誤導致的消極影響。雖然知識晶煉雙循環模型可以更好地解決問題,但仍然有實現較為困難的地方。知識晶煉雙循環模型需要使用各種不同的方法和工具,盡量用機器實現,因此,要求引入的專家需要能夠熟練掌握盡可能多的處理方法。