季夢佳(上海工程技術大學檔案館,上海,201620)
?
關于智慧檔案館中技術熱研究的思考
季夢佳
(上海工程技術大學檔案館,上海,201620)
[摘要]技術建設一直是智慧檔案館研究的重點與難點之一,存在一些誤解。文章首先概述智慧檔案館的理論研究與應用建設現狀,指出技術研究與建設是當前智慧檔案館的熱點。其次,分析對物聯網、大數據兩大技術的誤解之處,指出檔案實體物聯化與檔案信息化、檔案的保密性與物聯網信息共享的目標、檔案數據的滯后性與大數據時效性等都存在偏離。最后,剖析智慧檔案館的建設誤區,強調智慧化不等于智能化、數據化,指出理性智能與情感智能相結合才是智慧檔案館的發展之路。
[關鍵詞]智慧檔案館技術理性智能情感智能大數據
1.1智慧檔案館的理論研究現狀學術界對智慧檔案館的研究隨時間的推移呈現出逐漸上升的趨勢。目前,學術界有關智慧檔案館的研究主要集中在智慧檔案館的概念、智慧檔案館與數字檔案館的關系、智慧檔案館的建設、智慧檔案館服務四個方面[1]。筆者以中國知網學術期刊網絡出版總庫為文獻來源檢索庫,以“智慧檔案館”為主題詞進行模糊檢索,檢索時間不限,通過二次篩選,共有62篇符合要求。其中43篇為純粹理論研究,7篇為混合理論研究,12篇為案例研究。在62篇研究文獻中,頻率最高的五個關鍵詞分別為智慧檔案館、智慧城市、物聯網、大數據、云計算。一方面,說明新一代信息技術在深入、全面應用后,給檔案館傳統運行模式帶來了巨大的沖擊,推動檔案館轉型升級,促進檔案館走向智慧化;另一方面,這也反映出學術界對物聯網、大數據等信息技術的研究興趣與關注熱度愈來愈高。
1.2智慧檔案館的應用實踐現狀
在應用實踐層面,青島、杭州、張家港、太倉等區域的智慧檔案館建設呈現一片欣欣向榮的景象。青島是國內第一個建設智慧檔案館的城市,2012年完成智慧檔案館建設理念、基本功能、系統框架及具體功能需求的研究工作;2013年提出智慧檔案館建設項目建議書;2014年,青島市政府工作報告明確要求“建設智慧檔案館”,青島市發改委將青島市智慧檔案館項目一期工程列入市財力投資計劃,同年4月完成項目招標,11月,完成項目建設,系統進入試運行階段;2015 年5月26日,青島市智慧檔案館項目一期工程通過相關部門組織的功能驗收,正式投入試運行[2]。杭州以“杭州市電子文件中心”為基石,致力于打造智慧檔案館,將檔案工作構建于互聯網,通過合理分析為老百姓提供個性化檔案服務,挖掘歷史寶藏。目前已完成三期建設,基本達到了全市統一的電子文件系統規范管理和長久保存兩大目標。即將啟動的四期項目,將以全市檔案信息資源為基礎,通過政務云平臺縱向連接各區縣(市)綜合檔案館,橫向連接各市級機關立檔單位和社會公眾,提供跨館查閱民生檔案和開放檔案等服務,逐步實現全市檔案信息資源的整合和共享利用,實現管理模式的新突破[3]。太倉市檔案局館以物聯網為基礎,致力于邁入智慧管理時代。例如自主研制了自動化檔案盤庫車,在不需要從密集架中取下實體檔案的前提下,通過盤庫車自動清點檔案數量,通過聯動數字檔案館比對檔案內容,既免去了傳統盤庫一卷卷人工盤點的繁瑣,大大簡化了檔案盤庫清點工作的流程,也能實現諸如區域定位、遠程讀取檔案等一些特殊功能,從而使庫房管理工作變得更高效[4]。
目前,智慧檔案館的建設熱潮已經興起,各個區域智慧檔案館的建設水平、建設重點又不盡相同。不得不承認,對智慧檔案館內涵以及理論研究的模糊,致使一些區域的建設只涉及智慧檔案館的某一部分,就堂而皇之地冠以智慧檔案館的光環,這種情況已經嚴重脫離了智慧檔案館的建設宗旨,勢必對正在成長中的智慧檔案館建設造成影響。
2.1檔案的屬性與物聯網的本質相悖
學術界對物聯網迄今為止都沒有一個公認的學術定義。研究型首倡者的缺失導致了很少有人去深入思考諸如“物聯網的本質到底是什么”之類的理論問題(確切地說,是沒有人提出引起爭論的話題)[5]。在目前人們對物聯網幾乎一致的理解中,絕大部分學者僅從漢譯的角度,將物聯網解釋成物物相連的網絡。它將互聯網技術的終端由傳統的信息技術設備延伸和擴展到了任意物體,并使任意物體之間進行通訊[6]。這就容易引導人們走入對物聯網的認識誤區。第一,物聯網就是物被連接的網;第二,物聯網是一種新型的獨立網絡,和互聯網是兩種不同的網,兩者彼此獨立,但相互依賴。
首先,物聯網是Internet of Thing的漢譯,是誰在什么情況下將此翻譯成“物聯網”,現已無從考證。但如果從詞語的語法結構及原本語義解釋,Internet of Thing應該解釋為“產品信息互聯網”[7]更為貼切。因此,物聯網中的“物”并不是指客觀存在的物體或東西,而是產品信息。對產品信息的獲取,主要是利用電子標簽。電子標簽其本身僅記錄著產品的基本信息(確切地說是靜態的索引性信息),可由其觸發訪問的“物聯網信息服務器(IO T-Information Server)”動態地存儲與該產品相關的全部信息[8]。現階段,一些地區的檔案館在推廣物聯網技術運用的過程中,將檔案實體物聯化是最常見的做法。具體做法是在每份檔案上加入RFID標簽,賦予其特定的數字信號,通過自動化設備就可實時讀取檔案的信息,定位檔案實體的位置。表面上看,這樣不僅能降低庫房檔案管理的人力成本,更能極大地提高調檔的效率,但也很容易出現問題。首先,將每份檔案都黏上電子標簽的可行性不高。現在我國正極力推行數字化,檔案的利用也開始由實體向電子化轉移。在未來,數字化檔案、電子文件應該是檔案存在的常態,所以將檔案實體物聯化的意義并不大。物聯網的目標就是產品信息的全球范圍共享,即每一位讀取主體(人或可實現信息智能處理的機器)都能“讀懂”其接收到的產品信息[9]。但就標準化情況而言,現狀并不樂觀。一詞多義、一義多詞的現象普遍存在,再加上術語標準的非強制性,導致各國、各區域的標準各不相同。這與物聯網所要達成的目標相去甚遠。
其次,物聯網并未重新構建網絡,而是完全依附于互聯網,物聯網與互聯網本質上屬于同一張網,物聯網的運行離不開互聯網,它是一種新型的互聯網應用,一種基于互聯網的產品信息共享方式[10]。既然是共享,那所有檔案信息就必須開放。但實際上,檔案具有機密性,人們的利用是有差異的,某些檔案有關某一方面的內容,只能為某一層次、某一范圍的人們所利用,超出這一層次和范圍的任何知曉,可能會對其他人造成很大程度上的損害。因此,檔案的機密性要求某些檔案信息不能上網,而且要分密級程度保存。這與物聯網的目標——產品信息的全球范圍共享是相悖的。
2.2檔案數據與大數據的本質屬性偏離
與所有的IT概念類似,大數據的概念更像是一種特征描述,而不是技術領域的客觀定義。目前,較為一致的觀點是大數據具備“4V”特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。在檔案學術界,大數據4個“V”特征在研究論文中隨處可見。不得不承認,其中對某些部分的解讀確有合理之處,但難免存在不同程度的概念泛化、夸大與誤讀。
隨著檔案數字化建設的深入,電子文件以及數字化檔案的總體數據量在不斷變大,有學者就牽強附會地認為檔案大數據時代已經來臨。但此“大”非Volume的“大”。從Volume的本義出發,它一般指的是聚合在一起可供分析的數據量必須是極大的,并且這個“大”主要是指由機器自動生成的數據量增長巨大,比如“引擎中內置的傳感器,即使沒有人觸摸或者下達指令,它也會自動地生成關于周圍環境的數據”[11]。對照這兩點仔細推敲一下數字檔案資源的特征。首先,檔案數字化后,目前的數字檔案資源主要分為兩種,一種是傳統檔案載體的數字副本,另一種是電子文件。就前者而言,其數據量是十分龐大的,僅像第一歷史檔案館這樣國家級別的檔案館,其館藏檔案數字副本就可達數千TB;與此同時,原生電子文件的增量也在不斷提高,十年前的中央機關的電子文件總量,就已突破TB。但這些海量的數字檔案資源,80%左右的新增數據是“冷數據”“休眠數據”,這類數據的特點是靜止的、固定的。因此這些非在線的冷數據,其總量可能非常大,但是增長速度與實時采集、動態獲取的能力跟大數據所指向的相去甚遠[12]。
大數據是現象,但“大”和“數據”都不是大數據中最重要的,大數據的核心是要挖掘數據價值,進行數據分析。數據分析要求的數據是全數據,檔案能提供的是經過鑒定篩選后的數據,這與大數據的要求又背道而馳。另外,現代社會追求最大化的信息價值,數據的時效性又直接影響了信息價值的最大化。從技術特征上講,大數據的突出優勢就在于數據傳輸速度和接受速度是極快的、實時的,這就要求數據具有很高的時效性。檔案是歷史的真憑實據,具有極高的憑證價值和情報價值。然而,檔案本身是歷史的記錄,是一種回溯性信息,再加上它有一個法定的封閉期,導致被人廣泛利用或發揮作用需要一定的時間,具有一定的滯后性,檔案信息的時效性自然相對較弱。
數字檔案信息的形式日漸多樣,從文本格式到圖形圖像格式,從圖形圖像格式再到多媒體格式等。但從目前的技術上看,數據分析僅僅在“爬蟲”技術方面有所突破,開啟了解讀非數據結構化數據內容的一扇窗戶。圖像識別技術沒有實質性突破,數據挖掘技術也停留在原來的水平,只是移植到云計算環境下而已,數據分析技術的突破與否決定著未來大數據在檔案管理中應用能力的高低。
3.1理性智能與情感智能
理性智能與情感智能都是人工智能的產物,理性智能是人工智能的初級階段,情感智能則是人工智能的高級階段。理性智能是指從信息資源中獲取知識,進行復雜的自然語言處理、學習、推理、規劃及模式識別;情感智能是指在機器理性智能的基礎上,通過對環境情景信息及人類情緒信息的感知、獲取、計算和分析,實現以情感、情景智能為主的高級開發與應用[13]。
隨著對智慧城市研究的深入,越來越多的研究者開始關注情感計算(情感智能)。其實,情感智能(情感計算)這個問題,在20世紀90年代初期就已被關注并開始研究。1997年,美國MIT媒體實驗室的R.Picard出版專著Affective Computing,在書中正式提出情感計算(Affective Computing)的概念。所謂的情感計算就是試圖賦予計算機像人一樣的觀察、理解和生成各種情感特征的能力。它試圖創建一種能感知、識別和理解人的情感,并能針對人的情感做出智能、靈敏、友好反應的計算系統[14]。
智慧檔案館是Smart Archives的漢譯。Smart的本義是聰明、敏捷、反應快,但并不包含智慧的意思。已經難以弄清誰是中文“智慧檔案館”的首倡者及其翻譯依據。但“智慧”一詞,在中國文化中含有更為豐富的內涵。智的特征是學習性,代表了人(物)的智商;慧的特征是創造性,代表了人(物)的情商。智慧檔案館包含“智”和“慧”兩部分,即智慧檔案館兼具“高智商”與“高情商”。從一定意義上說,智慧檔案館可以稱之為人工智能的產物。如果把“智”理解成理性智能,把“慧”理解成情感智能,那“智慧”就是指如何利用情感智能來更好地發揮理性智能。
3.2智能化不等于智慧化
檔案館引入物聯網、大數據等高科技,這是智慧檔案館開始擁有高智商的表現。物聯網為檔案館樓宇、人員等的智能化管理提供了基礎,大數據又為檔案個性化服務提供了分析前提。但這些最多只能稱得上智能,智能并不等同于智慧。首先,關注點不同。智能僅僅關注的是每個智能項目的建設,是獨立的,并且缺乏整體性的規劃設計;智慧則關注每個智能項目之間的固有聯系,有系統的規劃與頂層設計,有統一的規范標準,并能從整體出發,嵌入式地搭建每個智能項目建設。其次,實質不同。智能技術強調的是軟件資源,強調自動處理系統的貢獻,更多是從技術角度關注檔案館建設;智慧關注機器的理性智能,更關注如何利用情感智能發揮理性智能的優勢。再次,目標不同,智能以電子化、信息化為建設目標;但智慧則是要為人類提供更加個性化的智慧服務。從觀念上講,智慧檔案館追求的實際上是效益與人文的統一,兼具技術與人文的統一。最后,智能的結果只是數據的積累與傳遞;智慧在強調信息的采集與傳遞的同時,更加注重信息的交換、共享與挖掘。
3.3數據化不等于智慧化
檔案的數字化是互聯網出現以來一項重大的突破,數字化讓檔案信息的收集、管理與利用變得前所未有地容易。但新的問題也隨之出現,即數字化的檔案信息能否轉化為一種生產力?大數據的出現讓這一切成為可能,從數字化的檔案信息中挖掘更具價值的數據成了檔案工作的新方向。數據化主要包括數據的采集與數據的處理等工作,其實質是人類在信息傳播、人際交往乃至日常生活的過程中,為了便于溝通、傳播與保存,將一切客觀存在均處理為數據,進而使得整個人類社會成為了一個龐大的數據庫[15]。
數據化的最大特征就是以技術為中心,技術將不同國度、不同文化背景的人連接成一張巨大的網絡,使得每個人(物)都以“數據化”的形式存在。但智慧化的最大特征是以人為本,用技術去為人提供個性化的服務。雖然這是一個數據主宰一切的時代,數據化與智慧化相互聯系、互不分離,數據化為智慧化奠定了量的基礎,而智慧化則是數據化質的飛躍,但數據化不等于智慧化。數據化使社會結構呈現出了以互聯網為框架的數據化形態,而且使得傳統的人際關系、信息交流變成了即時、迅捷的數據交換[16],但弊端也顯而易見,就是容易使原本多元、立體的社會結構趨于單一、平面。況且一味地關注數據,就容易以理性思維取代感性思維,導致天平失衡。
首先,必須堅持技術與人文的統一。技術使檔案工作不斷朝著信息化、數字化、智能化、智慧化方向發展,但技術是一把雙刃劍,正如技術哲學的研究者卡普所言:“所有技術當然也包括所有的未來技術,都只能被理解為人體的投影與延伸,是人體的外在化和客觀化。”技術是智力的放大器,是人智力的投影儀,它讓物具有了人的屬性,可以說,技術本身體現著人的價值期望、價值追求,在技術設計、發明與應用的過程中,人的目的、價值觀念就內化于其中。正因如此,技術要獲得正確的發展方向,必須借助人文科學,為其提供動力、確定目標、端正方向,深化技術與人文的交融,智慧檔案館的發展才會欣欣向榮。其次,必須堅持情感智能與理性智能的統一。智慧檔案館的建設離不開理性智能,理性智能是打開智慧之門的金鑰匙,為智慧檔案館的建設提供技術以及一切智力支持;情感智能則是智慧檔案館的發展方向,利用情感智能,正確協調與理性智能的關系,恰如其分地控制兩者發揮各自的作用。總而言之,建設智慧檔案館,我們要走的路還很長。
參考文獻
[1]巨珺.我國智慧檔案館研究述評[J].浙江檔案,2015(4):6-9.
[2]http://www.qingdao.gov.cn/n172/n24624151/n24631595/n24631609/n24631637/ 150605161439540514.html
[3]http://hzdaily.hangzhou.com.cn/hzrb/html/2014-09/26/content_1808847.htm
[4]http://www.da.yy.gov.cn/art/2014/2/24/art_38730_1377081.html
[5][7][8][9][10]黃映輝,李冠宇.物聯網:語義、性質與歸類[J].計算機科學,2011,38(1):31-33,65.
[6]陳海明,崔莉,謝開斌.物聯網體系結構與實現方法的比較研究[J].計算機學報,2013,36(1):168-188.
[11]Bill Franks.駕馭大數據[M].黃海,車皓陽,王悅譯.北京:人民郵電出版社,2003:6.
[12]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(2):4-8.
[13]戴偉輝.情景感知與情感智能:通往智慧城市的智慧之門[J].上海城市管理,2012(4):29-32.
[14]解迎剛,王志良.遠程教育中感情計算技術[M].機械工業出版社,2011:16.
[15][16]韓晗.“數據化”的社會與“大數據”的未來[J].中國圖書評論,2014(5):26-32.
Reflection on the Research of Technology in the Smart Archives
Ji Mengjia (Archives of Shanghai University of Engineering Science,Shanghai,201620)
Abstract:Technical construction has been one of the key points and difficulties in the research of smart archives,but there are some misunderstandings.Firstly,the paper summarizes the theory research and application development of smart archives.Secondly,it analyzes the misreading of the internet of things and the big data.It is pointed out that the archives entity instrumented with archives informatization,confidentiality of archives with target of information sharing in internet of things,archival data lag and big data timeliness and so on.Finally,it analyzes the construction errors of the smart archives,emphasizing the smart is not equal to intelligence and datamation,pointing out that the rational intelligence with emotional intelligence is the development of the smart archives.
Keywords:Smart Archives;Technology;Rational Intelligence;Emotional Intlligence;Big Data
[分類號]G271
[作者簡介]
季夢佳,女,上海工程技術大學檔案館助理館員,主要研究方向為檔案數字化。