□李東旭 江澄 劉海峰
體感技術驅動下的圖書館應用平臺架構創新與體驗革命
□李東旭 江澄 劉海峰
體感設備的出現是第三次人機交互革命的原點,以Kinect為首的體感技術產品正在成為新一代革命性體驗的代表,而體感應用正在迅速而又廣泛地應用于各個行業領域。對于圖書館行業來說,如何抓住這一變革優化圖書館服務,為圖書館各項工作帶來革命性的變化是時下非常前沿的探索性問題。該文著重探討體感技術理念對于圖書館的影響以及體感技術在圖書館應用的可行性。
圖書館 體感技術 體感設備
美國傳播學者施拉姆在20世紀50年代就影響受眾對大眾傳播節目選擇的決定性因素提出一個公式:選擇的或然率=報償的保證/費力的程度。公式中“報償的保證”指傳播內容滿足選擇者的需要的程度。而“費力的程度”則指得到這則內容和使用傳播途徑的難易狀況[1]。因此以“讀者中心論”為理論框架的圖書館研究需要回歸到兩個最初問題是:圖書館的資源和服務獲取費力么?圖書館給予的報償有保證么?這兩個問題決定著讀者是否會選擇圖書館服務,而體感技術著力綜合解決這兩個問題。
體感技術是一種可以直接利用軀體動作、聲音、眼球轉動等方式與周邊的裝置或環境互動,而無需使用其他控制設備的人機交互技術[2]。排除了傳統按鍵、操縱桿、滑鼠等與電腦的溝通方式,改以直覺的、符合肢體反射或日常生活操作的方式來與多媒體進行互動[3]。舉個例子,當你站在一臺電視前方,假使有某個體感設備可以偵測你手部的動作,此時若是我們將手部分別向上、向下、向左及向右揮,用來控制電視臺的快轉、倒轉、暫停以及終止等功能,便是一種很直接地以體感操控周邊裝置的例子;此外還可以將這四個動作直接對應于游戲角色的反應,便可讓人們得到身臨其境的游戲體驗。關于體感技術的應用還包括:3D虛擬現實、空間鼠標、游戲手柄、運動監測、健康醫療照護等。
體感技術的崛起事實上是人機交互技術創新變革[4]。體感技術采用了更加人性化、更加擬人的人機交互環境,以一切的外部媒介作為人感官的延伸,使用戶在操控的過程中獲得最直觀、感性、具體的革命性體驗。這種理念遵循了麥克盧漢的基本觀點,以感官直觀感受和思維活動特點作為基本框架標準,靈活調節合理的組織形式,進行有序、有效的組配,以滿足讀者獲取感受作為最重要的信息獲取原則。
體感技術在非常多的領域正在取代復雜的控制系統,成為新一代人機交互的先鋒[5]。例如高精度手術、高危施工、地下作業等等領域均有非常良好的應用前景。體感技術現已在各行業中有了一定的應用:據國外媒體報道,德國康斯坦茨大學一位研究生借助Kinect系統能夠讓盲人“看到”真實的物體,并將這一系統命名為“NAVI”,意思是失明人群輔助導航裝置。國內第四軍醫大學西京醫院骨科的醫生們將kinect應用在手術室,手術者在術中可通過體感控制查看患者的影像資料,大大方便了醫生手術,減少了手術室的人員流動[6]。
開發體感應用技術涉及應用開發框架、中間件設計與實現、優化控制方式以及實時反饋控制共四個方面的問題。
Kinect應用開發框架目前有第三方的Primesense OpenNI和微軟的Kinect for Windows SDK,二者在基于Kinect的應用開發方面各有優勢,如表1、表2所示:

表1 Microsoft’s Kinect SDK優缺點

表2 PrimeSense OpenNI優缺點
由以上可以很清晰看出各種開發環境的優缺點,對比后不難發現就技術角度而言如果只開發基于上半身或手勢識別的項目,使用Primesense OpenNI即可,然而要開發基于全身識別的體感項目無疑微軟發布的開發環境更加適合。
體感應用的關鍵就是用戶動作手勢和語音的識別過程,即獲取用戶動作的深度圖像和音頻數據,然后將這些數據交給視覺和音頻感知中間件,所謂感知中間件就是用于實時記錄音頻和視覺分析的數據并理解它們的軟件組件。例如,一個中間件可以接收一幅有人的圖像,計算并返回人手掌在圖像中的位置;更高級的還要能夠識別用戶連續的動作手勢,并根據動作手勢匹配而確定用戶的動作意圖,如圖1所示。所以在體感應用中間件的設計過程中,既要考慮用戶易于操作,也要考慮追蹤效率,因此體感技術的實現是人機互動領域史無前例的革命,體感技術所要實現的工作有可能將重新定義互動技術的未來。

圖1 Kinect動作細節追蹤動態圖原理
以圖書館內實現投影內容體感控制為例,如果要使用Kinect來進行控制,在實際的中間件設計過程中需要考慮下面幾個方面的問題:獲取和放棄控制權、控制權釋放后的重新獲取、控制手勢的自然化和多樣化。
在體感控制中需要確保任何一個時間內只能有一個用戶對設備具有控制權,所以首先在設計動作手勢時,需要設計“獲取控制”手勢,執行“獲取控制”手勢的用戶就可以獲得對設備的控制權,并且在該用戶進行控制期間其他的用戶不能剝奪或搶占此用戶的控制權,除非此用戶放棄控制,那么其他的用戶才能通過“獲取控制”手勢重新獲取控制權,所以在設計“獲取控制”手勢的同時還需要設計“放棄控制”手勢。
在用戶獲取控制權進行控制期間,由于各種意外,用戶整個身軀或手短暫脫離Kinect傳感器工作范圍,但很快又能恢復,這種情況在用戶實際操控過程中將會經常出現,在實際測試過程中,我們總結出,應該多次測試確定一個合適的超時機制,即如果在一定的時間范圍內當用戶脫離Kinect傳感器控制然后又恢復,那么系統就認定用戶依然對設備有用戶控制權,用戶不需要再次執行“獲取控制”手勢來重新獲取控制權,如果用戶脫離Kinect傳感器超過設置的時間,那么就認定此用戶丟失,系統就應該收回此用戶對設備的控制權。
用戶需要通過手勢執行互動功能時,應該考慮人群對互動手勢的自然理解:一般使用水平左右揮動手勢完成左右翻頁功能,使用垂直上下揮動手勢完成上下翻頁。因此在設計翻頁這樣的手勢時,應根據用戶實際理解同時設計水平揮動和上下揮動的控制手勢,除此之外,設計人員還應該積極拓展思維,當出現用戶無法操控的情況,除了手勢動作控制以外還要考慮是否需要配合語音控制等方式采用用戶語音命令來實現相應功能。
在為各種屏幕創造動作手勢時,需要不斷嘗試,收集和記錄所有可能想到的創意方式并制作出原型以檢驗哪一種更適合普通用戶。讓普通用戶進行原型測試非常重要,從中可以了解到許多關于人體運動的信息,并用于重新測試。通過測試將會更好地理解用戶行為。在測試過程中,需要“不斷失敗”,篩選更加適合的方案,并需要和普通用戶一起進行測試,根據所有獲取到的數據來決定最佳手勢。經過研究發現懸停選擇是一種容易學習、高度可靠并且可預測的操控方式,而翻頁控制提供了一種更有觸感的機制來控制屏幕內容。
對于Kinect體感技術,無論用戶是在進行動作手勢控制還是語音控制,都必須有即時反饋功能,使得用戶相信自己確實是在控制當中。例如當用戶打開屏幕進行控制時,屏幕需要給用戶提示Kinect設備是否已經連接,是否工作正常等狀態標志,當用戶的手在空中揮動時,屏幕上應該有對應光標隨之移動,以讓用戶相信自己確實是在控制當中;在語音控制中,當用戶需要發出語音命令時,應該在屏幕合適的位置出現文字提示直到用戶進行語音輸入,當用戶的聲音不夠大或輸入的語音命令無法被識別時,應該給與相應的文字或其他可見的提示,當用戶輸入的語音命令被成功識別時也應如此。
當用戶在使用Kinect體感設備時,如果用戶的手勢動作不夠規范,或語音命令無法被識別時,Kinect的應用程序應該提示用戶如何輸入最準確的手勢動作或語音命令;還有Kinect的應用程序應該能夠智能地判斷用戶想要進行的下一步動作或在用戶操控界面顯示“幫助”按鈕,使用戶在不知道下一步如何操作時能夠即時獲取提示或者查看幫助。
圖書館應該更加關注媒介本身的體驗價值。在麥克盧漢看來,媒介的價值和影響力要遠遠超過內容本身。有研究表明,現代讀者在利用信息資源的時候更注重閱讀體驗,如果信息的媒介形式不友好,那么他們就會轉而選擇更親切、體驗更好的閱讀方式來攝取信息[7]。讀者會因為閱讀體驗良好的媒介而拋棄閱讀體驗不好的媒介形式,因此進行有效的媒介改良將會帶來更好的閱讀體驗,而體感技術給了用戶很大的控制權,它給讀者帶來革命性的閱讀體驗。
隨著科學技術的不斷發展,建筑行業與信息技術的聯系增加,BIM新理念應運而生,打破了傳統設計方法在住宅產業化方面的制約,使建筑成本得到有效降低,推動著建筑設計朝著信息化、參數化的方向飛速發展。在BIM模塊化設計背景下,通過“搭積木”的方式將模型單元拼裝起來,形成建筑整體模型,不但使設計效率得到顯著提升,還能夠促使建筑產業化的生產鏈變得更加完善。
凡是首次出現或稀罕的事物,人們容易產生興趣,產生好奇,好奇心永遠是最好的老師。體感技術正是從這個角度來重新解讀用戶需求,它具有其他傳統媒介無法媲美的革命性體驗,在激發用戶好奇心方面具有天然的優勢和感受驅動力。現代讀者因好奇驅動的閱讀占閱讀驅動力很大的比重,抓住讀者的注意力就抓住了讀者的心理活動,從而引導讀者去悉心研究與體驗這些新興事物下的信息資源。當有了閱讀驅動力,讀者就會自己去體驗和探索這些新興資源和媒介。這尤其對高校圖書館的學生讀者有著絕對的吸引力,并且這種設備和技術門檻相對較低,因此高校圖書館可以嘗試這種技術來創新讀者閱讀體驗。
雖然目前體感技術在公共服務領域鮮有成熟的閱讀應用,但體感技術下的開放閱讀不僅能體現在空間上,而且也能體現在思維上,在空間上讀者可以選擇更加開放的環境選擇閱讀方式,而在閱讀的思路上可以使邏輯更加靈活和跳躍,選擇更加開放的閱讀方式會有更加美妙的閱讀體驗和感受,有利于讀者對于閱讀內容的理解,并且過程印象深刻不易遺忘。
傳統閱讀注重閱讀的私密性和深度,但傳統的圖書閱讀模式在閱讀即時分享方面相對欠缺,而現代讀者更加注重閱讀針對性與閱讀內容本身的差別化即時互動,例如:讀者會想知道讀到某一段的時候,其他讀者有什么感受,以及當前內容的評價信息,這都有助于讀者更深層次地了解閱讀內容并且可以形成差別化的交流探討[8]。體感技術的產生使圖書有了更好的分享性,它帶領讀者進入到一個大屏幕的世界,讀者可以一起分享某本精彩的圖書或期刊資源,這不僅是一種人機之間的互動體驗,而且在這個過程中強化了讀者與內容之間、讀者與讀者之間的互動,改變了閱讀認知的方式,它將閱讀注入了社交元素而讓閱讀交互感受更加豐富。
很多學者形象地指出:越來越多的現代人視手機、筆記本、鼠標、鍵盤等外設是自己感官的一部分。事實上這也是體感技術驅動下的人機交互努力的方向和未來,體感控制會給用戶更加具體和直觀的感官化感受,在解放雙手之后,人能夠以身體最自然的方式與終端進行信息的交互并完成互動[9]。Kinect有句廣告語——“You are the controller”(你就是遙控器)[10],相信在不久的將來,小型化體感設備會不斷涌現,而它的便攜性將讓用戶與之更加緊密。同樣,Kinect體感技術在圖書館中的應用將會提高圖書館創新服務與讀者用戶的緊密程度,在諸多服務和平臺方面與讀者保持友好。
贏得更多讀者的青睞是圖書館永恒的話題。傳統圖書館服務的做法會更關注資源內容質量、組織有序化程度以及其中的關聯性,而今看來,在另一個角度圖書館也應該更加關注體驗的價值,利用最新的創新技術進行有效的服務改良將會帶來更好的服務體驗,也同樣會贏得更多的讀者。
體感技術在自動化服務方面可以有很好的利用,例如可以將體感技術運用到圖書館自助借還系統,借助于體感技術中的人臉識別、體型識別、語音識別等等具體的人機交互技術綜合應用,可以避免讀者因忘記攜帶或丟失圖書證而無法借書的尷尬,可以使讀者有更多的選擇,不僅節省借還書時間,提高了圖書的流通速率、簡化了借閱流程,還維護了讀者的隱私權,此外又便于讀者自我掌控借還書過程,滿足了讀者多樣性、個性化的需求。
圖書館自動化管理系統是一個由人、計算機等組成的能進行管理信息的收集、傳遞、加工、保存、維護和使用的系統。體感技術的語音交互功能可以改進館員與管理系統的交互,館員無需遵循鼠標、鍵盤等傳統操作,而是紛紛采用抬手、揮臂、語音控制等方式,控制圖書管理系統的運行。例如館員進行圖書編目這一工作,可以創造性地利用語音控制功能,保持“免提”模式,通過語音可觸發文字錄入、輸入點選擇等功能,并且用語音控制進行編目審核。這將完全顛覆傳統館員通過鼠標和鍵盤來操作圖書管理系統的思路,開啟人機交互的新篇章。
圖書館聯機公共檢索目錄(Online Public Access Catalog,簡稱OPAC)是一種網上書目,可供公眾聯機查詢各圖書館的館藏資料。隨著互聯網時代的到來,大多數圖書館都已經將自己的OPAC向整個網絡發布,世界各地的讀者都可以檢索。體感技術的出現,使得這一服務系統有了更好的呈現,如圖2所示,第二炮兵工程大學圖書館利用體感kinect設計了圖書館資源檢索導航系統。讀者無需依賴任何操控設備,讀者自己就是控制器,可以在合適的范圍內,通過肢體動作或語音瀏覽圖書館的新聞、數據庫檢索系統、參考咨詢臺等各種服務資源。

圖2 圖書館資源檢索導航系統
增強現實(Augmented Reality,簡稱 AR)是近年來國外眾多知名大學和研究機構的研究熱點之一,也被稱為混合現實。它通過電腦技術,將虛擬的信息應用到真實世界,真實的環境和虛擬的物體實時疊加到了同一個畫面或空間同時存在。目前對于增強現實有兩種通用的定義。一是北卡大學Ronald Azuma于1997年提出的[11],他認為增強現實包括三個方面的內容:Combines real and virtual(虛擬物與現實結合)、Interactive in real time(即時互動)、Registered in 3D(三維設計)。
而另一種定義是1994年保羅·米爾格拉姆(Paul Milgram)和岸野文郎(Fumio Kishino)提出的現實-虛擬連續統(Milgram's Reality-Virtuality Continuum)[12]。他們將真實環境和虛擬環境分別作為連續統的兩端,位于它們中間的被稱為“混合實境(Mixed Reality)”。其中靠近真實環境的是增強現實(Augmented Reality),靠近虛擬環境的則是擴增虛境(Augmented Virtuality)。
增強現實在各個行業中已經有了良好的應用,例如谷歌于2012年4月推出的電子眼鏡產品,這款高科技眼鏡擁有智能手機的所有功能,鏡片上裝有一個微型顯示屏,用戶無需動手便可上網沖浪或者處理文字信息和電子郵件,同時,戴上這款“增強現實”眼鏡,用戶可以用自己的聲音控制拍照、視頻通話和辨明方向。
國家圖書館通過“增強現實”創造了中國首家非接觸式“3D虛擬數字圖書館”,現代、摩登、先進,走在了全國乃至世界的前列,更是科技創新力量在圖書館界的充分體現。讀者只需站在長七米、高三米的巨大屏幕前,在距屏幕約五米的地方,伸出手掌,計算機系統便可瞬間識別[13]。讀者可依手勢,左轉、右轉、平移、前進、后退;可仰看或俯視;可到達任何樓層,觀看到不同樓層的真實景象;可自由選擇游走路線,仿若置身于真實的整體場館之中,與實際行走無異。不同的是,可觀全局,亦可隨意設計挑選路線,最關鍵的是新穎的手勢識別操作以及與眾不同的直觀、自然的體驗。
凱文·凱利在著作《失控》中表示:“科技在為人類的工作和生活帶來諸多便利的同時,也帶來了一些負效應。”如核電之前被認為是安全和清潔的下一代能源,但日本福島核電站事故又讓人們重新意識到,一旦科技失控,它帶來的負面結果可能是難以承受的[14]。
圖書館在開發利用體感技術的同時,也應認真思考此問題。Kinect以其嶄新的方式、輕松的形態、良好的互動將學習娛樂融于一體,不難預期,這極易受到讀者用戶的歡迎和追捧。但對于圖書館管理者而言,我們需要關注和思考的是,如何在兼顧娛樂性的同時充分發揮其實用性,以便形成圖書館行業對于體感技術的良好應用,保障其效益的最大發揮、讀者受益的最大實現。
體感技術的靈魂和核心是讀者體驗需求的滿足,但是體感技術在圖書館應用的過程中存在著薄弱環節,即系統建設與人才培養脫節。圖書館新型技術的開發和利用,是以讀者服務為最終目標的,而這一目標的實現是以圖書館員的開發為基礎的,因此,圖書館開發人員是關鍵。而如今圖書館的專業開發人員甚是缺乏,優秀開發團隊的建設將成為圖書館必須全力去解決的一個重要問題,沒有一支高素質的專業隊伍,圖書館的體感應用是無法有效進行的。
中國的圖書館事業幾十年來確實取得了長足發展,由于現階段我國還沒有制定和出臺一個全國性的宏觀規劃,各個圖書館的技術資源大多處于獨立分散、交叉重復的封閉狀態,體感圖書館的開發和實踐是一個漸進、漸變的過程,體感圖書館在發展推廣的同時,還須結合我國國情和圖書館事業的現狀,提出切實可行的方案和措施。因此,在體感圖書館開發的過程中筆者采用“開源共享、聯合開發”的方式進行了技術成果的廣泛分享,筆者認為只有這樣才能使圖書館的體感技術應用和發展建設達到一個更高層次。
1 唐曉玲.信息選擇或然率公式對廣告傳播的啟示.新聞界,2007(4):23-25
2 體感技術熱潮來襲.IT經理世界,2011(7):35-38
3 宋鳴僑.淺析人機交互技術的發展趨勢.現代裝飾(理論),2012(2):37-39
4 李璐.體感技術革新電視人機交互體驗.通信世界,2012(11):15-18
5 艾小群等.全息學時代下數字化藝術設計的人機交互性取向.遼寧大學學報(自然科學版),2012(1):27-29
6 呂開陽等.Kinect體感技術在動物外科實驗教學中的應用及展望.中國醫學教育技術,2012(2):29-31
7 車力軍,孫峰.3G時代體感游戲的發展思考.電信技術,2011(11):55-58.
8 郭星等.一種大屏幕人機交互系統的實現方法.計算機工程與應用,2012(1):41-43
9 李浚.從紙質觸摸閱讀到人機交互式閱讀——盲人閱讀方式發展趨勢前瞻.四川圖書館學報,2012(1):43-46
10 DEVINCENZI A,YAO L N.Kinected conference:augmenting video imaging with calibrated depth and audio/Proceedings of the ACM 2011conference on Computer supported cooperative work.New York,USA:NY,2011:621-624
11 R.Azuma.A Survey of Augmented Reality Presence:Teleoper-ators and Virtual Environments,August 1997:355-385
12 P.Milgram,A.F.Kishino.Taxonomy of Mixed Reality Visual Displays IEICE Transactions on Information and Systems,E77-D(12),1994:1321-1329
13 李雪.虛擬現實技術在國家圖書館的應用.科技情報開發與經濟,2009(30):21-24
14 Kevin Kelly.Out of Control:The New Biology of Machines,Social Systems,and the Economic World.北京.新星出版社,2010:237-238
The Somatosensory Technology-Driven Library Application Platform:Infrastructure Innovation and Experience Revolution
Li Dongxu Jiang Cheng Liu Haifeng
Somatosensory equipment is the origin of the third revolution in human-computer interaction.Somatosensory technology products led by Kinect are becoming the representatives of new generation of revolutionary experience.The somatosensory applications are quickly and widely used in various industries.How to seize this change to improve library services is nowadays a very cutting-edge issue.The article focuses on the impacts of the somatosensory technical concept for the library as well as the feasibility of somatosensory applications applied in library.
Library;Somatosensory;Somatosensory Equipment
第二炮兵工程大學圖書館,西安,710025
2012年7月6日