張久珍 步 一
(北京大學信息管理系,北京 100871)
?
·技術視角·
智能手機描述元數據研究
張久珍 步 一
(北京大學信息管理系,北京 100871)
隨著信息時代的到來,智能手機越發普及,并在人們的日常生活中扮演著越來越重要的角色;而元數據作為圖書館學研究的重要內容,在信息化時代下的新型信息組織活動中仍然起著重要的作用。本文首先對描述元數據和智能手機本身做概述,然后對智能手機所包含的元數據思想進行挖掘和分析,最后指出其中存在的問題并給出改進方案的示意。
描述元數據;元數據;信息資源管理;信息技術
元數據是關于數據的數據,是專門用來描述數據(數字對象)的內容、特征和屬性,并對數據進行管理和結構化的數據,是信息組織的基礎[1]。元數據有很多類,如描述元數據和管理元數據等。其中,描述元數據是包括信息內容元數據、專門數字對象元數據和資源集合元數據等在內的元數據[2]。描述元數據是本文將要闡述的重點。
描述元數據作為信息內容和信息資源著錄的方法規則,具有以下功能:
(1)描述元數據具有優化信息服務的功能[3]。例如,根據信息資源編目的理論,描述元數據能夠更為規范和詳實地對字段進行標引,也可以建立索引以提高檢索效率,這對圖書館等信息服務提供者提供檢索服務有正向的促進作用,它幫助用戶更為方便、準確和迅捷地得到信息檢索結果。這種信息檢索不是簡單的全文匹配。此外,理論和實踐告訴我們,知識資源導航服務也是描述元數據對信息服務促進功能的一個重要體現[2]。
(2)描述元數據溝通了一個系統和另一個系統之間的互操作[1]。元數據標準的存在,使得數據在同一系統類型的不同個體甚至不同系統間可以互換,這對于元數據的互操作性與信息數據的共享和廣泛應用具有重要意義。然而,好的元數據方案可以促進這種數據共享,設計不佳的元數據則會起到相反的作用。
(3)描述元數據具有促進信息資源建設的功能[4]。描述元數據對于對象的描述、管理、結構信息和保存等方面都進行了詳盡的規定,這對于信息資源,特別是數字資源的產生、制作、管理、發布與保存都具有重要意義[3]。
描述元數據具有以下幾個特點:
(1)描述元數據具有靈活性[5]。這種靈活性主要體現在其可擴展性上。描述元數據本身可能很簡單,只包含最簡單、最基本的元素,但它具有良好的擴展性。例如都柏林核心集(Dublin Core,DC)僅僅有15個元素,但是由它可以依據一定的規則擴充出新的信息資源內容或增加新的信息資源描述。
(2)描述元數據具有互操作性[1]。這主要體現在兩方面,一方面描述性元數據應當對不同系統間數據交換能力進行必要的支持;另一方面也應當在統一數據級別上進行一定的映射和對照,以便轉化為其他系統的元數據。
(3)描述元數據具有模塊化特性[6]。例如,中國機讀目錄格式(China Machine-Readable Catalogue,CNMARC)就具有記錄頭標區、地址目次區、數據字段區和記錄分隔符等模塊。不同模塊分具不同的功能,這也使得描述元數據更具有整體性。
智能手機,是指像個人電腦一樣,具有獨立的操作系統和獨立的運行空間,可以由用戶自行安裝軟件、游戲、導航等第三方服務商提供的程序,并可以通過移動通訊網絡來實現無線網絡接入的一類手機的總稱。信息時代的到來使人們的消費習慣發生了翻天覆地的變化,智能手機業已成為當今手機市場主流[7]。
智能手機的涉及范圍已經布滿全世界,因為智能手機具有優秀的操作系統、可自由安裝各類軟件、較大屏的全觸屏式操作感這三大特性[8],所以幾乎完全終結了功能手機。智能手機的操作系統有別于PC機的操作系統,在PC機的操作系統中微軟的Windows有著不可撼動的霸主地位。但是在智能手機市場卻是呈現百家爭鳴百花齊放的局面。目前,市場上智能手機系統有Android、iOS、Windows Phone、Bada、Symbian和BlackBerry等等。
數據顯示,截至2014年,在全球范圍內Android和iOS操作系統兩者共擁有96%的市場份額[9]。因此,對Android和iOS兩種操作系統的調研在很大程度上能夠代表當今智能手機描述元數據的情況。本文僅以通訊錄及其互操作性和信息存儲與文件管理為例,從市場占有率較高的Android操作系統的角度進行分析。
3.1 智能手機通訊錄及其互操作性
智能手機通訊錄的元數據設計比功能手機豐富很多。以典型Android操作系統的小米4手機為例,智能手機通訊錄元數據中包含下列常用字段:

表1 智能手機通訊錄元數據常見字段(以小米4智能手機為例)
此外,小米4手機通訊錄還提供諸如姓名拼音、即時消息、地址、稱呼、網站、互聯網通話、生日、農歷生日、關系和備注等字段。對于英文聯系人,通訊錄還設有姓氏、中間名、名字、名稱后綴、名稱前綴等子字段。在以上所述的表中和表外各字段中,只有手機或宅電之一是必填字段,其余均為可選字段[10]。
實際上,不同手機之間要想進行通訊錄的互換(即互操作性),需要有以下兩點要求:第一,兩系統字段設置必須大體相同。一般通訊錄都具有姓名、手機、宅電等最基本字段,這也是通訊錄可以進行交換的必備條件。第二,同一字段的完整性約束大體相同,否則可能會造成信息丟失。
3.2 智能手機信息存儲與文件管理
眾所周知,PC機的信息存儲在硬盤上,用戶可以通過“我的電腦”入口訪問各個磁盤借以訪問所有的文件;而智能手機的信息和文件則需要通過“文件管理”等入口進入。對于智能手機而言,系統軟件在用戶購買之前已經存儲在相應位置,占有了相應的文件夾和空間;用戶自安裝軟件則每個軟件占有一到多個文件夾,其中存儲軟件具體信息、程序和緩存等。下面從系統軟件和用戶自安裝軟件兩個方面看智能手機信息存儲與文件管理的描述元數據體現。
智能手機的系統軟件可以看作必填字段,這些字段的完整性約束條件在系統設計時就已給出,用戶不必關心。對于蘋果iOS操作系統來說,用戶沒有權限修改這些描述元數據;而對于Android操作系統來說,如果用戶需要修改,必須借助特定的軟件(如360 ROOT等)取得一定的權限。
用戶自安裝軟件可看作選填字段,選填字段沒有太多的完整性約束。這就類似于CNMARC中200(題名與責任者說明)字段和300(備注)字段的關系。然而這樣缺少完整性約束的形式也造成了一些問題,在后面詳述。
智能手機在風靡全球的同時,其元數據水平也在逐步發展。但筆者認為現今智能手機元數據發展仍存在以下問題:
4.1 不同操作系統手機元數據差異大
如第二部分所述,智能手機操作系統種類繁多。由于缺少統一的元數據規范,不同操作系統之間的元數據互操作性并不令人滿意。以Android和iOS的音樂元數據為例,Android操作系統自帶的音樂元數據中包含“歌手”、“歌名”、“風格”等字段,而iOS操作系統的音樂元數據中則包含“歌手”、“歌名”、“歌手(英文)”、“風格”等字段。當兩系統進行數據互操作時,因為Android操作系統未區分“歌手”字段的語言,很可能出現“班得瑞Bandari”這樣混合語種的內容,但是這樣的內容在iOS操作系統中又會分開在“歌手”和“歌手(英文)”中出現。這樣在進行系統對接的“連接”操作時,會發生或重復或遺漏的現象[9-10]。
4.2 不同型號手機元數據字段長度有所差異
對于同一操作系統的智能手機,其元數據類型差異應當不大,但是在字段長度這樣的細節問題上仍有小的不同。例如,同樣為MIUI系統,小米1手機的通訊錄中,“姓名”字段長度為12,但是到了小米3手機的通訊錄“姓名”字段,長度就變為了10。這種由多變少的字段長度會造成一些問題。例如,當用戶將原有通訊錄從小米1手機導至小米3手機時,姓名的第11、12位會丟失。
4.3 Android操作系統文件管理元數據較為混亂
與iOS操作系統不同,Android操作系統顯得相對“開源”。這在給用戶提供了一定的方便的同時,也造成了元數據,特別是文件管理元數據的混亂。PC機中,軟件所占空間往往與系統所占空間以不同硬盤的形式分離開來;但是Android操作系統中是處于同一片空間中,形式上也未分開。例如,存儲照片的DCIM文件夾往往和軟件(如飛信“Fetion”)處于直接相鄰的并列位置便是如此。究其原因,一方面,Android操作系統的用戶往往通過手機瀏覽器直接下載或裝機助手等下載軟件,缺少用戶自定義存儲路徑的窗體;另一方面,Android操作系統缺少統一的文件管理元數據規范的指導。上述兩個方面都在很大程度上造成了文件管理不夠結構化和有序化,元數據相對混亂。
基于上述問題,有必要制定出較為完善的智能手機描述元數據方案。而制定元數據方案又需要對智能手機用戶的需求進行分析。為此,筆者設計了調查問卷和適量的訪談環節,隨機選取了200名擁有個體進行調查。在調查地點的選擇上,因為智能手機往往集中于在城市生活的用戶,故調查地點選在了北京市城區內。調查的主要內容包括:對智能手機的了解程度;(不)使用智能手機的原因;使用智能手機的操作系統類型;最看重智能手機的什么方面;最常使用智能手機做什么;愿意花多少錢購買智能手機;對自己的智能手機(功能機)有多少不滿意的地方;對智能手機有何期待和建議;等等。
最終回收到的有效問卷比例約為97%。此外,筆者還查閱了互聯網消費調研中心[12](ZDC)提供的數據和圖表。限于篇幅所限,關于調查結果的描述性統計略去。根據問卷、訪談和ZDC的數據,筆者得出以下結論:
(1)擁有智能手機的被調查者占多數,對于暫無智能手機的被調查者,男性的換機欲望強于女性。
(2)大學生和白領階層對智能機了解多些,但大部分只是宏觀上的了解,只有一小部分是智能機愛好者。同時,大部分人對智能機的前景保持樂觀。
(3)在與智能手機描述元數據有關的問題中,部分智能機發燒友對系統兼容度和同一APP的元數據兼容度提出了不少建議,部分學生對通訊錄的兼容度提出了一些質疑和不滿。這也為下文智能手機描述元數據方案改進的設計提供了思路。
鑒于智能手機描述元數據涉及方面廣、數量大、種類多,筆者僅選取智能手機的通訊錄,對其描述元數據方案進行改進。
統一的元數據規范應當具有簡易性、易擴展性和易移植性。這是因為統一的規范要能為多種系統、多種形式所兼容。簡易性是易擴展性和易移植性的前提和基礎,易擴展性和易移植性又是簡易性的目的和歸宿。正如著名的都柏林核心集,其中僅有必要的15個元素,卻成為當今眾多紛繁復雜元數據規范的原型和縮影。
對于智能手機通訊錄而言,其描述元數據標準需要有以下要求:
(1)僅需要列出最基本字段。對于通訊錄而言,姓名、手機和對該人的最基本介紹為基本字段。鑒于電子郵件地址用途愈發廣泛,筆者將郵箱作為一個基本字段呈現。
(2)可選字段需要引出。為了減少冗余空間,每張名片的起始位置有一個“長度”字段,標注出本名片使用空間的大??;同時,將非基本字段以指針的形式引出。
(3)可選字段存儲需要規定位置。用指針指向存儲的位置(字節碼),使存放的位置盡量在一起,這有利于減小存儲空間。
但需要指出的是,智能終端的描述元數據方案和傳統信息資源的描述元數據方案有所不同。因為智能終端后臺的代碼已成體系,所以元數據方案只需要規定字段長度和要求即可;而傳統信息資源因為后臺代碼未成體系,因而其描述元數據(如USMARC)需要有地址目次、記錄標識和字段、子字段之分,等等。
基于上述要求,筆者做出的描述元數據方案改進見表2:

表2 描述元數據方案改進示意
從表2可以看出,整個元數據基本字段所占位數僅有不到200個,十分簡練。對于不同手機型號具有的自有特性,此元數據方案采用指針形式進行外在擴充,并將它們存于第197位后。
綜上所述,智能手機中的描述元數據對于智能手機的進一步發展起著至關重要的作用。手機之間的互操作程度和能力,決定著智能手機之間、智能手機與其他電子設備之間的數據共享程度,也決定著信息化的層次。因此,亟待產生一部與智能手機元數據相關的完備規則,借以進一步規范智能手機數據,使得智能手機信息組織更為有序化、規范化、結構化。
[1]肖瓏,趙亮.中文元數據概論與實例[M].北京:北京圖書館出版社,2007:17-29.
[2]段明蓮.現代信息檢索[M].北京:高等教育出版社,2006:2-8.
[3]陳建龍.信息服務模式研究[J].北京大學學報:哲學社會科學版,2003,(5):124-132.
[4]劉茲恒.信息媒體及其采集[M].北京:北京大學出版社,2008:120-124.
[5]張廣欽,段明蓮.中西文文獻編目一體化的可行性研究[J].河南圖書館學刊,1994,(3):63-64.
[6]段明蓮.信息資源編目[M].北京:北京大學出版社,2008:1-2,132-153.
[7]洪昕,王玨,林花.我國智能手機營銷策略分析[J].企業經濟,2008,(12):84-86.
[8]師曉青,謝軍紅.基于3G的智能手機移動圖書館創新研究[J].圖書館建設,2009,(5):52-54.
[9]iOS和Android已占有96%全球智能手機市場份額[EB/OL].http:∥digi.163.com/14/1101/07/A9USR82500162OUT.html,2015-08-28.
[10]薩師煊,王珊.數據庫系統概論[M].北京:高等教育出版社,2008:13-15.
[11]薩蕾.元數據互操作研究[J].情報科學,2014,(7):812-814.
[12]小米手機官網[EB/OL].http:∥www.mi.com/index.php f=xiaomi,2015-08-08.
(本文責任編輯:孫國雷)
Towards Descriptive Metadata of Smartphones
Zhang Jiuzhen Bu Yi
(Department of Information Management,Peking University,Beijing 100871,China)
With the arrival of information period,smartphone becomes more and more popular among people,playing an increasingly significant role in our daily life.At the same time,metadata occupy a huge part in information organization recent years as it is still a key content of library science.Basically this paper gave a short introduction on descriptive metadata as well as smartphones,and analysed thinking metadata of smartphones,especially descriptive metadata.Finally this paper uncovered some problems in it and put forward an improved method which is not perfect but can be seen as an example.
descriptive metadata;metadata;information resource management;information technology
2016-01-26
張久珍(1974-),女,黨委副書記,副教授,研究方向:信息素養研究,發表論文40余篇。
10.3969/j.issn.1008-0821.2016.03.012
G254.364
A
1008-0821(2016)03-0072-04