(張弛,副教授,碩士生導(dǎo)師,中國傳媒大學(xué)計算機學(xué)院計算機系副主任,主要研究方向為媒體信息數(shù)據(jù)化技術(shù),從事自然語言處理、數(shù)據(jù)挖掘、知識庫等方面的研究)
所謂“一圖勝千言”,視覺信息在人類社會信息生產(chǎn)和消費中始終扮演著重要角色。在融合媒體不斷發(fā)展的背景下,圖片憑借其信息量大、視覺吸引力強、數(shù)據(jù)量小等優(yōu)勢,在兩微一端應(yīng)用、精品內(nèi)容生產(chǎn)等方面不可或缺。資源價值的發(fā)揮有賴于資源的有效流通,而流通的前提是資源發(fā)現(xiàn)。圖片元數(shù)據(jù)是圖片特征描述的核心,也是圖片發(fā)現(xiàn)、流通的基礎(chǔ)。
國家標(biāo)準(zhǔn)——《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》(GB/T 35311-2017)于2017年12月底正式發(fā)布,填補了我國新聞圖片應(yīng)用標(biāo)準(zhǔn)的一項空白,也是世界范圍內(nèi)第一個以圖片視覺內(nèi)容和語義特征描述為主的圖片元數(shù)據(jù)規(guī)范,專業(yè)性強,結(jié)構(gòu)簡明,有較好的可擴展性和兼容性,具有較高的應(yīng)用價值。
視覺內(nèi)容已經(jīng)成為連接媒體、品牌以及消費者的最高效的傳播媒介[1]。圖片是視覺內(nèi)容存儲和傳播的重要載體。隨著互聯(lián)網(wǎng)技術(shù)和數(shù)碼設(shè)備的不斷發(fā)展和普及,圖片數(shù)量劇增、質(zhì)量不斷提升、需求也日益擴大。多家國內(nèi)外大型商業(yè)圖片公司、媒體機構(gòu)等擁有千萬級甚至億級規(guī)模的高質(zhì)量圖庫,為新聞、出版、印刷、廣告、營銷、素材制作等提供圖片素材。各類特色圖片庫以及自用為主的圖片系統(tǒng)更是不勝枚舉。
圖片特征描述在圖片存儲、管理、檢索、交易交換、智能推薦等生命周期各個階段都具有重要作用。沒有規(guī)矩不成方圓,我們需要圖片元數(shù)據(jù)標(biāo)準(zhǔn)來規(guī)范圖片生產(chǎn)的各個環(huán)節(jié)。原有圖片元數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)各有側(cè)重,且大都缺乏對圖片視覺內(nèi)容和語義特征的系統(tǒng)化規(guī)約,未能很好地滿足日益增長和不斷變化的圖片標(biāo)注需求。目前大部分圖片應(yīng)用系統(tǒng)從自身業(yè)務(wù)需求出發(fā),自定義了若干圖片元數(shù)據(jù)元素來描述圖片內(nèi)容特征,這些私有化的元數(shù)據(jù)元素難以在不同業(yè)務(wù)間流轉(zhuǎn)交換,制約了圖片價值的發(fā)揮。
在此背景下,新華通訊社提出了《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》國家標(biāo)準(zhǔn)編制申請,經(jīng)全國中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會(以下簡稱新標(biāo)委)上報國家標(biāo)準(zhǔn)委,被國家標(biāo)準(zhǔn)委批準(zhǔn)列入“2014年第一批國家標(biāo)準(zhǔn)計劃項目”。該標(biāo)準(zhǔn)重點關(guān)注圖片視覺內(nèi)容和語義特征描述,可用于圖片數(shù)據(jù)的采集、編輯、存儲、發(fā)布、檢索、交換等處理環(huán)節(jié)。
2015年5月新標(biāo)委秘書處牽頭組建標(biāo)準(zhǔn)編制組,確定了以媒體機構(gòu)及大型商業(yè)圖片庫為主要調(diào)研對象、參考國外相關(guān)機構(gòu)案例和國內(nèi)外相關(guān)標(biāo)準(zhǔn)規(guī)范的工作路線。編制組歷時一年,先后對多家報社、商業(yè)圖片公司等單位進行實地調(diào)研,并充分借鑒了國內(nèi)外圖片描述相關(guān)標(biāo)準(zhǔn),形成了標(biāo)準(zhǔn)的征求意見稿。在經(jīng)過多次的意見反饋和修改后,于2016年底提交送審稿到新標(biāo)委秘書處。經(jīng)新標(biāo)委委員函審?fù)镀焙螅?017年4月召開送審稿審查會。再次修改后形成報批稿,上報國家標(biāo)準(zhǔn)委批準(zhǔn)發(fā)布。國家標(biāo)準(zhǔn)《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》于2017年12月底由國家標(biāo)準(zhǔn)委正式對外公布,可在國家標(biāo)準(zhǔn)全文公開系統(tǒng)[2]中查詢。
該標(biāo)準(zhǔn)的核心目標(biāo)是更好地服務(wù)于圖片生產(chǎn)和消費的各個環(huán)節(jié),突出標(biāo)準(zhǔn)的實用性,因此,編制組在標(biāo)準(zhǔn)研制初期作了大量的調(diào)研工作。
調(diào)研對象包括兩類,一是現(xiàn)有相關(guān)國內(nèi)外標(biāo)準(zhǔn),二是標(biāo)準(zhǔn)主要應(yīng)用對象。標(biāo)準(zhǔn)編制組首先對國內(nèi)外標(biāo)準(zhǔn),包括IPTC圖片元數(shù)據(jù)規(guī)范[3]、EXIF規(guī)范[4]、CNML標(biāo)準(zhǔn)[5]等進行研究。研究結(jié)果發(fā)現(xiàn),每個標(biāo)準(zhǔn)側(cè)重點不同。IPTC圖片元數(shù)據(jù)規(guī)范主要定義圖片描述型元數(shù)據(jù)項,幾經(jīng)改版后,補充了若干圖片內(nèi)容描述的元數(shù)據(jù)項,但較為零散,在圖片內(nèi)容語義特征描述方面不夠全面。EXIF規(guī)范主要涉及圖片技術(shù)型元數(shù)據(jù)。CNML標(biāo)準(zhǔn)主要對象是新聞稿件,圖片內(nèi)容相關(guān)元數(shù)據(jù)定義相對較少。圖片元數(shù)據(jù)主要應(yīng)用對象是圖片庫系統(tǒng)。在對圖片庫網(wǎng)站、媒體機構(gòu)圖片庫系統(tǒng)的調(diào)研中發(fā)現(xiàn),個性化、私有化圖片元數(shù)據(jù)應(yīng)用現(xiàn)象普遍存在,這其中部分元數(shù)據(jù)僅僅名稱不同,含義卻相近,部分元數(shù)據(jù)具有普遍應(yīng)用價值。此外,舊的圖片庫系統(tǒng)越來越難以滿足應(yīng)用需求,新的圖片庫系統(tǒng)設(shè)計時在圖片編目方面也存在較多困惑。標(biāo)準(zhǔn)調(diào)研過程及意見征集過程中得到了圖片各領(lǐng)域?qū)<业姆e極配合和大力支持,使標(biāo)準(zhǔn)內(nèi)容不斷得到豐富和完善。
本標(biāo)準(zhǔn)的主要內(nèi)容是對圖片元數(shù)據(jù)元素做出準(zhǔn)確定義,尤其突出對圖片視覺內(nèi)容特征和語義信息的描述。標(biāo)準(zhǔn)以編輯類圖片和創(chuàng)意類圖片為主要對象,定義了40個元數(shù)據(jù)元素,分別歸屬到公共元數(shù)據(jù)、編輯類圖片元數(shù)據(jù)和創(chuàng)意類圖片元數(shù)據(jù)三個部分。
本標(biāo)準(zhǔn)主要從四個角度進行元數(shù)據(jù)元素的篩選和梳理。一是“形”,即視覺表現(xiàn),主要指畫面中的主要事物及環(huán)境信息等;二是 “意”,即圖片主題,主要指概念、專題、分類等;三是“技”,即創(chuàng)作手法,主要指畫面構(gòu)圖、攝影技術(shù)信息。四是圖片基本邏輯屬性,主要指圖片標(biāo)識、新聞圖片標(biāo)題和圖說等信息。標(biāo)準(zhǔn)具體內(nèi)容詳見國家標(biāo)準(zhǔn)全文公開系統(tǒng)[2]。
1.從應(yīng)用中來
實際應(yīng)用中,圖片發(fā)現(xiàn)可分為檢索和推薦兩類。圖片檢索主要包括關(guān)鍵詞檢索、類別檢索、專題檢索和屬性過濾篩選等。關(guān)鍵詞檢索對于創(chuàng)意類圖片側(cè)重主題和畫面內(nèi)容,對于編輯類圖片側(cè)重新聞人物、地點和事件信息。用于檢索結(jié)果集合篩選過濾的屬性主要集中在圖片色彩、片幅、尺寸、人物特征等。圖片推薦包括熱門、相似、個性化以及編輯推薦等,其中相似推薦大多以圖片色彩和主題相似分析為基礎(chǔ)。標(biāo)準(zhǔn)中定義的圖片內(nèi)容元數(shù)據(jù)元素大部分來源于此。
2.有詳有略
標(biāo)準(zhǔn)中對人物特征描述和攝影技術(shù)進行了較為詳細的定義。人數(shù)、性別、年齡、民族、行為、表情、服飾、人物關(guān)系等人物信息,圖片色彩、畫幅方向、景別、色調(diào)、構(gòu)圖方式、攝影技巧等攝影技術(shù)信息,對搜索結(jié)果過濾精化、圖片自動分析與推薦都具有重要作用。
標(biāo)準(zhǔn)中對圖片專題、自定義分類、畫面內(nèi)容等未做細化規(guī)定,以適應(yīng)多種不同業(yè)務(wù)場景的需要,可由用戶自定義擴展,提高標(biāo)準(zhǔn)的適用性。
3.強調(diào)規(guī)范化標(biāo)注
標(biāo)準(zhǔn)中定義了22個可擴展的受控詞表,用于規(guī)范20個元數(shù)據(jù)元素的標(biāo)注,減少主觀標(biāo)注的不一致性,也便于支持圖片檢索時的結(jié)果集過濾。
4.層次化、體系化
標(biāo)準(zhǔn)編制組首先建立了一套圖片元數(shù)據(jù)體系架構(gòu),根據(jù)語義抽象程度不同,依次分為物理層、邏輯層、內(nèi)容層和主題層。原有圖片元數(shù)據(jù)描述規(guī)范定義的元數(shù)據(jù)項集中在物理層和邏輯層。本標(biāo)準(zhǔn)主要定義了內(nèi)容層和主題層元數(shù)據(jù),這相比傳統(tǒng)圖片基本屬性編目具有更高的辨識度和利用價值。
標(biāo)準(zhǔn)編制過程中,得到多位圖片領(lǐng)域?qū)<业闹笇?dǎo)與支持,編制組從圖片特性、新聞圖片編輯、圖片應(yīng)用現(xiàn)狀和發(fā)展等多個角度,不斷修正完善,形成了層次簡明清晰、專業(yè)性較強、體系較為完整的圖片內(nèi)容描述元數(shù)據(jù)規(guī)范。
標(biāo)準(zhǔn)來自于應(yīng)用,服務(wù)于應(yīng)用,更需要在應(yīng)用中不斷完善。標(biāo)準(zhǔn)應(yīng)用中有兩個方面的問題需要認真思考和應(yīng)對。
第一是存量圖片標(biāo)注和已有圖片庫系統(tǒng)改造問題。隨著圖片業(yè)務(wù)的不斷變化和升級,目前很大一部分圖片庫系統(tǒng)面臨升級改造問題。同時,存量圖片數(shù)量巨大,且已經(jīng)基于原有標(biāo)準(zhǔn)和自定義元數(shù)據(jù)進行了標(biāo)注。升級圖片庫系統(tǒng)的同時,如何花費盡可能少的工作量完成存量圖片元數(shù)據(jù)信息向新的圖片元數(shù)據(jù)規(guī)范的轉(zhuǎn)換,是該標(biāo)準(zhǔn)推廣應(yīng)用中的重要問題。圖片庫升級以及存量圖片元數(shù)據(jù)遷移是必要的,符合軟件生命周期規(guī)律,也是技術(shù)和業(yè)務(wù)發(fā)展的要求。較可行的方案是圖片系統(tǒng)設(shè)計人員整理出存量圖片已標(biāo)注的元數(shù)據(jù)與新標(biāo)準(zhǔn)中元數(shù)據(jù)的對應(yīng)關(guān)系,區(qū)分出直接對應(yīng)、間接對應(yīng)、無法對應(yīng)等不同情況,最大程度的采用自動化方式實現(xiàn)部分元數(shù)據(jù)的遷移轉(zhuǎn)換,保留已標(biāo)注元數(shù)據(jù)內(nèi)容,再逐步完成新的元數(shù)據(jù)的標(biāo)注工作。
第二是圖像智能處理技術(shù)與基于文本的圖片元數(shù)據(jù)規(guī)范在應(yīng)用中的關(guān)系問題。隨著機器學(xué)習(xí)和人工智能技術(shù)的快速發(fā)展,計算機在圖像處理、圖像識別、圖像理解等方面的智能化程度和水平不斷提高,已由特定領(lǐng)域應(yīng)用邁入通用領(lǐng)域應(yīng)用,但同時我們不難發(fā)現(xiàn),基于文本的圖片特征描述仍然在圖片存儲、編輯、管理、檢索和交換中扮演主要角色。二者之間不是對立關(guān)系,而是相輔相成、互為補充的關(guān)系。圖片元數(shù)據(jù)標(biāo)準(zhǔn)在應(yīng)用中可充分利用計算機自動處理技術(shù),提高標(biāo)注效率和質(zhì)量;基于文本的圖片元數(shù)據(jù)標(biāo)注結(jié)果具有豐富的圖片規(guī)格、內(nèi)容、主題等特征,可在圖片自動處理與智能推薦等環(huán)節(jié)發(fā)揮重要作用。雙管齊下、各盡其能,使圖片更好地為社會生產(chǎn)生活服務(wù)。
國家標(biāo)準(zhǔn)《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》從新聞編輯用圖和創(chuàng)意用圖兩個應(yīng)用角度,規(guī)定了中文新聞圖片視覺內(nèi)容和語義信息的元數(shù)據(jù)元素集合,有利于跨領(lǐng)域、跨應(yīng)用的圖片交換,更好地服務(wù)于圖片采編發(fā)和分析推薦等業(yè)務(wù)環(huán)節(jié)。標(biāo)準(zhǔn)中未涉及圖片版權(quán)元數(shù)據(jù)規(guī)約,應(yīng)用中可遵循其他版權(quán)元數(shù)據(jù)標(biāo)準(zhǔn)。剛剛發(fā)布的這一版標(biāo)準(zhǔn)中尚未對數(shù)字圖表、漫畫、動圖等其他類型圖片的個性化元數(shù)據(jù)做出規(guī)定,但標(biāo)準(zhǔn)中已定義的元數(shù)據(jù)元素可適用于這些類圖片的標(biāo)注。
該標(biāo)準(zhǔn)研制過程中得到了很多學(xué)者、領(lǐng)域?qū)<业膸椭椭С郑幹平M力求在完整性、專業(yè)性、實用性等方面達到相對平衡,但不斷完善才能保持其生命力。希望標(biāo)準(zhǔn)能夠得到越來越多的應(yīng)用,并在應(yīng)用中發(fā)現(xiàn)不足,促進標(biāo)準(zhǔn)的升級改版,從而更好地為應(yīng)用服務(wù)。
[1]任悅,曾璜編著.《圖片編輯手冊》第四版.中國攝影出版社.2015年9月
[2]國家標(biāo)準(zhǔn)全文公開系統(tǒng) .http://www.gb688.cn/bzgk/gb/index
[3]IPTC Photo Metadata Standard.http://www.iptc.org/std/photometadata/specification/IPTC-PhotoMetadata
[4]EXIF Image Metadata.https://www.exif.org/imagemetadata.html
[5]全國中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會.國家標(biāo)準(zhǔn)GB/T 20092-2013《中文新聞信息置標(biāo)語言》