摘要:在MPEG-4視頻壓縮編碼標(biāo)準(zhǔn)框架下,通過對(duì)MPEG-4場(chǎng)景描述格式的研究,提出了基于XML場(chǎng)景描述的MPEG-4內(nèi)容制作系統(tǒng),并給出了詳細(xì)的模塊設(shè)計(jì)和系統(tǒng)實(shí)現(xiàn)。通過此項(xiàng)目將提升多媒體遠(yuǎn)程實(shí)時(shí)教學(xué)的質(zhì)量,促進(jìn)MPEG-4在網(wǎng)絡(luò)教育中更廣泛的應(yīng)用。
關(guān)鍵詞:網(wǎng)絡(luò)教育;MPEG-4;場(chǎng)景描述;二進(jìn)制場(chǎng)景格式;XMT
中圖法分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-3695(2006)09-0256-02
隨著遠(yuǎn)程教育技術(shù)與應(yīng)用在中國(guó)發(fā)展到第三代,多媒體遠(yuǎn)程實(shí)時(shí)教學(xué)已經(jīng)成為了一種趨勢(shì)。其通過聲、圖、文并茂的方式,讓學(xué)生在生動(dòng)的人性化課堂環(huán)境中,最大限度地對(duì)所學(xué)內(nèi)容進(jìn)行理解,并與教師和其他學(xué)生進(jìn)行交流及溝通。由于網(wǎng)絡(luò)帶寬等因素的限制,客戶端往往收不到良好的視頻播放效果,制約了多媒體遠(yuǎn)程實(shí)時(shí)教學(xué)的發(fā)展。MPEG4采用先進(jìn)的視頻壓縮技術(shù),使音頻和視頻的壓縮比率在MPEG1和MPEG2等技術(shù)的基礎(chǔ)上得到了很大的提高。同時(shí)還采用了分級(jí)編碼技術(shù)、DMIF等技術(shù),使視頻適合在多種帶寬的環(huán)境下傳輸,并能獲得最佳的質(zhì)量。
通過對(duì)MPEG4場(chǎng)景描述格式的研究,提出了基于XML場(chǎng)景描述的MPEG4內(nèi)容制作系統(tǒng),并給出了詳細(xì)的模塊設(shè)計(jì)和系統(tǒng)實(shí)現(xiàn)。
1MPEG-4場(chǎng)景描述
場(chǎng)景描述是MPEG4系統(tǒng)的主要內(nèi)容之一,其作為系統(tǒng)規(guī)范的一部分,描述了用于傳輸時(shí)空位置信息的格式。為此,MPEG4根據(jù)虛擬現(xiàn)實(shí)建模語言(VirtualRealityModelingLanguage,VRML)開發(fā)了一種二進(jìn)制語言用來進(jìn)行場(chǎng)景描述,即二進(jìn)制場(chǎng)景格式BIFS,其定義了許多交互性的內(nèi)容。
1.1二進(jìn)制場(chǎng)景格式
為了方便地定義更多的交互性內(nèi)容,MPEG4引入AV對(duì)象(Audio/VisualObjects)的概念,即將媒體元素,如行走的人、航行的船、背景和聲音等作為對(duì)象來進(jìn)行單獨(dú)編碼。而場(chǎng)景描述規(guī)定了場(chǎng)景中AV對(duì)象的組織方式,就是用來說明如何根據(jù)AV對(duì)象的時(shí)間和空間屬性將它們有效地組織起來,即通過空間和時(shí)間位置的方式來實(shí)現(xiàn)。這樣的信息足以使得將各個(gè)AV對(duì)象分別解碼重構(gòu)后,組合及重現(xiàn)它們。
BIFS使用的是參數(shù)方法,場(chǎng)景描述由一些帶有屬性和其他信息(包括事件源和目標(biāo))的節(jié)點(diǎn)構(gòu)成的編碼層次(樹)組成。樹中的葉節(jié)點(diǎn)表示特定的AV對(duì)象,而用一些媒介節(jié)點(diǎn)來實(shí)現(xiàn)分組、空間轉(zhuǎn)移和其他操作(場(chǎng)景描述節(jié)點(diǎn))。BIFS可以隨著其更新升級(jí)而不斷改進(jìn)。BIFS目的就是攜帶場(chǎng)景描述信息,它實(shí)際上就是一個(gè)協(xié)議:①它規(guī)定了如何重現(xiàn)MPEG4對(duì)象的場(chǎng)景圖,實(shí)現(xiàn)對(duì)象的動(dòng)畫和可交互行為以及對(duì)這些元素的發(fā)送加以時(shí)序化和同步化;②它還是一種有效的對(duì)數(shù)據(jù)進(jìn)行重現(xiàn)和發(fā)送的壓縮工具;③它還定義了事件處理、對(duì)象組合的節(jié)點(diǎn)和運(yùn)行規(guī)則。
1.2可擴(kuò)展MPEG4文本格式
BIFS描述了由變化的時(shí)間場(chǎng)景組成的視頻、圖片、2D圖形和3D圖形對(duì)象。使用音頻和視頻一起創(chuàng)建BIFS流,這樣就可以向用戶提供豐富的多媒體體驗(yàn),其中包括用戶交互。但是,BIFS幾乎不可能手動(dòng)進(jìn)行編碼,所以必須使用可擴(kuò)展MPEG4文本格式(eXtensibleMPEG4TextualFormat,XMT)來處理BIFS內(nèi)容。
可擴(kuò)展MPEG4文本格式采用XML的文檔組織格式按照樹狀結(jié)構(gòu)對(duì)MPEG4場(chǎng)景進(jìn)行描述,其允許用戶之間相互交互場(chǎng)景信息及所提供的相應(yīng)服務(wù),更便于描述由Web3D聯(lián)盟提出的X3D和由W3C聯(lián)盟提出的同步多媒體集成語言(SynchronizedMultimediaIntegrationLanguage,SMIL)。
可擴(kuò)展MPEG4文本格式(XMT)分為以下兩層:
(1)XMTA格式。它是一種基于XML的MPEG4場(chǎng)景描述較為低級(jí)的格式,是供BIFS使用的匯編語言,只不過是以XML的形式表示。它與BIFS直接存在著一對(duì)一的映射關(guān)系。此外,更便于描述由Web3D聯(lián)盟提出的X3D。XMTA格式不僅包括了由MPEG4標(biāo)準(zhǔn)中提出的類似X3D的內(nèi)容,如對(duì)象描述符(ObjectDescriptors,OD)、BIFSUpdateCommands和2D對(duì)象等,而且還包括了部分X3D內(nèi)容。
(2)XMTO格式。它是一種易于學(xué)習(xí)的、用來在MPEG-4展示內(nèi)部創(chuàng)建2D圖形、動(dòng)畫和交互元素的高級(jí)語言,也采用XML的形式表示。它的一些高級(jí)概念,如定位、同步、動(dòng)畫和交互等,與SMIL類似。對(duì)于每一個(gè)XMTO元素均有一系列XMTA元素相對(duì)應(yīng)。雖然不是一對(duì)一的映射關(guān)系,但XMT提供了一個(gè)由XMTO到XMTA的映射標(biāo)準(zhǔn)。XMTO被編譯成XMTA,然后再被轉(zhuǎn)換成BIFS流[1]。
2模塊設(shè)計(jì)
基于XML場(chǎng)景描述的MPEG4內(nèi)容制作工具的功能模塊設(shè)計(jì),如圖1所示。它主要包括三個(gè)主模塊:
(1)場(chǎng)景資源編輯。
資源編輯模塊完成MPEG4內(nèi)容制作之前各種教育資源的導(dǎo)入和MPEG4場(chǎng)景的編輯。它包含三個(gè)子模塊:資源導(dǎo)入模塊、資源管理模塊、場(chǎng)景編輯模塊。其中,場(chǎng)景編輯模塊的功能是使導(dǎo)入的各種不同類型的教育資源能夠按照制作者的意愿進(jìn)行“所見即所得”的可視化編輯。該編輯過程是通過資源在場(chǎng)景區(qū)域的拖曳和對(duì)應(yīng)資源的時(shí)間線設(shè)定兩個(gè)步驟來完成的。場(chǎng)景中資源對(duì)象可以通過該工具的屬性框來設(shè)置該對(duì)象的大小、顏色、旋轉(zhuǎn)角度和透明度等,或直接通過對(duì)該資源對(duì)象的拖曳來改變其基本屬性。而時(shí)間線主要是為了讓用戶能方便地按照時(shí)間順序來定義場(chǎng)景資源對(duì)象的動(dòng)畫特性和事件屬性。
(2)場(chǎng)景狀態(tài)記錄。該
模塊由場(chǎng)景實(shí)時(shí)記錄、場(chǎng)景資源解析兩個(gè)子模塊組成。其主要功能是將場(chǎng)景編輯的狀態(tài)實(shí)時(shí)記錄下來,方便MPEG4內(nèi)容的隨時(shí)預(yù)覽和保存。場(chǎng)景實(shí)時(shí)記錄是通過將前臺(tái)用戶的編輯過程采用可擴(kuò)展MPEG4文本格式記錄下來,即通過XML的形式來記錄用戶的場(chǎng)景描述。其格式如下:
xsi:schemaLocation=\"urn:mpeg:MPEG4:xmto:schema:2002xmto.xsd\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchemainstance\" xmlns:xlink=\"http://www.w3.org/1999/xlink\">
在XMT文檔中,用標(biāo)簽來區(qū)分各種場(chǎng)景資源對(duì)象。每個(gè)標(biāo)簽的屬性規(guī)定了該對(duì)象的組織方式。場(chǎng)景資源對(duì)象不僅具有一些基本的屬性特征,如文字,有顏色、大小、字體等特征,還具有動(dòng)畫特性和事件響應(yīng)機(jī)制。其中,某個(gè)資源對(duì)象的動(dòng)畫特性可以通過事件響應(yīng)機(jī)制來觸發(fā),也可以通過時(shí)間屬性來定義。在這里,資源對(duì)象的動(dòng)畫特性包括變色動(dòng)畫、位移動(dòng)畫、縮放動(dòng)畫、旋轉(zhuǎn)動(dòng)畫和漸變動(dòng)畫五種。通過這種方式,使MPEG4場(chǎng)景中的資源對(duì)象實(shí)現(xiàn)動(dòng)畫功能和可交互行為。
(3)場(chǎng)景資源預(yù)覽。
資源預(yù)覽模塊主要用來對(duì)MPEG4場(chǎng)景編輯工作效果的隨時(shí)預(yù)覽,使制作者能夠?qū)σ淹瓿傻牟糠謭?chǎng)景內(nèi)容進(jìn)行及時(shí)的查看和修改。它包含兩個(gè)子模塊,即格式轉(zhuǎn)換模塊和編/解碼模塊。其中,格式轉(zhuǎn)換模塊的功能是將場(chǎng)景編輯記錄下來的XMT轉(zhuǎn)換為BIFS,進(jìn)而生成MPEG4文件以便于預(yù)覽。這里采用了IBM公司提供的MPEG4SDK,該開發(fā)包提供了一套可訪問MPEG4技術(shù)的Java組件,可用來對(duì)XMT進(jìn)行格式轉(zhuǎn)換并處理MPEG4內(nèi)容。
其中,XmtBatch包提供了將XMT轉(zhuǎn)換為MPEG4文件的接口。通過調(diào)用XmtBatch類中的run(Stringas[])方法可以方便地轉(zhuǎn)換其格式。另外,MPEG4SDK中的Player開發(fā)包提供了MPEG4播放器的創(chuàng)建方法。通過player.PlayerFactory類中的createMPEG4Player()來創(chuàng)建MPEG4播放器的實(shí)例。而player.PlayerControl類則提供了用來訪問播放器實(shí)例的接口。它的get ̄RenderComponent()方法用來獲得Java.awt.Component對(duì)象;open()方法打開MPEG4內(nèi)容,為回放做好準(zhǔn)備;start()方法開始回放內(nèi)容,使MPEG4內(nèi)容能在Render組件中顯示[6]。
3系統(tǒng)實(shí)現(xiàn)
MPEG-4內(nèi)容制作工具的功能流程如圖2所示。該工具在資源導(dǎo)入模塊中,通過制作者導(dǎo)入相應(yīng)的各種類型的教育資源,如圖片、文字、音/視頻和已編輯好的MPEG4資源等,來完成課件制作素材的收集。
在場(chǎng)景編輯部分,采用屬性框來定義場(chǎng)景對(duì)象的一些基本屬性,如顏色、大小和透明度等。采用時(shí)間線的方式來對(duì)選定的場(chǎng)景對(duì)象進(jìn)行各種動(dòng)畫和事件的描述及定義,以方便用戶能按照自己的意愿對(duì)各種資源進(jìn)行有效的場(chǎng)景描述。
資源預(yù)覽通過對(duì)場(chǎng)景狀態(tài)的實(shí)時(shí)記錄,能對(duì)用戶已編輯的場(chǎng)景進(jìn)行隨時(shí)預(yù)覽。如此,能保證用戶對(duì)已編輯的場(chǎng)景進(jìn)行實(shí)時(shí)的修改和定義,以滿足課件制作的需要。基于XML場(chǎng)景描述的MPEG4內(nèi)容制作工具的主界面如圖4所示。圖3基于XML場(chǎng)景描述的MPEG-4內(nèi)容制作工具主界面
4總結(jié)
本文所介紹的MPEG4內(nèi)容制作工具是一個(gè)用于制作基于MPEG4標(biāo)準(zhǔn)的交互式多媒體軟件。該工具采用目前流行的Java語言實(shí)現(xiàn),具有良好的跨平臺(tái)性,可滿足不同平臺(tái)使用者的需求。使用者通過對(duì)前臺(tái)場(chǎng)景中的各種教育資源采用“所見即所得”的可視化編輯,在后臺(tái)同步產(chǎn)生相應(yīng)操作的XMT場(chǎng)景描述文件,并可對(duì)所編輯的場(chǎng)景內(nèi)容隨時(shí)進(jìn)行預(yù)覽,以查看其制作效果。最后,可將編輯完成的場(chǎng)景內(nèi)容生成符合ISO國(guó)際標(biāo)準(zhǔn)的MPEG4文件。
當(dāng)前,基于Internet的遠(yuǎn)程教學(xué)系統(tǒng)是一種建立在現(xiàn)代傳播技術(shù)基礎(chǔ)上的多媒體應(yīng)用系統(tǒng),它已成為現(xiàn)代教育中不可缺少的一部分。但是由于受到網(wǎng)絡(luò)帶寬等因素的限制,對(duì)網(wǎng)絡(luò)教學(xué)中的交互式多媒體數(shù)據(jù)傳輸構(gòu)成了極大的障礙。MPEG4等流媒體技術(shù)的出現(xiàn),使教學(xué)內(nèi)容的再現(xiàn)變得更為豐富和多元化。
參考文獻(xiàn):
[1]Rob Koenen. Overview of the MPEG-4Standard(v2.1Jejuversion)[S]. ISO/IECJTC1/SC29/WG11 N4668,2002.
[2]Coding of Audio-Visual Objects-Part 1:Systems.2ndedtion[S].ISO/IEC14496-1,2001.
[3]王榮國(guó),卜佳俊,陳純.基于MPEG4的視頻流傳輸框架[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(35):152154.
[4]馬杰,田金文,柳鍵.流媒體技術(shù)及其文件格式[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(23):4952.
[5]邵維忠,楊芙清.面向?qū)ο蟮南到y(tǒng)分析[M].北京:清華大學(xué)出版社,1998.1128.
[6]IBM Toolkit for MPEG-4[EB/OL].http://www.alphaworks.ibm.com/tech/tk4MPEG-4,2003.
作者簡(jiǎn)介:
郭軍(1981),男,湖北洪湖人,碩士研究生,主要研究方向?yàn)榫W(wǎng)絡(luò)教育;
楊宗凱(1963)男,國(guó)家信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)教育技術(shù)分技術(shù)委員會(huì)委員,ISO/IECJC1/SC36/SP聯(lián)合主席,教授,博導(dǎo),博士,主要研究方向?yàn)榫W(wǎng)絡(luò)教育、電子商務(wù)、智能信號(hào)處理與應(yīng)用、寬帶網(wǎng)絡(luò)通信技術(shù);
劉威(1977)男,湖北武漢人,教師,博士,主要研究方向?yàn)榫W(wǎng)絡(luò)教育、電子商務(wù);
吳砥(1978),男,湖北洪湖人,教師,主要研究方向?yàn)檫h(yuǎn)程教育、國(guó)際和國(guó)內(nèi)網(wǎng)絡(luò)教育相關(guān)標(biāo)準(zhǔn)的研究、制定和應(yīng)用。