摘要:隨著信息技術(shù)的發(fā)展,靜止圖像壓縮編碼技術(shù)在信息領(lǐng)域的應(yīng)用越來越廣泛。如果某種圖像編碼算法既能夠保證質(zhì)量,又能夠存儲時(shí)占用空間小、傳輸時(shí)占用帶寬小,那么該編碼算法則越優(yōu)秀。JPEG壓縮算法就是這樣一種既可以避免失真,又能夠?qū)崿F(xiàn)令人滿意的壓縮比例的算法。
關(guān)鍵詞:圖像編碼靜止圖像壓縮 JPEG標(biāo)準(zhǔn)
多媒體和互聯(lián)網(wǎng)的發(fā)展,圖像的存儲和傳輸問題變得越來越突出,要求存儲、傳輸對網(wǎng)絡(luò)資源的開銷盡量低,同時(shí)又不能降低存儲和傳輸過程中圖像的質(zhì)量。因此需要對圖像采用合適的方法進(jìn)行壓縮和編碼,方便圖像存儲及傳輸。
常用的圖像文件格式中JPEG以占用空間小,圖像質(zhì)量高等特點(diǎn)而廣為用戶采用。
上世紀(jì)80年代ISO和CCITT 兩大標(biāo)準(zhǔn)組織共同推出JPEG壓縮算法,它定義了連續(xù)色調(diào)、多級灰度、靜止圖像的數(shù)字圖像壓縮算法,是國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。離散余弦(DCT)則是最小均方誤差條件下得出的最佳正交變換,作為多項(xiàng)圖像編碼國際標(biāo)準(zhǔn)的核心算法而得到廣泛應(yīng)用。其中最著名的算法即為JPEG圖像壓縮算法。DCT算法變換核是余弦函數(shù),計(jì)算速度較快,質(zhì)量劣化程度低,滿足圖像壓縮和其他處理的要求。
按照灰度層次,圖像可分為兩類:第一類為有灰度層次圖像;第二類成為二值圖像,即僅黑白層次圖像。電視圖像、照片傳真、靜止圖像屬于有灰度圖像。而文件傳真、二值靜止圖像則屬于二值圖像范疇。
經(jīng)過幾十年人們對圖像壓縮技術(shù)的不斷研究,并且隨著軟硬件技術(shù)的不斷發(fā)展,人們已經(jīng)能夠?qū)崿F(xiàn)大量的圖像壓縮算法。早期的圖像編碼主要基于信息論的理論基礎(chǔ),壓縮效果不理想。最近幾年隨著相關(guān)領(lǐng)域科學(xué)的發(fā)展,人們的研究重點(diǎn)已經(jīng)轉(zhuǎn)向視覺生理學(xué)和景物分析新的方向上,實(shí)現(xiàn)了圖像編碼技術(shù)由第一代向第三代的跨越,實(shí)現(xiàn)了非常高的壓縮比,極限情況下能達(dá)到千分之一。
以最小的代價(jià)實(shí)現(xiàn)特定質(zhì)量的圖像的傳輸是圖像編碼的核心,又稱為圖像壓縮,廣泛應(yīng)用于圖像的存儲、傳輸和交換。在相關(guān)過程中對圖像信號中存在的冗余都進(jìn)行壓縮編碼,能夠最大程度實(shí)現(xiàn)圖像編碼的本質(zhì)。
預(yù)測編碼、熵編碼和變換編碼是最常用的編碼算法。如果編碼后無信息丟棄,稱為無失真編碼;若編碼后信息有丟棄,則稱為有失真編碼。這是另外一種編碼分類的標(biāo)準(zhǔn)。
預(yù)測編碼法和變換編碼法是圖像統(tǒng)計(jì)壓縮編碼算法的兩大類。預(yù)測編碼法包括增量調(diào)制法(法)及差分預(yù)測編碼法(DPCM法)等。差分預(yù)測編碼法(DPCM法)是圖像通信中常用的算法,還有其他等等混合應(yīng)用的各種方法,此處不做介紹。
靜止的、不變的、稱為靜止圖像,一般從設(shè)備屏幕上看長時(shí)間保持不變。被攝事務(wù)一般是靜止或者某一特定時(shí)刻保持靜止的。按照應(yīng)用場景的不同,傳輸文件、模型、圖片等靜止圖像時(shí)常用靜止圖像傳輸;現(xiàn)場實(shí)時(shí)監(jiān)控則常用凝固圖像傳輸。
要求如下:
①清晰度:圖像清晰度更高,從而滿足人眼對觀察圖像細(xì)節(jié)的要求,而不是利用通常電影的原理。
②顯示方式:逐漸浮現(xiàn)。即先傳模糊的整體圖像,再逐漸傳輸顯示細(xì)節(jié),從而使觀看者不用等待太久時(shí)間,適應(yīng)窄帶傳輸?shù)膱鼍啊?/p>
③抗干擾:在較長傳輸過程中,編碼方法要有較強(qiáng)的抗干擾噪聲能力,防止圖像呈現(xiàn)在終端上時(shí)質(zhì)量低下。
以下為對靜態(tài)圖像編碼技術(shù)的介紹:
①預(yù)測編碼:由相鄰像素間相關(guān)性出發(fā),通過前面像素值預(yù)測當(dāng)前像素值,并經(jīng)過實(shí)際數(shù)據(jù)的運(yùn)算得到預(yù)測誤差,而該誤差通常接近實(shí)際值。因此對預(yù)測誤差直接進(jìn)行單符號的熵編碼或?qū)︻A(yù)測誤差進(jìn)行量化再進(jìn)行熵編碼是更高效率的計(jì)算方法,最主要的算法則是簡稱為DPCM的差分脈沖編碼。
②變換編碼:是目前幾乎所有的圖像、視頻和視頻等的壓縮標(biāo)準(zhǔn)的核心編碼算法。而新近發(fā)展的更多圖像壓縮技術(shù)中,該編碼也是核心的基礎(chǔ)算法,在實(shí)際中得到廣泛應(yīng)用。
JPEG是“Join Photographic Expert Group”的首字母簡寫,可將每24比特的單彩色像素圖像壓縮至2比特,而保持較高的圖像質(zhì)量。其定義的編碼系統(tǒng)主要有以下三種:a DCT有損編碼基本系統(tǒng),大部分壓縮應(yīng)用場景下均采用該系統(tǒng)。b可擴(kuò)展編碼系統(tǒng):用于高壓縮、高精度、漸進(jìn)重建應(yīng)用。c無損系統(tǒng):應(yīng)用于無失真場合。
JPEG標(biāo)準(zhǔn)一般用于自然景象、連續(xù)色調(diào)數(shù)字圖像編、解碼。
簡單歸納為:兩種工作方式(順序方式、漸進(jìn)方式)、三種級別(基本系統(tǒng)、擴(kuò)展系統(tǒng)、無失真系統(tǒng))。
順序方式:將圖像的行和列分割成四方小塊,從左到右、由上而下逐行逐列對所有的小塊進(jìn)行編碼運(yùn)算。并且解碼時(shí)也按編碼順序逐塊解碼。這兩個(gè)過程均一次完成。
漸進(jìn)方式:整個(gè)圖像需要經(jīng)過多次編碼運(yùn)算才能完成,初次編碼時(shí)質(zhì)量低于最終要求的質(zhì)量。逐次編碼,質(zhì)量逐次提升。解碼時(shí)首先解碼出較低質(zhì)量全幅圖像,增加附加信息后再次解碼,重復(fù)若干次,最終得到滿足質(zhì)量要求。解碼過程可隨時(shí)終止。
基本系統(tǒng):以離散余弦變換為核心,以順序工作為方式,用于一般精度。按照要求,每個(gè)壓縮編碼器均實(shí)現(xiàn)了基本算法功能。
擴(kuò)展系統(tǒng):在若干方面增強(qiáng)并減少一些限制條件后就成為“擴(kuò)展系統(tǒng)”。
無失真系統(tǒng):以DPCM技術(shù)為基礎(chǔ),壓縮比較低,但是能實(shí)現(xiàn)壓縮時(shí)不失真。
JPEG標(biāo)準(zhǔn)是多年來圖像壓縮編碼的研究成果。雖然DCT是它的核心,但它同時(shí)也采用了DPCM、自適應(yīng)量化、游程編碼、可變長熵編碼等多種技術(shù),所以應(yīng)該說是一種混合算法。
參考文獻(xiàn):
[1]Castleman,Kenneth R.Digital image processing.北京:清
華大學(xué)出版社,2003.
[2]Kenneth.R.Castleman.Digital Image Procession,北京:清華大學(xué)出版社,1998.
[3]孫兆林.MATLAB6.x圖像處理[M].北京:清華大學(xué)出版社,2002.
[4]朱秀昌,劉峰,胡棟.數(shù)字圖像處理與圖像通信[M].北京:北京郵電大學(xué)出社,2002.
[5]薛永林,劉珂,李鳳亭.并行處理JPEG算法的優(yōu)化[J].電子學(xué)報(bào),2002,30(2):160-162.
[6]林福宗.圖像文件格式(上)——Windows編程.清華大學(xué)出版社,1996年.
[7]李振輝,李仁各編著.探索圖像文件的奧秘.清華大學(xué)出版社,1996年.
[8]黎洪松,成寶譯.JPEG靜止資料壓縮標(biāo)準(zhǔn).學(xué)苑出版社,1996年.
[9]董長虹,賴志國,余嘯海.Matlab圖像處理與應(yīng)用,2004.