
在移動搜索時,如何讓那些為PC設(shè)計的萬維網(wǎng)頁在手機上良好地顯示?
你是不是也曾經(jīng)對著手機上那些擠做一團的網(wǎng)頁皺過眉頭?我們在手機上搜索萬維網(wǎng)頁時,常常會碰到這樣的麻煩。搜索列表通常可以正常顯示,但是當離開搜索引擎頁面,點進其中一條鏈接時,你花時間和流量所下載的頁面,卻常常無法正常觀看—要么橫向的滾動條被拉得很長,要么頁面被擠成一團。
這是因為,一般的網(wǎng)頁都是按照PC屏幕分辨率設(shè)計的,所以無法自動適應(yīng)手機的小屏幕。為了解決這個難題,很多公司想出了不同的做法。比如,Opera公司正在研究一種自動縮放頁面大小的瀏覽器;還有一些公司在頁面設(shè)計上下功夫,讓代碼能夠識別用戶的上網(wǎng)設(shè)備從而有針對性地顯示,但這無疑對其網(wǎng)站代碼的編寫提升了難度;而專為手機而推出的移動域名.mobi,則必須以無線互聯(lián)網(wǎng)的內(nèi)容極大豐富為前提。
在未來,手機有望取代計算機而成為人們接入互聯(lián)網(wǎng)的首選設(shè)備。但是在此之前,上述的難題必須要獲得很好的解決。目前,微軟亞洲研究院有一項移動搜索(Mobile Search)研究成果,已經(jīng)可以實現(xiàn)手機上大頁面的正確顯示。謝幸研究員和辛國茂研究員向《互聯(lián)網(wǎng)周刊》介紹了這項已經(jīng)在微軟的英文移動搜索平臺上獲得的應(yīng)用技術(shù)。
當你在手機上使用微軟的Live移動搜索時,在結(jié)果列表頁面點擊其中的某條鏈接后,系統(tǒng)會先對其進行一系列的分析—將其拆分成為若干塊,自動判別并顯示該頁面中最重要的一塊內(nèi)容(比如,頭條新聞),其余部分均以鏈接形式放在頁面底端,供用戶查看。比如,當你訪問CNN時,系統(tǒng)會把其當日的一個最突出的新聞顯示在手機上,并將其余的新聞內(nèi)容、導航條和廣告等內(nèi)容分別以帶有關(guān)鍵字的鏈接形式放在該條新聞的底端。通常的新聞網(wǎng)頁會被拆分為幾塊至十幾塊,網(wǎng)頁包含的內(nèi)容越多,其所分的塊數(shù)也隨之增多。
將某一大的頁面重新組織并顯示到手機上時,系統(tǒng)將保證內(nèi)容不做橫向滾動,以提高閱讀體驗。與那些將網(wǎng)頁轉(zhuǎn)成純文本形式再顯示的方式不同,這一技術(shù)仍可保留原頁面的元素,比如導航、廣告等。被拆分的各個塊都有簡介,用戶可以根據(jù)其介紹有選擇性地進行查看。
這項技術(shù)中最大的難點在于領(lǐng)會原頁面編寫者的意圖,以判斷將頁面分成幾個板塊,并將每一塊按照新規(guī)則顯示出來。盡管各個網(wǎng)頁看上去都不太相同,但是在導航條和廣告方面的設(shè)計,視覺上大都存在著共性。
因此,這項技術(shù)采用了視覺和內(nèi)容相結(jié)合的方法。首先,要根據(jù)用戶閱讀習慣,從視覺上分析一個網(wǎng)頁可分為幾塊。它的原理是,先通過人工標注一些具有特征的塊,比如內(nèi)容塊、廣告塊等等,作為訓練樣本,然后讓機器學習,最后可獲得一些模型。當分析某個網(wǎng)頁時,便將其各個部分與模型進行比對,看它像哪個塊。
從視覺上分好塊之后,還要實現(xiàn)內(nèi)容上的再構(gòu)造。每個網(wǎng)頁的HTML代碼都可以看作一個樹狀結(jié)構(gòu),樹上帶有各個節(jié)點的信息,比如顏色等。系統(tǒng)要先將一個網(wǎng)頁在內(nèi)存中迅速構(gòu)造為一個樹狀結(jié)構(gòu),但并不輸出顯示,而是根據(jù)需要有選擇地將其重新顯示在手機屏幕上。實際上,把一個網(wǎng)頁構(gòu)造成一個樹狀結(jié)構(gòu)的工作量并不亞于一個普通瀏覽器的解析過程。目前,這項技術(shù)已實現(xiàn)幾個毫秒處理一個網(wǎng)頁,這個速度還是很可觀的。
當然,這項研究也存在著有待進一步研究的方向,比如,對于一些帶有JavaScript腳本、Flash和Word等復雜頁面的支持。此外,將來還有可能將這一技術(shù)集成到手機瀏覽器的后端服務(wù)器中,以便實現(xiàn)直接的網(wǎng)頁訪問,而不用再像現(xiàn)在這樣在搜索列表里訪問頁面。