999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“互聯(lián)網(wǎng)+”環(huán)境下移動(dòng)校園搜索引擎設(shè)計(jì)與實(shí)現(xiàn)

2020-08-12 02:32:56王寧邦
關(guān)鍵詞:搜索引擎校園信息

王寧邦,徐 博

(云南師范大學(xué) 信息管理處,云南 昆明 650500)

1 概 述

“互聯(lián)網(wǎng)+”代表著一種新的經(jīng)濟(jì)形態(tài)。“互聯(lián)網(wǎng)+”是指以互聯(lián)網(wǎng)為主的新一代信息技術(shù),包括移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)等在經(jīng)濟(jì)、社會(huì)生活中各部門(mén)的擴(kuò)散、應(yīng)用與深度融合的過(guò)程[1]。2015年成為大數(shù)據(jù)發(fā)展的里程碑,在政府工作報(bào)告中,提出要制定“互聯(lián)網(wǎng)+”計(jì)劃,推動(dòng)云計(jì)算、大數(shù)據(jù)與現(xiàn)代制造業(yè)的結(jié)合,促進(jìn)大數(shù)據(jù)的升級(jí)發(fā)展。門(mén)戶(portal)一詞原意是指正門(mén)、入口,現(xiàn)多用于互聯(lián)網(wǎng)的門(mén)戶網(wǎng)站和企業(yè)應(yīng)用系統(tǒng)的門(mén)戶系統(tǒng)[1]。高校網(wǎng)站(Website)分為門(mén)戶網(wǎng)站、二級(jí)院系或部門(mén)網(wǎng)站和專題網(wǎng)站[2]。文中信息門(mén)戶為學(xué)校官網(wǎng)、學(xué)院或部門(mén)的主站。

移動(dòng)無(wú)線互聯(lián)網(wǎng)的時(shí)代已經(jīng)到來(lái),移動(dòng)無(wú)線終端的數(shù)量己經(jīng)超過(guò)有線終端,移動(dòng)互聯(lián)的應(yīng)用需求日益增大,隨著無(wú)線網(wǎng)絡(luò)建設(shè)的發(fā)展和數(shù)字化校園應(yīng)用系統(tǒng)的持續(xù)建設(shè),校園移動(dòng)終端應(yīng)用已經(jīng)逐步形成校園信息化的應(yīng)用趨勢(shì)。校園網(wǎng)各種應(yīng)用向移動(dòng)終端的遷移,提供真正適用移動(dòng)校園網(wǎng)的應(yīng)用服務(wù),是每個(gè)學(xué)校面臨的新挑戰(zhàn)。顯然,“一云多終端”風(fēng)靡全網(wǎng),單一的服務(wù)模式解決不了“互聯(lián)網(wǎng)+”環(huán)境下的網(wǎng)絡(luò)文化發(fā)展需求,移動(dòng)網(wǎng)絡(luò)文化融合主流應(yīng)用如微信、主流移動(dòng)技術(shù)、校園信息資源的發(fā)展勢(shì)不可擋。QQ空間文化、微信文化發(fā)展迅猛,借鑒它們的運(yùn)作模式加強(qiáng)移動(dòng)校園網(wǎng)絡(luò)文化建設(shè)具有一定的研究意義。

當(dāng)下,移動(dòng)校園網(wǎng)絡(luò)文化明顯出現(xiàn)建設(shè)缺位、沒(méi)有吸引力、隱形外流等情況,信息門(mén)戶也往往回避不了無(wú)人問(wèn)津的尷尬,融入主流技術(shù)整合高校信息門(mén)戶資源,豐富、挖掘校園網(wǎng)絡(luò)文化的承載渠道,加強(qiáng)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè),研究門(mén)戶信息網(wǎng)絡(luò)傳播規(guī)律以及網(wǎng)絡(luò)輿情分析與引導(dǎo)能力顯得格外重要,在“互聯(lián)網(wǎng)+”環(huán)境下重新思考高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)、整合門(mén)戶信息及其傳播問(wèn)題顯得很有必要。創(chuàng)新符合網(wǎng)絡(luò)傳播規(guī)律的網(wǎng)上宣傳方式,提升網(wǎng)絡(luò)輿情分析和引導(dǎo)能力。加強(qiáng)互聯(lián)網(wǎng)分類管理,強(qiáng)化運(yùn)營(yíng)主體的社會(huì)責(zé)任。推進(jìn)文明辦網(wǎng)、文明上網(wǎng),引導(dǎo)廣大青年?duì)幃?dāng)“中國(guó)好網(wǎng)民”,倡導(dǎo)網(wǎng)絡(luò)公益活動(dòng),凈化網(wǎng)絡(luò)環(huán)境。可見(jiàn)高校信息門(mén)戶將會(huì)被融入時(shí)代的主流技術(shù)。同樣的,高校移動(dòng)校園網(wǎng)絡(luò)文化也需要依托移動(dòng)端移動(dòng)技術(shù)、豐富的校園網(wǎng)絡(luò)行為等的承載[3]。

“分久必合”,各學(xué)院門(mén)戶自成一家,信息服務(wù)不集中,快捷查詢門(mén)戶信息顯得不方便。就桌面而言,缺少一鍵查詢獲取所需信息的應(yīng)用,雖然百度可以做到這一點(diǎn),但是由于它的工作量很大,無(wú)暇顧及校園門(mén)戶信息;另外,桌面門(mén)戶由于分辨率的問(wèn)題,在移動(dòng)端的門(mén)戶信息顯得不容樂(lè)觀,但是移動(dòng)端明顯表現(xiàn)出來(lái)比桌面門(mén)戶端更觸手可及的優(yōu)勢(shì)。門(mén)戶信息在移動(dòng)端傳播具有便利性,借助移動(dòng)端IOS、Android等技術(shù),個(gè)性化推送技術(shù),第三方如微信等為桌面信息門(mén)戶的發(fā)布提供便利,學(xué)生可以方便快速獲取校園信息。網(wǎng)頁(yè)自適應(yīng)技術(shù)、HTML5技術(shù)等可以讓信息門(mén)戶擁有更好的主流技術(shù)體驗(yàn),然而現(xiàn)有的校園信息門(mén)戶不具備這些體驗(yàn)[4]。同時(shí),為每一個(gè)門(mén)戶開(kāi)發(fā)具備不錯(cuò)體驗(yàn)的客戶端存在重復(fù)建設(shè)的問(wèn)題,顯得不太現(xiàn)實(shí)。所以融入主流技術(shù)統(tǒng)一提供門(mén)戶信息服務(wù)、整合高校信息門(mén)戶資源,豐富、挖掘校園網(wǎng)絡(luò)文化的承載渠道,加強(qiáng)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè),研究門(mén)戶信息網(wǎng)絡(luò)傳播規(guī)律以及網(wǎng)絡(luò)輿情分析與引導(dǎo)能力顯得格外重要。

“互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎相關(guān)研究現(xiàn)狀分析如下:(1)信息門(mén)戶整合方面;唐宏平[1]認(rèn)為信息門(mén)戶具有“統(tǒng)一管理信息資源、信息技術(shù)整合和信息共享”的優(yōu)勢(shì),并研究與應(yīng)用信息門(mén)戶技術(shù)等搭建起了遼河油田新的集中統(tǒng)一的信息門(mén)戶系統(tǒng)。馬國(guó)良[2]基于Web服務(wù)及其關(guān)鍵技術(shù)(HTTP、XML、SOAP等)、門(mén)戶技術(shù)等建立統(tǒng)一門(mén)戶。方玲慧[5]針對(duì)目前美國(guó)高校門(mén)戶網(wǎng)站建設(shè)的現(xiàn)狀和存在的問(wèn)題,對(duì)加強(qiáng)網(wǎng)站建設(shè)的對(duì)策和方法進(jìn)行探討。方偉杰[6]通過(guò)在數(shù)據(jù)整合與身份認(rèn)證整合的基礎(chǔ)上進(jìn)行信息整合實(shí)現(xiàn)高校資源與服務(wù)的綜合利用。周曉艷[7]將一卡通系統(tǒng)納入信息門(mén)戶平臺(tái)中,豐富信息平臺(tái)內(nèi)容。付小龍[8]闡述了信息構(gòu)建理論在數(shù)字校園信息門(mén)戶規(guī)劃與設(shè)計(jì)的指導(dǎo)作用。林麗娟[9]提出信息整合的分層整合架構(gòu)。藍(lán)鷹[10]提出了一套基于HTML5+CSS技術(shù)的高校門(mén)戶網(wǎng)站生成方案。畢劍[11]采用響應(yīng)式網(wǎng)頁(yè)設(shè)計(jì)技術(shù),為圖書(shū)館移動(dòng)門(mén)戶的建設(shè)提供了一種新的解決方案。關(guān)于信息門(mén)戶整合的文章較少,百度、Google等技術(shù)明顯產(chǎn)生了很好的經(jīng)濟(jì)效益和社會(huì)效益,隨著移動(dòng)技術(shù)的發(fā)展,考慮“互聯(lián)網(wǎng)+”環(huán)境下,高校利用搜索引擎等技術(shù)對(duì)信息門(mén)戶整合具有重要研究意義。(2)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)方面;孫耀庭[12]對(duì)開(kāi)放大學(xué)移動(dòng)校園APP服務(wù)功能需求進(jìn)行探索。燕玲玲[13]基于Android平臺(tái),建立一個(gè)針對(duì)本校學(xué)生的實(shí)時(shí)校園生活信息服務(wù)系統(tǒng),提供學(xué)生交流互動(dòng)的平臺(tái),打破傳統(tǒng)的只能上貼吧論壇交流的格局。(3)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)方面;岳雨儉[14]提出基于Hadoop分布式網(wǎng)絡(luò)爬蟲(chóng)技術(shù),具有較髙的抓取效率。(4)基于用戶偏好的個(gè)性化推送方面;黃原原[15]提出一個(gè)基于百度社區(qū)和領(lǐng)域本體庫(kù),結(jié)合相關(guān)反饋技術(shù)和擴(kuò)展查詢技術(shù),促使個(gè)體特征庫(kù)不斷學(xué)習(xí)用戶知識(shí)以提供個(gè)性化信息檢索的模型。周蒙[3]利用信息推送技術(shù)、個(gè)性化廣告推送技術(shù)等,設(shè)計(jì)并實(shí)現(xiàn)個(gè)性化廣告推送服務(wù)系統(tǒng)。劉思源[4]設(shè)計(jì)并實(shí)現(xiàn)了一種基于用戶偏好和地理位置信息的即時(shí)推送,并構(gòu)建完整的個(gè)性化推送模型。

綜上所述,當(dāng)前的信息門(mén)戶資源服務(wù)方式存在效率低下的問(wèn)題,尤其是大數(shù)據(jù)釋放紅利的時(shí)代,其次,分散建設(shè)集中服務(wù)顯得具有更大的影響力,產(chǎn)生了更大的社會(huì)效益,所以利用前沿的計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算技術(shù)整合校園網(wǎng)門(mén)戶資源,優(yōu)化信息門(mén)戶服務(wù)效率的移動(dòng)校園搜索引擎相關(guān)研究具有重要意義。在“互聯(lián)網(wǎng)+”環(huán)境下重新思考高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)、整合門(mén)戶信息及其傳播問(wèn)題顯得很有必要。此外,校園網(wǎng)絡(luò)文化平臺(tái)構(gòu)件缺失,文化資源外流嚴(yán)重,由本校學(xué)生形成的純凈校園網(wǎng)絡(luò)文化氛圍亟待形成,移動(dòng)校園網(wǎng)絡(luò)文化平臺(tái)承載學(xué)生和學(xué)校信息門(mén)戶的發(fā)展,可以依托移動(dòng)校園網(wǎng)絡(luò)文化個(gè)人空間,記錄學(xué)生在學(xué)校的網(wǎng)絡(luò)文化行為,充分挖掘高校信息資源與學(xué)生網(wǎng)絡(luò)行為之間的關(guān)系,為構(gòu)建“互聯(lián)網(wǎng)+”環(huán)境下移動(dòng)校園網(wǎng)絡(luò)文化平臺(tái)奠定基礎(chǔ)。

2 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎設(shè)計(jì)

以云南師范大學(xué)各個(gè)學(xué)院信息門(mén)戶為實(shí)例對(duì)象,擬研究整合校園門(mén)戶信息,提供方便快捷、融合移動(dòng)體驗(yàn)、網(wǎng)頁(yè)自適應(yīng)技術(shù)、HTML5技術(shù)的掌上信息服務(wù),提供一鍵查詢校園搜索引擎的終端功能,讓師生體驗(yàn)到真正的移動(dòng)校園。開(kāi)通移動(dòng)校園文化個(gè)人空間,進(jìn)一步構(gòu)建、繁榮移動(dòng)校園網(wǎng)絡(luò)文化。

2.1 信息服務(wù)物理模型

從桌面網(wǎng)頁(yè)到移動(dòng)端數(shù)據(jù),涉及對(duì)原始桌面網(wǎng)頁(yè)主要信息的獲取,由網(wǎng)址獲取頁(yè)面所有內(nèi)容,再通過(guò)設(shè)定的通用規(guī)則對(duì)所需要的數(shù)據(jù)進(jìn)行抓取并存儲(chǔ),為了提供信息構(gòu)建的數(shù)據(jù)訪問(wèn)接口以及客戶端請(qǐng)求程序等,處理流程如圖1所示。

2.2 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎主要內(nèi)容

高校移動(dòng)校園搜索引擎系統(tǒng)結(jié)構(gòu)如圖2所示。

圖1 信息服務(wù)物理模型

圖2 高校移動(dòng)校園搜索引擎系統(tǒng)結(jié)構(gòu)

2.2.1 整合數(shù)據(jù)源提供一站式信息服務(wù)

以云南師范大學(xué)為例,在數(shù)據(jù)源方面,讓每一個(gè)門(mén)戶提供數(shù)據(jù)訪問(wèn)接口顯得繁瑣,研究依托學(xué)校的云計(jì)算平臺(tái),利用爬蟲(chóng)定時(shí)對(duì)100多個(gè)校園門(mén)戶信息進(jìn)行爬取,構(gòu)建校園搜索引擎索引庫(kù)。針對(duì)就業(yè)處,擬研究爬蟲(chóng)在互聯(lián)網(wǎng)爬取就業(yè)信息,為畢業(yè)生提供完備的就業(yè)信息源。

提供網(wǎng)頁(yè)自適應(yīng)門(mén)戶:研究兼容桌面和移動(dòng)端的網(wǎng)頁(yè)自適應(yīng)技術(shù)以及HTML5技術(shù),為桌面、第三方如微信等提供數(shù)據(jù)接口,搭建“一鍵查詢所需”的統(tǒng)一入口。使用校園搜索引擎的移動(dòng)客戶端,為師生提供一鍵移動(dòng)校園、觸手可及的門(mén)戶信息服務(wù)。研究設(shè)定數(shù)據(jù)采集規(guī)則,裁剪信息門(mén)戶冗余成分,增加移動(dòng)端技術(shù)元素,讓門(mén)戶信息服務(wù)擁有移動(dòng)體驗(yàn)。

2.2.2 主題爬蟲(chóng)技術(shù)

圖3中,黑色節(jié)點(diǎn)為主題相關(guān)網(wǎng)頁(yè),白色節(jié)點(diǎn)為主題無(wú)關(guān)網(wǎng)頁(yè),Community Q為許多主題無(wú)關(guān)網(wǎng)頁(yè)組成的區(qū)域。假設(shè)爬蟲(chóng)從P0開(kāi)始爬行,理想的主題爬蟲(chóng),應(yīng)該能夠預(yù)測(cè)網(wǎng)頁(yè)的主題相關(guān)性,沿著圖中箭頭所指的方向爬行,剪掉不相關(guān)網(wǎng)頁(yè),舍棄P3這個(gè)分支,盡可能少地下載不相關(guān)網(wǎng)頁(yè);并且準(zhǔn)確判斷出P2、d0等的主題相關(guān)性,抓取到這些網(wǎng)頁(yè)。主題爬蟲(chóng)工作流程見(jiàn)圖4。

圖3 網(wǎng)絡(luò)爬蟲(chóng)搜索示意圖

圖4 主題爬蟲(chóng)工作流程

2.2.3 累積網(wǎng)絡(luò)行為,維系大學(xué)校園和學(xué)生情誼

為學(xué)生提供移動(dòng)校園網(wǎng)絡(luò)文化空間,開(kāi)通即時(shí)通信服務(wù),記錄網(wǎng)絡(luò)行:如即時(shí)通信信息、校園空間心情等,為加強(qiáng)移動(dòng)校園網(wǎng)絡(luò)文化建設(shè)累積基礎(chǔ)數(shù)據(jù),統(tǒng)計(jì)“校園最文化”:最受關(guān)注的部門(mén)、最后關(guān)注的學(xué)生、最受關(guān)注的話題等,基于位置、軌跡等研究“我與我的校園”,統(tǒng)計(jì)畢業(yè)生對(duì)學(xué)校的關(guān)注度等。

2.2.4 挖掘平臺(tái)隱性業(yè)務(wù)促進(jìn)網(wǎng)絡(luò)文化育人

在逐步完成的基礎(chǔ)上上線運(yùn)行測(cè)試,對(duì)用戶行為進(jìn)行挖掘形成新的業(yè)務(wù)。并且研究網(wǎng)絡(luò)傳播規(guī)律的網(wǎng)上宣傳方式,提升網(wǎng)絡(luò)輿情分析和引導(dǎo)能力,推進(jìn)文明辦網(wǎng)、文明上網(wǎng),引導(dǎo)廣大青年?duì)幃?dāng)“中國(guó)好網(wǎng)民”,倡導(dǎo)網(wǎng)絡(luò)公益活動(dòng),凈化網(wǎng)絡(luò)環(huán)境,在原型開(kāi)發(fā)的過(guò)程中逐步將這些需求一一落實(shí)到每一個(gè)功能業(yè)務(wù)。如對(duì)用戶網(wǎng)絡(luò)行為(如對(duì)校園信息門(mén)戶建設(shè)的點(diǎn)擊貢獻(xiàn)率)按照一定的標(biāo)準(zhǔn)量化核算成分?jǐn)?shù),給以“師大好網(wǎng)民”的電子獎(jiǎng)勵(lì),給予團(tuán)學(xué)積分獎(jiǎng)勵(lì)等。

3 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎系統(tǒng)特點(diǎn)

以“互聯(lián)網(wǎng)+”為研究背景,使用自適應(yīng)網(wǎng)頁(yè)、HTML5、移動(dòng)端等主流技術(shù)整合高校信息門(mén)戶,構(gòu)建高校移動(dòng)網(wǎng)絡(luò)文化平臺(tái),提供一鍵移動(dòng)搜索引擎校園、一掌移動(dòng)校園文化體驗(yàn)。其次,項(xiàng)目將充分利用超鏈接技術(shù)、關(guān)鍵詞技術(shù)來(lái)設(shè)計(jì)開(kāi)發(fā)移動(dòng)校園搜索引擎。網(wǎng)絡(luò)育人、維系學(xué)生終身與大學(xué)校園文化這條紐帶、最關(guān)心本科生等情感目標(biāo)的移動(dòng)校園文化,使用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)需要過(guò)程的定義,尤其是在師范院校,如預(yù)測(cè)校園突發(fā)事件的發(fā)生、識(shí)別等。

(2)“一鍵搜索引擎校園,一云多終端”體驗(yàn);整合校園信息門(mén)戶數(shù)據(jù),依托計(jì)算機(jī)領(lǐng)域主流技術(shù)提供一站式搜索引擎校園服務(wù)。一云多終端校園搜索引擎讓校園信息門(mén)戶無(wú)處不在、觸手可及,校園移動(dòng)文化空間和校園門(mén)戶的信息傳播相輔相成,讓信息門(mén)戶和校園移動(dòng)文化空間深度融合、相互共生。

(3)豐富的校園網(wǎng)絡(luò)資源;校園網(wǎng)絡(luò)有豐富的硬件資源、軟件資源,尤其是項(xiàng)目可以依靠云南師范大學(xué)的云計(jì)算平臺(tái),可以利用這樣的軟硬件環(huán)境實(shí)現(xiàn)高性能計(jì)算以及處理高并發(fā)量。同時(shí),由于各種服務(wù)器資源均在校園網(wǎng)內(nèi),校園內(nèi)網(wǎng)不需要依賴Internet,保證了高速的網(wǎng)絡(luò)體驗(yàn)。

(4)集群門(mén)戶的移動(dòng)校園搜索引擎信息服務(wù)模型;模型結(jié)合了主題爬蟲(chóng)技術(shù)、個(gè)性化推薦算法等對(duì)校園網(wǎng)絡(luò)信息門(mén)戶進(jìn)行加工,為校園用戶提供個(gè)性化的信息服務(wù)。

4 關(guān)鍵技術(shù)

移動(dòng)校園搜索引擎系統(tǒng)技術(shù)路線如圖5所示。

圖5 移動(dòng)校園搜索引擎技術(shù)路線

系統(tǒng)涉及學(xué)生、統(tǒng)一信息門(mén)戶、高校信息門(mén)戶群、校園網(wǎng)絡(luò)文化移動(dòng)空間。系統(tǒng)是從零平臺(tái)到構(gòu)建平臺(tái),從無(wú)數(shù)據(jù)源到構(gòu)建數(shù)據(jù)源,從抽象的“最關(guān)心本科生”、移動(dòng)校園網(wǎng)絡(luò)文化、輿情引導(dǎo)等抽象概念到業(yè)務(wù)、邏輯、技術(shù)、融合的實(shí)現(xiàn),從基礎(chǔ)統(tǒng)計(jì)到深度算法挖掘,從門(mén)戶和文化空間的無(wú)關(guān)聯(lián)到相互映襯,從線下文化到線上文化的隱形挖掘再到校園網(wǎng)絡(luò)文化繁榮的過(guò)程。

4.1 前端實(shí)現(xiàn)過(guò)程及技術(shù)

文中主要應(yīng)用了移動(dòng)端Webkit、服務(wù)端數(shù)據(jù)采集存儲(chǔ)、計(jì)算機(jī)網(wǎng)絡(luò)等技術(shù)。移動(dòng)的應(yīng)用程序如瀏覽器、個(gè)性化應(yīng)用主要依靠Webview,Webview的引擎是Webkit,Webkit是蘋(píng)果發(fā)起的一個(gè)開(kāi)源項(xiàng)目,還對(duì)HTML5提供支持。

4.2 Webkit的渲染過(guò)程

HTML在移動(dòng)端表示的過(guò)程是Webkit的網(wǎng)頁(yè)渲染過(guò)程,第一階段是從URL到構(gòu)建完DOM樹(shù),第二階段是DOM樹(shù)到構(gòu)建完Webkit的繪圖上下文,第三個(gè)階段是從繪圖上下文到最終生成的圖像,具體為:將網(wǎng)頁(yè)內(nèi)容,送到HTML解釋器。HTML解釋器在解釋它后形成DOM樹(shù),中間如果遇到JavaScript代碼則交給JavaScript引擎去處理。如果頁(yè)面包含CSS,則交給CSS解釋器去解析。當(dāng)DOM建立的時(shí)候,接受來(lái)自CSS解釋的樣式信息,構(gòu)建一個(gè)新的內(nèi)部繪圖模型。該模型由布局模塊計(jì)算模型內(nèi)部的各個(gè)元素的位置和大小信息,最后由繪圖模塊完成從該模型到圖像的繪制。

在網(wǎng)頁(yè)內(nèi)容的下載中,需要使用到網(wǎng)絡(luò)和存儲(chǔ)。計(jì)算布局和繪圖的時(shí)候,需要使用2D/3D的圖形模塊,同時(shí)因?yàn)橐勺詈蟮目梢暬Y(jié)果,這時(shí)候需要開(kāi)始解碼音頻、視頻和圖片,同其他內(nèi)容一起繪制到最后的圖像中。

4.3 規(guī)則爬蟲(chóng)數(shù)據(jù)采集

(1)設(shè)定規(guī)則:現(xiàn)有桌面網(wǎng)頁(yè)均是很有規(guī)律的頁(yè)面,而且除了具有動(dòng)態(tài)信息外相對(duì)固定,根據(jù)現(xiàn)有桌面網(wǎng)頁(yè)特點(diǎn)設(shè)置網(wǎng)頁(yè)采集規(guī)則,如使用正則表達(dá)式獲取各種標(biāo)簽,超鏈接、標(biāo)題等,往往呈現(xiàn)大類下面具有小類,小類下面才有標(biāo)題,標(biāo)題通過(guò)超鏈接得到網(wǎng)址,每一個(gè)階段都可能需要正則表達(dá)式等的支持,才能獲取到所需要的內(nèi)容;

我一個(gè)很好的同事經(jīng)常和我抱怨類似的事情,他是一個(gè)對(duì)熟悉的人很隨和的人,但是卻很容易與其他專業(yè)的人員發(fā)生矛盾。在一次他在電話中的激烈爭(zhēng)吵后,我問(wèn)其原因,他說(shuō),是由于對(duì)方人員提供的設(shè)計(jì)資料不夠規(guī)范,雖然資料已經(jīng)進(jìn)行多次修改,但是還是沒(méi)有符合要求,于是對(duì)方人員誤以為是我方進(jìn)行故意刁難,所以發(fā)生了激烈的爭(zhēng)吵。

(2)采集數(shù)據(jù):根據(jù)設(shè)定好的規(guī)則采集滿足規(guī)則的數(shù)據(jù);

(3)產(chǎn)生數(shù)據(jù)源:將采集到的數(shù)據(jù)進(jìn)行存儲(chǔ)以便移動(dòng)端數(shù)據(jù)請(qǐng)求需要,或者為了節(jié)省數(shù)據(jù)庫(kù)資源,不再對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)庫(kù)存儲(chǔ),和對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)相比較,直接提供數(shù)據(jù)源可以根據(jù)每一次移動(dòng)端的需求啟動(dòng)采集程序獲取相應(yīng)數(shù)據(jù);

(4)移動(dòng)端請(qǐng)求數(shù)據(jù):移動(dòng)端根據(jù)用戶具體點(diǎn)擊的模塊,向數(shù)據(jù)源獲取所需要的數(shù)據(jù),并對(duì)數(shù)據(jù)使用相應(yīng)空間給以呈現(xiàn);

(5)自適應(yīng)頁(yè)面布局,在保證能夠抓取到信息詳情關(guān)鍵內(nèi)容及其HTML標(biāo)簽的同時(shí),由于捕獲的內(nèi)容中如圖片是適合PC端呈現(xiàn)的,但是在移動(dòng)端還是不能自適應(yīng),在采集到的數(shù)據(jù)里面添加自適應(yīng)標(biāo)識(shí),如使用CSS進(jìn)行圖片的自適應(yīng)代碼。

5 移動(dòng)校園搜索引擎原型系統(tǒng)

隨著終端技術(shù)的不斷發(fā)展,通用自適應(yīng)信息門(mén)戶采集及展示系統(tǒng)可以用于現(xiàn)有的、不具有自適應(yīng)功能的信息門(mén)戶等,為“一云多終端”信息展示提供解決思路。根據(jù)門(mén)戶信息等的特點(diǎn),設(shè)定采集規(guī)則,存儲(chǔ)具有自適應(yīng)多終端元素的門(mén)戶信息,提供數(shù)據(jù)源接口、微信和本地App等的展示,移動(dòng)校園搜索引擎原型系統(tǒng)以云南師范大學(xué)信息管理處門(mén)戶網(wǎng)站為例。移動(dòng)校園搜索引擎原型系統(tǒng)功能包括:

(1)云南師范大學(xué)信息管理處門(mén)戶信息自適應(yīng)采集:根據(jù)門(mén)戶網(wǎng)頁(yè)設(shè)定規(guī)則采集自適應(yīng)的門(mén)戶信息;

(2)云南師范大學(xué)信息管理處門(mén)戶信息存儲(chǔ):設(shè)計(jì)數(shù)據(jù)庫(kù)結(jié)構(gòu)對(duì)采集到的門(mén)戶自適應(yīng)信息進(jìn)行存儲(chǔ);

(3)云南師范大學(xué)信息管理處門(mén)戶信息展示:①基于Android的本地App門(mén)戶展示;②基于微信的門(mén)戶信息展示。

移動(dòng)校園搜索引擎原型系統(tǒng)技術(shù)特點(diǎn):

(1)采用混合開(kāi)發(fā)模式,其中包括基于Android本地應(yīng)用、微信等的移動(dòng)端展示,以及數(shù)據(jù)采集的C/S數(shù)據(jù)源服務(wù)端;

(2)具有“一云多終端”特點(diǎn)。基于服務(wù)端采集的一個(gè)自適應(yīng)數(shù)據(jù)源可以為主流平臺(tái)Android、微信等提供數(shù)據(jù)準(zhǔn)備,避免了普通網(wǎng)頁(yè)在移動(dòng)端呈現(xiàn)混亂的情形;

(3)通用性。系統(tǒng)具有普適性,其他具體應(yīng)用可以更改采集規(guī)則、數(shù)據(jù)表結(jié)構(gòu)等進(jìn)行套用。

編程語(yǔ)言及其版本號(hào):Java7、Android 4.0、Mysql 5.6.24、Php 5.3.29。

5.1 網(wǎng)站采集界面

界面在運(yùn)行過(guò)程中,以Loading作為提示,同時(shí),日志窗口抓取運(yùn)行產(chǎn)生的結(jié)果,客戶端啟動(dòng)后,每隔設(shè)定好的時(shí)間間隔重復(fù)運(yùn)行過(guò)程。采集運(yùn)行界面如圖6所示,下一次運(yùn)行開(kāi)始時(shí)的采集完成或間隔界面如圖7所示。

圖6 采集運(yùn)行界面

圖7 采集完成或間隔界面

5.2 Android端、微信端效果圖

基于Android的移動(dòng)端呈現(xiàn)網(wǎng)站導(dǎo)航欄目標(biāo)題信息主界面、基于Android的移動(dòng)端對(duì)某條消息詳情呈現(xiàn)界面效果良好。微信端訪問(wèn)接口界面、門(mén)戶主目錄、詳情界面、目錄下內(nèi)容標(biāo)題列表界面如圖8和圖9所示。

圖8 門(mén)戶目錄

圖9 目錄下內(nèi)容標(biāo)題列表

6 結(jié)束語(yǔ)

系統(tǒng)采用自適應(yīng)網(wǎng)頁(yè)設(shè)計(jì)、HTML5、移動(dòng)端(Android、IOS等)、第三方如微信等主流應(yīng)用或技術(shù),以云南師范大學(xué)校園網(wǎng)絡(luò)信息門(mén)戶為對(duì)象,使用自行設(shè)計(jì)的規(guī)則爬蟲(chóng),基于高性能、多并發(fā)的云計(jì)算平臺(tái)提供應(yīng)用服務(wù)和存儲(chǔ)服務(wù)支持, 獲取到的數(shù)據(jù)為挖掘構(gòu)建移動(dòng)校園文化的計(jì)算機(jī)實(shí)現(xiàn)提供保障,而且項(xiàng)目系統(tǒng)模型構(gòu)建與設(shè)計(jì)在前期工作中已經(jīng)通過(guò)幾個(gè)門(mén)戶測(cè)試證明可行。同時(shí),移動(dòng)校園文化與現(xiàn)有信息平臺(tái)高度融合并服務(wù)于輿情監(jiān)測(cè)與控制、網(wǎng)絡(luò)行為預(yù)測(cè)具有相關(guān)理論支撐。做好上線運(yùn)維工作,并在此過(guò)程中繼續(xù)挖掘構(gòu)建移動(dòng)校園網(wǎng)絡(luò)文化的業(yè)務(wù),對(duì)平臺(tái)進(jìn)行網(wǎng)絡(luò)推廣,為進(jìn)一步豐富移動(dòng)校園文化奠定基礎(chǔ)。研讀個(gè)性化推薦算法,獲取適合移動(dòng)校園搜索引擎?zhèn)€性化信息服務(wù),利用實(shí)驗(yàn)法選擇預(yù)先設(shè)定的主題爬取門(mén)戶資源,實(shí)現(xiàn)個(gè)性化相關(guān)模型如用戶模型等,挖掘用戶偏好,接受統(tǒng)一資源的集中個(gè)性化服務(wù)。實(shí)際對(duì)接校園網(wǎng)絡(luò)門(mén)戶信息資源數(shù)據(jù),實(shí)測(cè)原型系統(tǒng)的信息資源爬取以及個(gè)性化信息服務(wù)是下一步的研究方向。

猜你喜歡
搜索引擎校園信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
開(kāi)心校園
展會(huì)信息
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
爆笑校園
廣告主與搜索引擎的雙向博弈分析
搜索,也要“深搜熟濾”
主站蜘蛛池模板: 国产白浆一区二区三区视频在线| 2021精品国产自在现线看| 日本色综合网| 国产精品成人免费视频99| 狠狠亚洲五月天| 欧美第一页在线| 亚洲人成电影在线播放| 免费AV在线播放观看18禁强制| 日韩欧美在线观看| 五月婷婷导航| 97久久精品人人| 国内精品91| 在线观看无码av五月花| jizz在线观看| 美女啪啪无遮挡| 不卡无码网| 国产91精品久久| 亚洲自拍另类| 亚洲欧美成人综合| 欧美黄网站免费观看| 亚洲视频欧美不卡| 久久亚洲国产一区二区| 黄色在线不卡| 国产一区二区色淫影院| 成人日韩欧美| 日韩高清在线观看不卡一区二区 | 国产性爱网站| 亚洲黄色网站视频| 美女无遮挡免费网站| 日韩第九页| 日韩免费无码人妻系列| 亚洲人成影院午夜网站| 97久久超碰极品视觉盛宴| 日本国产在线| 欧美精品一二三区| 精品福利一区二区免费视频| 久久情精品国产品免费| 亚洲视频在线青青| 色哟哟精品无码网站在线播放视频| 久久99这里精品8国产| 亚洲天堂久久新| 在线观看无码a∨| 日韩 欧美 小说 综合网 另类| 国产成人麻豆精品| 美女无遮挡免费视频网站| 国产区在线观看视频| 久久香蕉国产线看精品| 国产精品理论片| 亚洲精品欧美日本中文字幕| 亚洲色图欧美激情| 国产精品美人久久久久久AV| 色国产视频| 一级毛片在线播放免费| 午夜国产不卡在线观看视频| 亚洲色成人www在线观看| 亚洲av成人无码网站在线观看| 人妻一区二区三区无码精品一区| 国产乱肥老妇精品视频| 亚洲综合九九| 亚洲av无码牛牛影视在线二区| 老司机久久精品视频| 中文字幕无码电影| 欧洲高清无码在线| 日韩欧美国产三级| 免费一级毛片完整版在线看| 国产91成人| 一本综合久久| 成年午夜精品久久精品| 91视频精品| 国产成人高清在线精品| 精品免费在线视频| 亚洲AV无码一区二区三区牲色| 亚洲视频a| 精品久久久久久中文字幕女| 在线欧美一区| 免费在线播放毛片| 成年A级毛片| 在线国产欧美| 国产一区二区精品高清在线观看| 久久6免费视频| 色老头综合网| 美女无遮挡免费视频网站|