文|張建生 韓笑 陳嘉 譚承歡
伴隨GPS和無線上網技術的發展,LBS的出現讓互聯網再一次進化。LBS通過一組定位技術獲得移動終端的位置信息(如經緯度數據),提供給移動用戶本人或他人以及通信系統, 實現各種與位置相關的業務。在LBS 系統中,云計算技術能夠解決巨大計算任務的問題,發揮出位置服務及時響應的重要特色,從而大大提高LBS 系統的效率, 節約計算和存儲資源,為LBS 業務發展提供技術平臺支持。
新聞采集是新聞“采、編、發”流程的第一環節,結合新聞稿件采集系統,“軟負載均衡功能”能夠實現一種在新聞采集中通過云計算提供LBS服務的實現模式,化“云”為“雨”,保障新聞信息在生產環節有效穩定流通。
新華社新聞采集系統為記者提供智能客戶端發稿、通用瀏覽器發稿、手機發稿等多終端采集手段,支持文字、圖片、音頻、視頻等多媒體類型稿件的采集傳稿功能。系統提供了能滿足不同通信條件所需要的發稿方式,支持各種帶寬的線路,記者可以通過ADSL、3G上網卡、電話撥號、海事衛星等通信手段向總社和國內外編輯部傳稿。隨著海外輿論陣地建設的加強,分社規模、發稿量和產品類型都有大幅的增加,采集系統數據量和所需處理能力也需要大幅度提高。
由于大量記者使用因特網發稿,因特網的網絡聯通性以及其速度就成了影響記者發稿效率的重要因素。國外分社的記者通過因特網訪問位于總社的服務器,網絡傳輸效率較低。由于國際間的網絡互聯問題,跨國訪問對方的外網服務器的效率較低,且經常會遇到特殊的海底光纜阻斷問題,導致部分分社完全無法使用互聯網進行發稿,嚴重影響分社的發稿效率。另外,由于地域間經濟發展不平衡,造成IP地址的分發與利用率不均衡,網絡流量不均衡,國際間網絡出口有限,而國際間互聯網訪問的用戶量巨大,造成網絡傳輸速度有限、效率低下。
應對上述問題,大多數的跨國公司以及大型網站都在全球多個地區設立多數據中心或多個網站鏡像服務器用于解決此類問題。借鑒這些機構的做法,我們可以在全球因特網的多個骨干節點部署新聞采集的稿件接收和中轉服務器,提高稿件在國家之間的互聯網傳輸效率問題。
在海外建設采集服務的實踐過程中,我們分別在歐洲、北美、亞太、亞歐地區架設了采集收稿服務器,解決當地及周邊分社記者通過互聯網發稿的問題。在分社部署采集外網服務器內網用戶可通過寬帶專線訪問總社采集內網接收服務器進行發稿,這樣有利于綜合使用現有資源,減少投資浪費。
未來的設想是通過分布于全球各地的服務器集群建立強大的“采集云”,實現可在各種“端設備”上運行的發稿軟件,按照云計算思路及“云端并重”的理念,持續創新與強化新聞采集云平臺,創造更多延伸應用終端融入采集環節,提高采集系統
新一輪IT革命浪潮中風起“云”涌,云計算通過互聯網或其他網絡統一靈活地調用云內各種信息技術資源,實現運算資源的隨時獲取,按需使用,隨時擴展,從而提供了高性能信息服務的實現方式。的服務能力,使新聞采集更快捷、靈活、穩定、安全。
隨著海外用戶數量的擴大,為提高發稿時效新建了一些海外節點。由于一些用戶使用習慣難以改變,一些海外分社反映發稿速度不夠理想,新建海外節點不能迅速發揮效益。這些問題可以歸結為,操作者不知道如何去使用最佳的發稿服務器,甚至沒有時間去了解哪個服務器是最快速的,而記者可以籠統歸結為“發稿慢”問題。一個比較常見的現象是,身在柏林的記者使用了默認為“總社”的服務器進行登錄發送視頻稿件,由于國際間的網絡互聯問題,跨國訪問跨洋過海的外網服務器,勢必出現發稿速度慢,發稿效率低。
如何幫助用戶在多節點服務器中選擇最近的“一朵云”,成為的新聞采集系統在新技術下改進完善的首要問題。如圖1所示。
在采集系統中提供LBS服務,相當于實現一種“軟負載均衡”方式。
該功能涉及多個模塊:IP獲取(本地方式、聯網方式)、IP地址解析出地區、所在地區映射和最佳服務器選擇。算法流程如圖2所示。

圖1 采集云構想

圖2 算法流程
該位置服務的巨大魅力在于在正確的地點把正確的服務器推薦給用戶,在用戶使用系統時,根據用戶IP自動判定用戶所在地區,根據地區不同而推薦用戶訪問最優的服務器,提高了系統選擇網絡的靈活性和可用性,從而進一步提高發稿效率。

圖3 在北京本地訪問eNews巴黎服務器(左:網頁方式,右:客戶端方式)
實現算法并不太復雜,而算法的好處在于自動化和免打擾。在瀏覽器環境下,首頁即可自動識別自動推薦,在客戶端發稿模式中,自動代為選擇最佳服務器,不管用哪種方式,操作不會比以前多。同時,通過設計減少對網絡的過度依賴,一旦出現算法考慮不到或者配置文件有缺陷的時候,“采集云”不能返回正確結果,系統將按照傳統方式探測現有服務器節點,保證返回結果的正確性,不會由于引入新的算法而影響記者發稿。
系統前端B/S、C/S兩種發稿模式,使用同一個DAT數據文件解析IP信息,按照同一個XML數據文件解析最佳服務器。前端提供兩種使用模式,JSP網頁及C#客戶端,雖然程序語言不同,但是算法一致,統一通過HTTP請求與后端進行交互獲取真實IP,根據真實IP獲取地區信息,解析同一種格式的地址庫獲得地區名稱,再通過同一個配置文件,根據地區定位均衡服務器。相同的數據文件和訪問方式,使兩種使用模式的返回結果保持一致。由于在設計階段就考慮了維護的工作,配合系統日志的監控分析,使后期系統維護和配置更新更加簡單易行。
該功能已成功應用于新華社全球部署的多套eNews采集系統,優化后的系統能夠按預期設想一樣根據用戶所在地區自主選擇所在區域服務器。當用戶訪問非本地區節點服務器時,將會看到建議更換訪問節點的提示信息,效果如圖3所示。
為用戶推薦合適的發稿服務器帶來的效果顯著,特別是在海外發送視頻稿件的情況,其發稿速度的提升明顯。通過測試,在歐洲總分社傳輸大小為140M的視頻文件,如果手動選擇登錄北京節點服務器,傳輸時間為76分39秒,而通過自動IP自動定位到巴黎節點的發稿服務器,稿件的傳輸時間僅為212秒。
同時,根據日志分析結果表明,自動均衡功能每天可以產生上百次的提醒,為這些訪問者提供了更高效的發稿服務器選擇。
LBS應用日益廣泛,其在傳媒業的應用還有很大挖掘空間,本文提到的“軟負載均衡功能”,相比于傳統新聞采集系統,更加貼近用戶潛在需求,為系統更好的升級到下一代技術體系打下了扎實的基礎。而云計算與LBS的結合能夠大大提高LBS的效率,而將二者應用于傳媒業,使新技術新創意與新聞傳統業務結合,力求給用戶更好的發稿體驗,讓用戶更愜意的漫步云端。