劉 暢
對社交網絡的初步分析與探討
劉 暢
(哈爾濱工業大學,哈爾濱150001)
隨著Web2.0時代的到來,互聯網公司的競爭也越來越激烈,然而各個社交類網絡公司卻都能保持著相對的優勢,原因是什么?基于此,通過對社交網絡的起源發展以及特征分析,旨在讓讀者更加了解社交網絡,并從技術實現角度對中國社交網絡的領軍公司——新浪微博進行簡要分析并指出社交網絡的發展前景。
社交網絡服務;計算機網絡;微博
21世紀,隨著信息產業的飛速發展,互聯網早已經進入到千家萬戶。近幾年,在互聯網領域又誕生了一種新的交互形式——社交網絡。社交網絡這一詞源自英語中的Social Network Service,亦稱社會網絡服務,它主要基于哈佛大學社會心理學家米格蘭姆所提出的“六度理論”,即:最多通過六個人就能夠與世界上任何一個陌生人認識。這個理論奠定了社交網絡飛速發展的基礎。它將人們日常的社交行為以互聯網作為媒介進行呈現。與傳統社交相比,其主要優勢在于:實時性,開放性以及可拓展性。本文旨在通過當下中國最成功的社交網絡——新浪微博作為實例進行分析,指出社交網絡在互聯網領域可鑒的成功之處,以及社交網絡的未來發展方向。
1971年內容為“QWERTYUIOP”的第一封電子郵件的發出,開啟了網絡對話的新紀元。1978年,通過電話線與用戶進行數據交換的BBS(公告板系統)誕生了,開啟了互聯網迅速發展的三十年。BBS將網絡會話的模式進行了升級,從之前e-mail的點對點模式發展到了點對面模式,隨后出現的即時通信(Instant Messenger)和博客(Blog)機制更是提高了及時傳送、并行處理能力。1998年,騰訊公司將即時通訊引入中國,掀起了我國的網絡通訊的熱潮。2004年2月4日,Facebook上線,引入了全新的社交理念,每個用戶都以自己作為中心,而所有用戶又構成了整個關系網。從2006年9月到2007年9月,Facebook在全美網站中的排名由第60名上升至第7名。隨著2006年Twitter的上線,社交網絡體系已經大體形成。在中國,人人網以及新浪微博則是當代社交網絡的代表。人人網源自Facebook模式,而新浪微博則來自Twitter模式。時至今日,新浪微博占據著中國用戶總量的57%,以及中國微博活動總量的87%,是中國訪問量最大的社交網站之一,已超過3億注冊用戶。
新浪微博由新浪公司在2009年7月推出,據中國互聯網微博與社區調查研究報告顯示,在門戶網站的微博產品中,新浪微博在知名度、使用率等十項指標上全面領先。新浪微博模式的成功之處就在于,從每個用戶的角度出發,其所看到的網絡世界都是以自己為中心,如微博的評論、轉發、關注等,而該用戶又構成了其他用戶微博交際圈的一員,這樣,所有的用戶構成了以自己為中心的廣大社交網。這種模式使得每個用戶都有足夠的來自于自己社交圈的滿足感,同時,由于轉發微博這種機制的存在,使得通過新浪微博的信息傳播速度遠快于傳統的信息傳播速度,實現了高時效性、高擴展性。另一方面,新浪微博在社會時事方面也起到了很重要的影響作用。基于3億注冊用戶,新浪微博每天都會根據用戶轉發評論數的高低排次選出當日、當周的熱門時事話題,所有用戶都可以參與到該話題的討論之中。由于強大的輿論導向與壓力,至今新浪微博在很多時事上都起到了至關重要的作用,同時新浪還推出了微群機制,用戶以志趣結緣,溝通交流,實現著跨躍時空的體驗。
那么,新浪微博是如何實現上述功能,高效而穩定的運行呢?下面就新浪微博各種特性進行逆向分析:
(一)吞吐率
新浪微博用戶的大規模并發請求、超大數據流量及保證客戶端性能穩定高效(延遲低,實時性高),對服務器端的處理能力(I/O吞吐量)提出了很苛刻的要求。新浪微博是如何實現這一要求的呢?它采用的是一種活躍度機制,即當一用戶發出微博時,并不是將這條微博推給所有的粉絲,而是對于標記為“活躍”的用戶推出,對于其他非活躍用戶可延遲推送。這樣就削弱了海量信息。另外就是分層技術,對于服務的分層,新浪微博將其分為基礎服務、平臺服務和應用服務三個層次,每個層次相互分開,實現模塊隔離,這樣既使頂層應用服務訪問量過大,平臺服務和基礎服務也不會受到影響。其具體的實現技術手段有:基于MySQL的分布式數據庫設計、異步消息隊列處理機制、Cache冷熱分層技術、推拉模式和時間分區拉模式。
(二)可靠性
SNS平臺需要提供7×24×365的服務,當服務器出現問題時,不會導致整個系統陷入崩潰而停止服務,即“永不宕機的服務器”。新浪微博采用MySQL集群技術,它是一種在無共享架構系統里應用內存數據庫集群的技術,是一種分布式設計,要求其內部的各個組成部分擁有自己的內存和外存。其目標在于達到沒有任何單點故障點的要求。其主要優點在于:多個節點之間可以分布在不同的地理位置,因此也是一個實現分布式數據庫的方案;擴展性很好,增加節點即可實現數據庫集群的擴展;冗余性很好,多個節點上都有完整的數據庫數據,因此任何一個節點宕機都不會造成服務中斷,整個系統不會受到影響。
(三)伸縮性
由于SNS平臺的用戶數量可能發生較大幅度的波動,為實現這種資源波動付出的成本要低、效率要高。這就要求服務器端的各類資源數量也隨之波動,新浪微博采用基于Key-value(鍵值數據庫)的支持分布式數據庫系統的Cassandra,它是有很多個數據節點構成的分布式網絡服務,對該數據庫進行寫操作的時候,其操作會復制到所有節點上去,對該數據庫的讀操作也會由其他節點上面去讀取,所以由于其用戶數量的變動而引起的服務器數據庫端的變動只是影響對于節點的操作而已,對整個數據庫整體沒有多大影響。基于Key-value的NoSQL分布式數據庫是針對互聯網web2.0的發展應運而生的,對新浪微博這種海量數據存儲讀寫問題的針對性很強,很好地解決了Scalability的高要求,這些特點都是傳統的RDBMS所不具備的,最顯著的特點就是,當數據量極大的時候,Mysql這樣的數據庫性能會變得很低,具有很好的伸縮性。
社交網絡擁有著廣大的用戶基礎及良好的用戶反響,其發展前景應該是十分樂觀的。那么社交網絡在保持原有的優勢之上,其還可以從哪些方面進行擴展呢?首先,各社交網絡公司需要考慮網絡條件不是十分理想地區的用戶體驗,因此需要對原有的系統進行“瘦身”,即精簡功能,保證對用戶操作的快速響應。在這方面,SNS的領軍人物Facebook已經采取了相應的措施,已經在美國和印度推出了簡化版的網站Facebook Lite。相對于標準版的網站,簡化版網站更干凈、更美觀,響應速度也更快。其次,鑒于當前便攜設備的智能化以及操作系統平臺的多元化,社交網絡公司需要考慮將其服務推廣到多種操作系統與終端,以擴大用戶的使用范圍。最后,社交網絡公司需要緊跟時代潮流,虛心吸取其他領域公司的優點與長處,爭取做到在保持原有業務風格的基礎上,將公司業務做到多元化發展,這樣在競爭越來越激烈的Web2.0時代才能保證長盛不衰。
Primary Analysis and Discussion of Social Network Service
LIU Chang
(Harbin Institute of Technology,Harbin 150001,China)
With the arrival of the Web2.0 era,the competition among the Internet companies is becoming more and more intense.However,among all those competitors,companies which are engaged in social network service(SNS)can always maintain a relatively advantage over others.This paper aims at enlightening the readers with the general idea of SNSby introducing the basic development and characteristics of social network service.Besides,a specific example of Sina Microblog,a leading company of SNSin china,is used to illustrate the technical realization of SNS.At the end of this paper,the development prospect of social network service is given.
social network service;computer network;microblog
G206.2
A
1001-7836(2012)08-0199-02
10.3969/j.issn.1001 -7836.2012.08.077
2012-06-18
劉暢(1991-),男,黑龍江哈爾濱人,學生,從事計算機基礎及網絡研究。