999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社交挖掘:誰是下一個Google

2012-12-31 00:00:00王冀
創業家 2012年11期

Pagerank是Google排名運算法則(排名公式)的一部分,是Google用來標識網頁的等級/重要性的一種方法,也是Google衡量一個網站好壞的唯一標準。在糅合了諸如Title標識和Keywords標識等所有其他因素之后,Google通過pagerank來調整結果,使那些更具“等級/重要性”的網頁在搜索結果中的排名獲得提升,從而提高搜索結果的相關性和質量。

見到袁雨來的時候,他正在和團隊完善產品。他們總共十幾個人,在中關村租了一套Loft結構的公寓,專心開發基于社交網絡的應用。

從表面看,他們和其他互聯網團隊無異,但在袁雨來眼里,他們做的事情門檻很高:通過社交網絡,利用高效的算法獲知用戶的喜好,從而為其薦歌。形象地說,他們知道你喜歡聽什么樣的歌曲,也知道你喜歡的歌曲在哪里,然后基于社交關系把音樂推薦給你。

走出象牙塔

袁雨來的產品叫音貝網,新版在8月24日上線后已經有了20萬用戶。音貝不判斷歌曲的舒緩、搖滾等屬性,而是根據一些原則為歌曲編織一個網絡——在用戶關系網和歌曲組織網之間相互映射,最終圈定用戶喜歡的歌曲。

要實現這個目的,就需要過硬的算法。在這方面,音貝具有自己的優勢,袁雨來兩年前畢業于清華大學,獲有高性能計算博士學位。他的團隊中有4個人研究算法,其中包括一個他在清華的同學。

面對《創業家》,袁雨來更愿意用“社交數據挖掘”來形容自己的項目,這是一個專業性極強的工作。國內一些高校在對此進行研究,因此很多團隊都和他們的母校有著天然的聯系。

以清華大學為例,計算機科學與技術系的唐杰和陳文光教授都是社交網絡的研究者,袁雨來正是畢業于這個系。此外,在電子科技大學計算機學院,29歲的博導周濤也是這方面的專家,這位本科就開始“帶”博士生的牛人精于數據算法,同時也是電商營銷公司百分點的首席科學家。周濤的學生黃宇于去年創辦了“唯朋友”,這是一個基于微博,促進你和好友之間的互動,以加深社交關系的數據挖掘項目。

此外,北大、北航、上海交大、哈工大都有師生研究社交網絡,他們為國內的社交數據挖掘提供了學術支持和項目儲備。但另一方面,這也促成了這個群體的小眾特征,畢竟一個復雜的算法不是隨便哪個人都能做的。

某種程度上,這些項目還帶有實驗性質。比如哈工大博士于霄創辦的知微,就脫胎于哈工大的社會網絡與數據挖掘聯合實驗室。清華大學計算機副主任陳文光教授帶了一個項目,叫社會化網絡分析平臺,他們和海銀資本共同搭建了一個數據池,陳教授的研究成果可以直接為海銀資本孵化的項目調用。

“社交網絡在全世界都是個新興科學,社交網絡這個詞都沒幾年的歷史”,海銀資本創始合伙人王煜全近幾年一直在研究社交網絡,堅信這是互聯網的發展趨勢。他認為,互聯網自誕生那天起就是一個社交網絡,只不過是基于物理性質的連接,Google的pagerank本質上就是個社會化算法,只不過是用這個社會化算法處理文本和網頁,用社會化算法去處理人和人背后的信息,原理其實都是一樣的。

樂薦網絡創始人戴虎寧建了一個專門討論社交數據挖掘的QQ群,里面大約有300人,基本囊括了中國研究社交數據的高手,里面好多人沒有創業,好多還是學生。“出來創業的估計30支團隊到頭兒了”,王煜全說,“我覺得他們是未來的比爾.蓋茨,具體是誰我不知道,但一定在這堆人里。”

新的顛覆者?

Twitter、Facebook、Foursquare等的出現,真正把人們帶入了社交網絡時代。“社交網絡在科技上有巨大的提升空間,比如對一個人的精確分析,沒有社交網絡就永遠達不到那種精度。”王煜全說這句話的背景是:數據挖掘早已有之,但社交網絡的數據挖掘還是個新課題。

隨著用戶的瘋狂增長,社交網絡產生的數據量是驚人的。每過一分鐘,Flicker上會有3125張照片上傳,Facebook上新發布70萬條信息,YouTube上則有200萬次點擊觀賞。圖片、聲音、文字以及背后的用戶習慣和軌跡構成了互聯網上的數據資源,社交網絡與大數據是天生的親密伙伴。

這些數據價值密度不高,要挖掘出有用的那部分是個力氣活。以Zynga為例,這是一家寄生在Facebook上的社交游戲公司,它的游戲強調好友之間的合作。為了黏住用戶,Zynga每天大約要收集600億個數據點,包括人們一般玩多久游戲,什么時候玩,喜歡購買什么游戲物品等。從某種意義上說,Zynga可能比你自己還清楚地知道你的潛意識決策。

在清華大學陳文光教授看來,社交網絡是下一代應用層面的互聯網。“第一代是雅虎、新聞門戶等,第二代是搜索引擎,第三代就是社交網絡,它不僅是連接信息,更是連接人,會和社會學、心理學、經濟學有很多交互的地方,從研究的角度來講是非常有意思的事兒。”

今年上半年,美國曼徹斯特大學的研究團隊做了一個實驗,他們通過分析Twitter上的數據,提前8天預報了流感的爆發。在一個月內,研究小組收集了440萬個Twitter留言的地理定位數據標簽,使用一種特殊的算法進行處理(類似語義分析),從而預測不同地區的流感發病率。

這似乎印證了《爆發》一書作者、全球復雜網絡研究權威巴拉巴西教授的觀點。他基于社會化大數據基礎,認為人類行為有93%是可以預測的。如果確實如此,那么社交網絡中無疑蘊藏著巨大的商業價值。

在 《創業家》采訪的團隊中,新影數訊(iFilm+)擅長預測。他們通過對微博和過往資料數據的分析來預測電影票房,同時給影片提供營銷建議。創始人劉晗透露,其票房預測準確度可達85%。他們的做法是首先確定影響票房的變量,如演員、檔期、上映時間、首映地等,一些看似與數字無關的事項都被按規則加以量化;然后,他們從統計年鑒中查到了1990年以來上映的四五百部電影數據,讓計算機逆向推導出定量,從而確定公式。預測時把社交網絡中反映出的演員熱度、電影關注度以及預定的上映時間等變量填入公式,進行測算。

真實的算法遠比上面的描述更復雜。劉晗演示時,筆記本屏幕上密密麻麻布滿了數學符號,但電腦要精確計算出人類的行為,仍需繼續探索。“預測準確度提升1%,都需要做大量復雜的工作,必須找到并引入新的變量才行。”劉晗說。

劉晗所面臨的挑戰,是社交數據挖掘者們共同的問題,即便在美國,算法也沒有完全突破,這為中國的創業者們提供了機遇。王煜全把中國偏后期的投資比喻為“拼爹”,以前的互聯網投資是“拼經驗”,前一段流行“拼干爹”,就是大VC靠砸錢來砸市場,到了社交網絡時代就要“拼技術”,因為互聯網的核心本質就是技術,而有算法支持的社交網絡產品是無法抄襲的,即便把國外的算法搬到國內也會水土不服。“在社交網絡上,中國不會落后美國太久了,中國肯定會迎頭趕上。”

王煜全認為,未來只有一個叫社交網絡的互聯網,真正的社交網絡,其實就是人際關系網,凡是沒疊加社交關系的1.0式的網站,理論上都會被顛覆。他的理由有三點:第一,沒有社交關系就沒有個性化,就不知道用戶行為會怎么變化;第二,傳統網站需要內容提供者,而在社交網絡的UGC時代,通過互動激發內容,根本不需要有內容提供者;第三,社交是人類最本質的生存需求,社交能力的高低很大程度上決定人成功與否。目前Facebook的平均好友數是130人,未來隨著算法的演進,人類的社交能力將出現質的飛躍。

賭未來

中國目前最具影響力的社交網絡是新浪微博。自2009年上線以來,它已經成為聚攏了3.68億用戶的開放平臺。在《創業家》6月推出的《開放平臺TOP10》評選中,新浪微博被開發者們評為“最具開放度”的平臺。不同層次的API接口可以調用新浪微博的內部數據,為開發應用提供便利。

《創業家》見到的社交網絡應用團隊,大多數都接入了新浪微博,但他們仍然抱怨新浪的開放度不夠高。黃宇在開發“唯朋友”的過程中,需要大量調用新浪微博的API,但一些重要數據無法訪問,比如用戶的私信,這顯然涉及隱私問題。此外,新浪對一些API的訪問頻率也做了限制。因此,一些團隊也在打算接入騰訊微博,因為騰訊可以把私信都開放。此外,他們也密切關注移動端,一些業務也可以移植到微信上。而無論微博還是微信,都不過是底層的社會平臺,他們要在此之上疊加應用,最終超越原先依附的平臺。

但挖掘者們的技術還不足以處理大數據。“好有美食”是一個10月中旬剛上線的APP,基于好友關系來給你推薦餐廳和美食。它目前能抓取新浪微博的原創和轉發內容,而沒有抓取評論,其中的一個原因就是“數據量太大”。新影數訊的劉晗也強調,他們做的是數據挖掘,而不是大數據處理。“大數據的計算量非常大,一天的數據量就會上T,一般人處理不了,我們要的有價值的數據也就是幾十G。”

陳文光教授估算了新浪微博的數據量級。“不包括圖片和評論,大約是在幾十T到幾百T,如果只拷貝所有的社交關系,那還不到一個T。一臺256G內存的機器,就能把一兩億用戶的關系數據放在內存里,處理起來就快很多。光分析社交關系的數據,就可以做很多工作了。”

他還分析了小團隊的創業成本。“租一個100M的帶寬和IDC機位每年大約要10萬塊,買一臺有4個CPU和256G內存的服務器也要10萬塊,再加上人力、房租,以及寫軟件和用虛擬主機、云平臺等成本,最少有100萬投入才能干這件事。”

這些團隊必須節衣縮食的另一個理由是:社交網絡應用仍然沒有成熟的商業模式,即便VC對社交網絡也沒有特別強的信心。知微創始人于霄對《創業家》表示,“2C(針對個人用戶)的商業模式需要有相當量的用戶留存和頻繁的使用,而現有的產品還剛剛面世,想建立起用戶黏性、吸引大量的客戶還是蠻難的。2B(針對企業用戶)的商業模式則更偏向營銷,可能只維護十個客戶都會做的非常強大,但垂直領域的數據量還沒那么多,最早期的時候沒有太多素材可用。”

新影數訊是我們遇到的唯一有收入的團隊,但全年營收最多也就兩百萬元,還沒打平。劉晗更看重積累數據,對他來說,數據是比現金更值錢的資產,如果能建立起一個中國最全的電影數據庫,賺錢就是水到渠成的事。

海銀資本孵化的社交網絡應用團隊有16個,到年底估計能達到30個,它們抱團取暖。海銀和清華大學合作,后者研究社交網絡的數據池可供這些團隊使用,大多數固定的社交關系可以直接從中調用。在中關村云計算基地,王煜全的好友田溯寧以低于市價一半的價格提供了600平方米的場地,一些團隊不久后就將搬去那里。這些團隊彼此之間也有大量的溝通與協作,比如分工調用新浪微博不同的API以提升效率。此外,在營銷上這些團隊也會彼此借力。

海銀在這些項目上介入很深,王煜全親自和團隊討論確定產品方向。他告訴這些年輕人,一旦大目標確立,至少要堅持三到五年。他坦承,這些業務五年不見得賺一分錢,但是五年之后也許是個Google。他用蘋果公司曾經的廣告語來鼓勵他們:只有那些瘋狂到認為自己可以改變世界的人,才能真正改變世界。

主站蜘蛛池模板: 欧美曰批视频免费播放免费| 婷婷久久综合九色综合88| 国产亚洲高清在线精品99| 午夜性爽视频男人的天堂| 老司机久久99久久精品播放| 国产高清色视频免费看的网址| 成人无码一区二区三区视频在线观看| 精品久久高清| 视频国产精品丝袜第一页| 性色一区| 四虎影视无码永久免费观看| 伊人色天堂| 国产美女免费网站| 亚洲美女一级毛片| 国产精品成人免费视频99| 色综合天天操| 久久窝窝国产精品午夜看片| 美女潮喷出白浆在线观看视频| 毛片网站观看| 97se综合| A级毛片高清免费视频就| 国产成人亚洲毛片| 无码av免费不卡在线观看| 在线国产三级| 精品撒尿视频一区二区三区| 欧美激情第一欧美在线| 欧美日韩精品在线播放| 久久人妻系列无码一区| 精品一区二区三区自慰喷水| 国产精品亚洲一区二区在线观看| 亚洲国模精品一区| 国产尤物视频在线| 国产成人久视频免费| 成年人国产网站| 亚洲午夜片| 久久亚洲AⅤ无码精品午夜麻豆| 国产精品3p视频| 久久亚洲天堂| 亚洲精品视频在线观看视频| 伊人国产无码高清视频| 中文字幕在线观| 精品免费在线视频| 中文字幕2区| 亚洲精品第一在线观看视频| 亚洲福利一区二区三区| 亚洲伊人久久精品影院| 嫩草在线视频| 99性视频| 国产在线精品网址你懂的| 欲色天天综合网| 欧美黑人欧美精品刺激| 国产又大又粗又猛又爽的视频| 亚洲娇小与黑人巨大交| 2018日日摸夜夜添狠狠躁| 欧美在线精品怡红院| 色135综合网| 国产情精品嫩草影院88av| 国产白浆在线| 亚洲精品欧美日本中文字幕| 无码人妻热线精品视频| 久久天天躁狠狠躁夜夜躁| 国产真实二区一区在线亚洲| 久久久噜噜噜| 黄片一区二区三区| 国产又爽又黄无遮挡免费观看| 性欧美精品xxxx| 欧美三级日韩三级| 黄色在线不卡| 亚洲综合激情另类专区| 女人毛片a级大学毛片免费| 在线一级毛片| 国产在线精品美女观看| 亚洲妓女综合网995久久| 亚洲性日韩精品一区二区| 99久久国产综合精品2023| 国产免费精彩视频| 国产精品第三页在线看| 国产在线麻豆波多野结衣| 国产精品熟女亚洲AV麻豆| 欧洲av毛片| 成人午夜亚洲影视在线观看| 国产性生交xxxxx免费|