趙艷秋+王眾

這家納斯達克上市的新公司,長遠目標是做“中國的Oracle”,提供“新時代的商業智能”。
9月,國雙科技成功登陸納斯達克,成為中國首家赴美上市的大數據分析軟件企業。
如果讓國雙科技CEO祁國晟說出對自己影響很深的一家企業,這位自信而有雄心的80后可能會說“非微軟莫屬”。他從這家國際大企業找到了人生偶像,獲得了技術和管理的啟發,也確立了公司的目標——做一個掌握核心技術的B2B企業。
軟件創客
祁國晟在小學一二年級時,就注意到了電腦。到了中學,他不僅學會了編程,做了網站,甚至還有了做軟件企業的夢想。他的偶像是比爾·蓋茨。
不過,從他對計算機產生興趣到后來保送進清華讀軟件這段時期,中國軟件產業“正在走下坡路”。由“中國第一程序員”求伯君開發的傳奇程序WPS,從占領國內市場80%到最終幾乎一夜之間被微軟翻轉。祁國晟看到,中國軟件行業“慢慢沒有了自主的東西”。
在祁國晟進入大學的第二年,他在校園內成立了“軟件產業研究學會”,希望通過調研來解決一直困擾自己的一個問題——為什么“中國沒有軟件產業”?他認為自己有責任去研究行業,而不僅僅是學習編程技術。
在與國內各大行業協會合作的過程中,他發現,國內軟件企業絕大多數更像是“項目企業、系統集成企業或信息服務企業,沒有多少真正的軟件產品企業”。即使是做產品的企業,也是在微軟、Oracle或SAP這些國外基礎軟件產品上搭建一個應用,這與他心目中的軟件——操作系統、瀏覽器、Office有著本質的不同。
做產業研究學會也開啟了祁國晟的大學創業生涯。因為此時他認識了不少業內人士,都有編程需求。于是,祁國晟就組織同學,有時幾個人,多時十幾個人,“干點兒項目”。現在,當公司上市后,他身上的標簽之一是“大學創業的成功代表”。
今天,社會鼓勵大學生創業,但在祁國晟創業時,清華上上下下幾乎都是反對派,因為之前學校剛掀起過一波創業潮,結果都不太好。這甚至導致祁國晟成立學會時,差點找不到規定的指導老師。恰好當時一位剛從美國麻省理工學院回清華任教的老師,開設了一門研究技術經濟和創新經濟的課程。“我覺得他無論如何都不該拒絕我,因為我想做的就是這個方向”。果然,這位老師支持了他,現在也是國雙的一名董事。
如今,很多人都會問已成為“中關村創業之星導師團成員”的祁國晟,你對大學生創業怎么看?“坦白講,我覺得非常非常難,因為很多產業分工已極度專業化了。20年前真的有“風口”,而且“風口”位置較低,有人肯站上去,就有可能被吹起來。現在“風口”是給很成熟、有資源、有準備的人去做的”。
不過,他也肯定地說,自己是鼓勵大學生創業的,但前提是“應該抱著99.99%會失敗的決心去創業”。因為創業經歷可以讓年輕人受到很強的鍛煉,特別在意志和對殘酷競爭的認知層面上。但是如果是抱著“30歲實現財務自由”的目標創業,那就不要做了。
比谷歌早一年
三四年前,“大數據”才被IT行業領頭羊企業熱烈探討。但祁國晟11年前在校創建公司時,就給公司取名Gridsum——他當時想,如果有一天數據量太大,大到加法在一臺計算機上搞不定時,就用分布式計算(Grid)處理加法(Sum)。這幾乎預見了今天業界對大數據的解決之道。
“我們發覺這個方向太有意思了,因為數據的增量有一天可能會超出摩爾定律的速度,單臺機器僅憑硬件升級永遠不可能搞定數據分析的量”。
祁國晟聽了大量分布式課程,像分布式操作系統、分布式數據庫。但這些技術在當時更多的是為了解決部署問題,而不是性能問題。“我們一開始就要讓它解決性能問題”。
如今,在大數據行業廣為人知的是,2004年谷歌相繼發表的三篇論文——Google FS、MapReduce、BigTable,這奠定了大數據的概念和算法基礎,也是Hadoop的起源。
實際上,祁國晟2003年就寫了一個程序,把四則運算轉化成加法,并讓多臺計算機一起來做,這甚至比谷歌的論文還早一年。
而當時,除了谷歌這些搜索引擎公司,很少會有大公司想到數據的分布式處理,因為做搜索的企業是第一批面臨每天新增網頁數據超出單臺計算機處理性能的企業。這也是為什么谷歌提出MapReduce、雅虎做出Hadoop的原因。
“我們可以拍著胸脯說,我們與MapReduce是同一個時候出來的。”祁國晟說。
這并不足奇,在業界,突破性技術往往來自小型初創公司。例如,CDMA編碼技術就不是來自通信大企業諾基亞或AT&T,而是當時的初創公司高通。
獨門秘籍
國雙成立后,最早接觸的需求是搜索引擎優化(SEO),就是讓某網站更受搜索引擎青睞。
那時,市場上大部分SEO的做法是“抓搜索引擎的漏洞,然后鉆空子”。但祁國晟認為“這類似金庸武俠小說中的‘旁門左道,不是正宗的功法”。他采用了與之不同的方法。
他們為大型網站拿去一個基于數據分析的診斷。在祁國晟看來,網站如果能掌握自己底層架構的數據,對每個頁面的內容、鏈接、關鍵詞密度和流量了如指掌,就能做出一個結構清晰、原創內容豐富的站點,搜索引擎自然就會喜歡。客戶覺得國雙的方法很有道理。
當年,國雙SEO技術因為效果顯著,受到大型網站認可。
“做完這些大客戶后,我們就覺得Web Analytics(網頁分析)太有機會了。即使是世界級產品,包括Google Analytics都有很多局限性。所以,我們花了兩年時間潛心把它做好。”祁國晟說,“現在,Web Analytics是國雙所有產品的核心。”
國雙也很快通過解決點擊欺詐問題,開啟了最初的人工智能研發。當時在廣告界,點擊欺詐現象非常嚴重。國雙可以提供一個多維度的自由剖析,幫助業內人士發現點擊欺詐。但是很快,“我們發現這個事太多了,能不能教會計算機自動去做這件事?”于是,他們開始了人工智能的嘗試。
人工智能模塊將扎根于國雙的每個產品中,“但我們并不想突出說這就是人工智能”。祁國晟坦言,現在,國雙沒有實力去投入一個“能下圍棋的機器人”,但他們投入的人工智能研發,目標是在任何一個有規模的行業中,把一些機械的事變得更有效率。比如,一些應用要通過看很多數據進行判斷,人總會有疲勞和疏漏,能不能用機器來替代?
另一個國雙的突破,來自祁國晟畢業后在微軟亞洲研究院的實習經歷,這也是他唯一一段“打工生涯”。他接觸了一個有趣的項目——自然語言分析,訓練機器去讀一批論文,然后回答“誰是這個領域的專家”。
“論文是非結構化數據,我當時覺得這類數據很有意思,它不是1+1=2這類結構化數據。我覺得,未來數據分析不只是1+1=2,還必須要對非結構化數據進行有效分析”。
祁國晟發現,因為當年計算機架構不能既看文本信息、又讀數字,大家因此把精力都放在文本信息上。這會導致這個自然語言識別項目的準確率大打折扣。
“這是一個機會”。后來,國雙確立了“結構化數據和非結構化數據不能分而治之的路線”。這條路有一定技術困難,做行業應用就更麻煩了,因為每個領域都要訓練一個數據集,尤其是特別專業的領域,缺乏復合型人才,有很多問題要克服。
不過,這條路也為國雙在多領域的大數據解決方案奠定了技術基礎。 例如,在支持“法信——中國法律應用數字網絡服務平臺”的建設過程中,在人民法院電子音像出版社副社長張承兵看來,國雙是唯一一家他們接觸的大數據公司中,技術達到應用級水平的。
今年春季,“法信”平臺上線,其中的裁判剖析大數據引擎(LD)和同案智推大數據引擎(SP)由國雙研發。現在,“法信”平臺主要是為法院體系服務。但在中國司法改革中,包括在一些領域要推廣先例制度——不只是看法條,還要看先例,國雙會藉此把它更深入地做成整個司法行業的解決方案。
國雙也在深耕市場營銷行業、政府公共服務行業,未來還會把技術帶入金融行業,定制行業解決方案。
“互聯網思維”是個坑
2014年底,當國雙具備一定規模后,請來在微軟曾管理過上千工程師團隊的劉激揚擔任公司CTO。
“其實,我們創業團隊的技術背景都很強,為什么還要到外邊請一個CTO?”祁國晟說,“因為我們都沒有大公司的經驗。而且,我們認為微軟的工程質量是相當好的。當公司發展到一定規模后,一定要請一個專業的CTO,幫我們把控產品質量和流程。”
劉激揚是微軟亞洲互聯網工程院的創建人。“他的到來,把國雙技術團隊管理帶上一個新層次,從創業公司帶到一個國際公司的思維層面。”祁國晟對劉激揚的評價很高。
同出自微軟,曾擔任產品經理的國雙科技助理總裁許云介紹說,微軟是最早提出產品開發要有“產品經理、開發團隊、測試團隊三駕馬車的”的企業。互聯網企業,像谷歌最早都沒有測試員。“但從產品質量管理角度,微軟有一個很嚴格的標準,產品出去前一定要經過嚴格的流程”。
國雙最初更像一個互聯網公司,也采用敏捷開發。劉激揚加入之后,反而讓他們別太敏捷,要按照一個規程,系統性地做一個軟件。要分清測試、開發和產品職責,像大集團軍一樣作戰。
“實際上,互聯網思維是B2B行業最大的坑。”祁國晟說。對“互聯網思維”一個極端的理解是快速做出新東西,病毒式推廣出去,免費使用,黏住用戶。但B2B企業的重心則完全不同——它要有核心技術,而不僅僅是一些功能。而核心技術如果沒有時間積累、沒有專業的人是做不好的。
“我覺得現在一個很大的問題是,很少有人真正相信,核心技術是可以被一個中國企業或中國團隊掌握的。所以大家今天都在拼功能,而不是拼技術。”祁國晟說,“實際上,在企業級領域,你今天發布一個功能,明天再發布一個功能,這并不重要,因為企業級應用要適應嚴苛的實際應用場景。很多看似功能豐富的產品一到實際應用階段,面對小規模數據量的場景還能應付,數據規模大到一定程度就垮了。”企業級產品靠照貓畫虎那樣模仿功能,是打不了真正的仗的。
在今年CNTV世界杯決賽直播、奧運會女排決賽直播中,國雙提供了基于央視網PC網頁、PC客戶端、手機、Pad等多終端過億用戶的全樣本“用戶播放行為分析”,為新媒體直播提供了有力保障。“我們能應對的數據量級是行業最具有挑戰性的,這是我特別自豪的一件事。” 祁國晟說。
2016年上半年,國雙研發費用占到公司營收的45%。祁國晟說,他現在對研發的理解是不要那么急功近利。“研發是錢花在未來一年都不一定會變成現金收入的事上”。像國雙與大學的合作,建立的“哈工大國雙聯合自然語言處理實驗室”、“人民大學—國雙大數據科學聯合實驗室”, 捐資設立“北京大學法學院科研與人才培養工作發展基金”,就是面向未來的研發。
目前,BAT也在加緊布局大數據。不過,祁國晟認為,BAT的大數據,更多與消費者相關,與B2B的DNA很不同。“B2B行業給客戶一個工具是不行的,在中國必須提供一個端到端的解決方案,必須要做得很細。而且,以BAT的體量,如果不是做一個平臺,而是一個應用,要一家一家地推,這不是他們想做的事。大家的方向差別還是挺大的。”
成長洞見
公司成功在納斯達克上市后,祁國晟在不同場合對10多年來在B2B行業的摸爬滾打有一些總結。他認為early vision(早期視野)很關鍵,國雙無論是SaaS還是在數據分布式處理上,都“看得非常早,運氣也比較好”。
國雙當時在考慮系統架構時,市場上還沒有“SaaS”這個詞。祁國晟記得很清楚,2007年他們做第一個產品Web Dissector時,同事問他,這個系統要不要考慮部署在客戶那里?他說不考慮。祁國晟判斷,做大數據必須用“SaaS”,除了極少數大企業外,計算機集群要放在國雙這里來集中調度,效率才會比較高,成本也會比較優化。
他也談到了做企業要堅持,“不管世界怎么變,我們就覺得這個事情要做下去。”
而行業專家是B2B企業成功的基石——你必須要找到這個行業里真正的專家,才有可能打動這個行業的購買者。“因為每個行業都是很深的,當你不能深度解決別人的問題時,沒有人有時間陪你玩。你必須做出他能夠用的東西。當只有一步之遙時,他才給你提點意見”。所以,B2B行業不光要有計算機編程能力,還一定要有行業專家。因為專家才能知道更深層面的痛和那個行業真正最嚴峻的問題。
祁國晟認為,文化和股權激勵是把行業專家團結在一起的重要方式。
“真正的行業專家很少認同在企業里做互聯網文化的,因為他自己在某個行業深耕多年,他不相信任何事情能簡簡單單、一兩年就出成果。”他說,“你要能打動這樣的人,必須要有一定的積淀。”
如今,國雙聯席總裁李峰就是互聯網廣告、搜索引擎營銷領域的大專家、百度第一任銷售總監。在政府行業,國雙與國家信息中心合作,吸引了很多政府行業專家。在法律行業,國雙既有法官、檢察官,也有律師,都曾在司法機關或律師事務所擔任要職。而B2B行業也要謹慎地對待風險投資。“因為B2B企業能做起來就能做起來,不一定需要很多錢”。即使現在SaaS公司燒錢很厲害,但都是在證明它的服務有人買、愿意付費后,再燒錢做銷售的。
正因為如此,雖然國雙之前曾做過三輪融資,從2010年迪士尼旗下的思偉投資和諾基亞成長基金,到2013年索羅斯的量子基金,這也是量子基金在亞洲唯一一次領投項目,再到2015年高盛投資,國雙都低調處理,沒有對外宣布。
祁國晟還提醒B2B創業者,在中國,由于采用現代治理制度的企業比較少,簡單復制國外概念不太容易成功。而在一些領域,由于政策等因素變化比較大,解決方案最好不是一個點,而是一個面。這樣,將來抗風險的能力會比較強。
“中國Oracle”
從當年做“軟件創客”起,祁國晟的夢想就是要做基礎軟件。
在國雙第一個產品Web Dissector的研發過程中,他們遇到一個問題是,商業智能領域很有價值的一種老產品——數據倉庫技術,不僅架構不太適合分布式,而且數據量達到一定量級就不行了。直到現在,Oracle、微軟都沒有一個云上數據倉庫。
“但值得自豪的是,2009年Web Dissector發布時,它是全世界第一個完全基于數據倉庫的產品。在這個產品上,用戶可以直接做各種分析,這些分析當年只有專業數據倉庫才具備,而且我們是在云上提供的。”祁國晟說。
目前,國雙正繼續優化結構,希望幾年之后,提供一個像AWS一樣的云服務,但這是一個“數據分析云服務”,所有大數據的服務,包括數據倉庫、實時數據分析、關聯分析甚至單純的自然語言分析,都在云上對外提供。
祁國晟說,自己的長遠目標是做“中國的Oracle”,開發基礎軟件,其他企業可以在國雙軟件上做二次研發,實現某個行業的應用。而這個基礎軟件,也就是“新時代的商業智能”,現在被業界稱為PaaS。
而在近期,這家前期走得還算順風順水的年輕企業更要努力證明,其在正在到來的大數據應用時代,能深入更多規模行業,用技術改變商業。