

“世界的本質是數據,大數據將開啟一次重大的時代轉型。”
在被譽為“大數據商業應用第一人”的科學家維克托·邁爾·舍恩伯格說出這句話后,全球知名咨詢公司麥肯錫聲稱,“數據已經滲透到當今每一個行業,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
當大多數公司競相涌入結構化大數據市場時,初曉光卻背道而馳,他看中了非結構化大數據的非凡前景。
有媒體將初曉光解讀為中關村“大數據”時代的“開拓者”。
6年以前,當國內公司面對大數據還像一個個“懵懂少年”時,初曉光已經懷揣大數據技術在國內招兵買馬,創辦公司,開始了大數據應用的產品化征程。迄今為止,他已將非結構化大數據技術用于政府輿情監測、企業危機預警、品牌保護和競爭情報分析等不同領域,并將業務部開設到北京、昆山、上海、深圳和香港等地。
關注非結構化大數據
初曉光獲得的一切成就皆源于他十幾年前的海外留學經歷,那里是他夢開始的地方。正是那幾年的積淀,讓他在后來的創業中獲得了先發優勢,占領了非結構化大數據這一細分領域的制高點。
1998年,初曉光開始了英國留學之旅。在那里,他學到了系統的工商管理和信息科技理論知識。回國后,他先是做了四年投資人,創辦過一家芯片設計公司,成功退出后,轉而在大數據領域尋求契機。
2007年,初曉光創建的麥克斯泰科技公司在北京理工留學人員創業園成立。用他的話說,“這是一家以大數據技術為主的最大化的實用技術公司”,專注于做非結構化大數據和云計算應用。有意思的是,初曉光的英文名字也叫Max,但他聲稱兩者沒有必然聯系。
訊庫系統是他的團隊幾經歷練后做出的成果。這是公司自主研發、獨立運營的國內較早的互聯網資訊監測預警平臺。
這個平臺能實時從互聯網上采集有針對性的資訊,將這些數據放到公司的云計算中心進行處理,再通過商業智能分析,生成結果后提供給用戶。與之相反的是,同行們似乎更關注結構化大數據技術帶來的應用,“他們給大型用戶做項目,例如做銀行內部信用卡資料的數據分析和處理,生成結果后提供給用戶,用戶再根據結果去提升企業的競爭力。”
在信息社會,信息都可以被分為兩類,一類信息能夠用數據或統一的結構加以表示,如數字、符號等,被稱為結構化大數據;另一類信息無法用數字或統一的結構表示,如文本、圖像、聲音乃至網頁等,被稱為非結構化大數據。
實際上,大數據在物理學、生物學、環境生態學等領域存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。不同于結構化大數據內容,非結構化大數據廣泛存在于互聯網上,表現為碎片化、非規范化的特征。
訊庫的數據全部來源于互聯網。它基于數據的某種特性,把散布在互聯網上的各種信息和碎片化的內容進行整合分析,找出其中的各種關聯性和趨勢。它打破了傳統的信息分類方式,由用戶決定分類標準。訊庫最典型的應用是政府的輿情監測。通過互聯網的數據采集,訊庫把公眾的意見反映給政府,政府以此來提高決策和執政水平。
如今,“訊庫”實時監測著全球數千個中文報紙、期刊、門戶網站、論壇、博客,每天更新數百萬條資訊,并擁有自1998年以來的數億條資訊數據庫。“只需幾分鐘,我們就可以把客戶所需求的信息進行選取分析之后精準地推送到達。”初曉光說。
值得一提的是,訊庫采用了SaaS軟件運營模式,它將應用軟件統一部署在公司的服務器上。用初曉光的話來說,“訊庫3.0實時搜索云Saas服務系統,一切盡在云端,無需下載軟件,無需更新系統,只要一臺可以上網的電腦就可實現云辦公。”
6年時間里,訊庫經歷了三次質變,最初的1.0和2.0版本是為了解決資訊的全面、實時的問題。第一個版本所做的是讓資訊搜集不漏;第二個版本可以在資訊出現后的十幾分鐘內將結果傳給客戶;而3.0版本致力于從語義分析層面解決用戶數據的提取準確性問題。除了大的升級外,“小升級每周都在進行。”初曉光對此很是自信。
為了提升用戶體驗度,除了PC版本外,訊庫還推出了手機客戶端等移動互聯網方式,用戶可以隨時登陸訊庫,個性化定制某類資訊。簡單的定制在系統上就可以實現,復雜的定制還可以使用訊庫的“私有云”來獲取。
占領數據挖掘和分析的制高點
在輿情監測行業,出去和進來的公司很多,市場不斷在變化,但麥克斯泰始終位列第一梯隊。
在企業危機公關中,數據挖掘和分析,越來越成為企業危機預警的重要構成。由于互聯網時代資訊傳播速度快,在突發事件爆發時,企業都有可能演變成公眾關注的焦點,如何做出正確決策以及保護自身品牌就變得尤為重要。此時,品牌和口碑監測的全面性、可靠性和實時性成為企業能夠靈敏、快速做出公關反應的前提。
除了輿情監測、品牌公關,企業競爭情報分析也可以通過非結構化大數據技術獲得。在全球化的當下,企業之間的競爭日益激烈,競爭情報分析成為企業提升競爭力的重要手段之一。由于企業95%的情報來自公開的信息,這使得非結構化大數據技術能大展身手。
依靠非結構化大數據做支撐,通過自主研發的語義分析技術,訊庫在數據挖掘和分析的全面性、可靠性和實時性上已經先于同行邁出一大步。目前,圍繞數據的分析采集與處理,公司已經有四項發明專利,60項軟件著作權和4個注冊商標。
初曉光舉了一個形象的例子,“關于某品牌車型的維修問題,互聯網上相關資訊有上億條,但是很多資訊并不是在說維修問題本身,亦或是一條相同的資訊被重復發布到多個網站上。這就要求數據庫對資訊去粗取精、去偽存真,還要避免重復化,這是訊庫正在花大力研發的核心技術——語義分析技術。”
通過語義分析技術,訊庫致力于將資訊準確聚類,對輿論正負面的分析盡量做到精確。“這涉及到自然語言的處理,所以不可能百分之百解決問題,只是看你能解決多少,80%?90%?還是95%?”
在硬件上,訊庫投入了幾百臺服務器來提升計算能力。在上億條資訊中將用戶想要的信息提取出來,這個過程,用戶只需要等兩秒,但背后是一系列復雜的計算過程。
目前,從中央到地市縣級政府機構,以及眾多世界五百強企業、科研院所、圖書館等,其中很多已成為訊庫的使用者。但在幾年前的媒體采訪中,初曉光有意透露希望將個人定制化資訊業務也收入囊中。對此,他給記者的回答是,這只是一種展望,還沒有形成明確的計劃。原因是技術需要突破,個人資訊市場還不成熟,產業化的路子還不暢通。對他來說,將現有的業務做扎實才是最實際的選擇。
但是,隨著移動互聯網的發展,訊庫手機客戶端的推出,為個人定制化資訊提供了可能性。
何為個人定制化資訊?簡單地說,就是將個人需要的一些特定資訊,通過訊庫客戶端,以一個更快的方式推送給使用者,不同于現在的頻道、欄目訂閱,它更精準地將想訂閱的資訊推送到用戶的手中。這樣做的好處是,過濾掉重復資訊和非定制化資訊,用戶看到的資訊就是他想看到的內容。
目前,初曉光團隊針對個人定制化產品,已經做了一系列小范圍測試,還沒到大規模推廣的階段。初曉光給出的理由是,“每個人對資訊的需求不同,如何將其做成產品予以呈現,還是一個摸索的過程。這要看產品研發周期和市場對其接受程度。”
在下一個產品規劃中,初曉光要取代調研問卷——這種傳統的市場調查方式。“調研問卷往往是通過街頭攔訪等形式,來探知受訪人的偏好。但是,結果是否真實?受訪人是否就是企業想要調查的群體?結果會有很大的片面性,而且品牌的口碑會隨著公眾危機事件和輿論的變化而發生改變。”
初曉光的想法是,研發一個互聯網分析工具,用戶可以根據歷史上的大量數據,通過某種運算形式,對他所關心的問題做市場調查。通過非結構化大數據技術來挖掘互聯網上的數據,得到某一時刻公眾對這一企業的評價,讓企業實時知道這一時間點的公眾輿論和情感傾向,產生的結果往往比傳統問卷調查準確得多。目前,這一領域的研發也在進行中。
一個務實的理想主義者
訊庫原本是初曉光在做投資人時遇到的一個項目,當項目初具成果后,他做出了一個出人意料的決定,創建公司,將這一項目變成產品一直做下去,這才有了后來的麥克斯泰和訊庫。
從投資人搖身一變成為創業者,初曉光給出了一個理所當然的理由。“投資人不是一個舒服的角色,我更喜歡創業。我很享受這樣的過程,利用草根化資源,不斷得地提升自我,做成自己想做的事情。這是一個想各種辦法解決各種問題的過程,雖然期間有時會很痛苦,但是樂趣無窮。”
初曉光是一個務實的創業者。相較于跨界創業,他更崇尚在細分領域取得先發優勢和占據第一個立足點,再做其他的細分點,同時還不能丟掉既有的市場。
他主要依靠自有資金滾動式發展,扎扎實實地將企業做到現在。他不喜歡制定長遠的計劃,用他的話說,能夠做明年的計劃已經是很超前了。很多公司都在為生存、為了尋找機會而戰斗。制定了計劃,實現不了,又有何意義?
“對我來說,把企業做起來,讓企業具備核心競爭力,就要先解決基本的生存問題,再考慮如何發展,最后是樹立企業的文化核心競爭力。在這期間會面臨很多挑戰,但管理也將不斷規范。”
他一直堅持這樣的理念,企業可以關門,但不要有欠債,這既包括錢財上的虧欠,也包括其他方面的虧欠。包括公司發展過程中的各種決策,以及各種有風險的事情,初曉光都會讓員工知曉并有一個清楚的認識。
“即使企業出問題,也能夠對所有人有一個交代。因為創業過程中,失敗很正常,你不為失敗做準備,就很難去前進。”
有人說,企業家生活就是工作,工作就是生活。初曉光不贊同這一觀點。他認為,創業要勞逸結合,生活和工作都要保持一定的節奏,讓二者盡量處于一個理想的平衡狀態。
工作之余,初曉光喜歡打高爾夫,喜歡航海和旅游,去過北京周邊幾百個地方,每次出去回來后都寫旅游博客。他還與朋友設立了一個微信的公共賬號,每當心有觸動時,就在上面談古論今。這個賬號如今已聚集了幾千個用戶。最近,他迷上了明清交界時期的歷史,喜歡拿古代的人物和事件與現今做比較。
“明朝是一個強大的王朝,但也存在很多問題,就如同現在的中國。清朝入關某種意義上是一種倒退,但清朝是中國歷史上稅賦最低的朝代,康熙當年免徭役,藏富于民,國家財政一年的收入和一個中等規模的鹽商的家產相當,人民的生活很不錯。”
他認為,一個國家想要有核心競爭力,就要珍視這個國家的企業家,給企業應有的社會地位。“企業家需要被社會認可,需要政府為他們松一下手腳,從包括改善稅收體制、稅負方式等方面入手,讓企業更好地去發展。”
這就是初曉光,一個務實的理想主義創業者。