何己派
“上知天文、下知地理”的ChatGPT火了,數(shù)據(jù)這門資產(chǎn)的重要性,從未提升到如此高度。
大數(shù)據(jù)這個廣而又廣的概念下,大量非結(jié)構(gòu)化數(shù)據(jù)如同一條暗河,潛伏在由數(shù)十億互聯(lián)設(shè)備、無數(shù)云服務(wù)包裹的數(shù)字世界。若能盡可能地轉(zhuǎn)化這些混亂無序的數(shù)據(jù),帶來的信息價值,將相當(dāng)可觀。
今年1月宣布完成C輪融資的日志易,做的就是這門轉(zhuǎn)化的生意。
這家日志管理與分析平臺開發(fā)商,致力于幫企業(yè)挖掘和利用機器數(shù)據(jù)價值,企業(yè)IT系統(tǒng)、設(shè)備每時每刻產(chǎn)生的日志,是它的拿手領(lǐng)域。
14年前,39歲的陳軍接到一通獵頭電話,毅然決定離開待了12年的硅谷,回國發(fā)展。輾轉(zhuǎn)騰訊、高德等公司幾年后,2014年他創(chuàng)辦日志易,選定IT運維分析的創(chuàng)業(yè)方向。
To B圈沉潛多年的“老炮兒”,大器晚成,融資一路很順。
公司成立當(dāng)月,還沒有產(chǎn)品,就拿到徐小平真格基金等投資者1400萬元的天使輪。
而后紅杉兩輪加持,C輪融資在2022年,整個企業(yè)服務(wù)賽道都相當(dāng)艱難的背景下完成,投資方為某知名產(chǎn)業(yè)投資機構(gòu)。
日志易的核心客戶群,瞄準(zhǔn)規(guī)模最大的3000家中國企業(yè)和機構(gòu),它們年度IT預(yù)算基本過億,對IT運維有著極高要求。
自2015年起,公司連續(xù)數(shù)年銷售收入同比增長超100%,2022年營收過億,目前已服務(wù)超700家大型企業(yè)和機構(gòu),標(biāo)桿客戶包括中國銀行、光大證券、國家稅務(wù)總局等。
“IT運維是道生命線。數(shù)據(jù)安全治理,在許多企業(yè)是一把手責(zé)任制。”
陳軍形容其為水和電,“大家習(xí)慣了一打開開關(guān)就有電,擰開水龍頭就有水,很難感知其重要性,但一旦停電停水,影響非常大。IT運維也是這樣。”
選在繁忙的會議間隙,陳軍和《21CBR》記者聊了聊IT運維行業(yè)的變化、日志易的創(chuàng)業(yè)故事以及公司接下來的規(guī)劃。
我接觸計算機很早。
還記得上世紀(jì)80年代中期時,蘋果II型電腦,1萬多塊錢一臺,對比普通人一個月200元的工資,電腦絕對是奢侈品。
母親是廣東海洋大學(xué)計算機教授,我從小耳濡目染,6歲開始玩舊式的計算機打孔紙片,14歲開始學(xué)Basic編程語言,90年代中期成為第一代網(wǎng)民。
1998年,從美國南加州大學(xué)碩士畢業(yè)以后,我一直在硅谷工作,從思科到谷歌,主要做云計算和搜索開發(fā)。
2009年,一個越洋獵頭電話,讓我做了回國的決定,加入騰訊,做大規(guī)模數(shù)據(jù)中心運維及云計算,而后又轉(zhuǎn)戰(zhàn)高德做技術(shù)副總裁。2014年高德被阿里收購以后,我想,是時候出來做點事了。
分析各種創(chuàng)業(yè)方向,美國的Splunk用搜索引擎來處理日志的想法很獨特,給我留下挺深的印象。Splunk在2011年進入中國市場,售價昂貴,當(dāng)時沒有國內(nèi)公司做同類的產(chǎn)品,市場存在機會。
2014年初日志易成立,我們成為第一家用搜索引擎來處理日志的中國企業(yè)。
所謂日志,是計算機系統(tǒng)所產(chǎn)生的機器數(shù)據(jù),蘊含大量能直觀反映系統(tǒng)運行狀況的重要信息,有非結(jié)構(gòu)化的特點。
傳統(tǒng)做法是用數(shù)據(jù)庫對日志進行存儲和分析,但效率不高,且數(shù)據(jù)庫不適用日志這種沒有固定格式的數(shù)據(jù)。若利用搜索引擎,抽取字段將日志文本做類似網(wǎng)頁搜索的處理,IT人員就可以用關(guān)鍵詞搜索任意數(shù)據(jù),像搜索網(wǎng)頁一樣方便,并能在此基礎(chǔ)上做各式各樣的分析。
這件事要想做成,需要兩方面的能力,一得懂IT運維監(jiān)控,二得懂搜索引擎,把搜索這個To C的東西,轉(zhuǎn)化成為日志處理的工具。恰好,創(chuàng)始團隊擁有這兩塊技術(shù)背景。
公司成立的同年10月,產(chǎn)品就做出來了。
那時SaaS創(chuàng)業(yè)火熱,起初,我們做的也是SaaS版本,放在公有云上,并在2015年1月拿到第一筆收入,來自一家小型創(chuàng)業(yè)公司,給了1萬多塊錢。
嘗試了半年,我們得出來一個判斷,做SaaS賺不到錢,也很難吸引大客戶。公司馬上調(diào)整方向,決心做本地化部署,主攻大型企業(yè)。
日志易的第一個大客戶,是家大型金融科技機構(gòu),公司通過試用切入,投了不少人力對接需求,花了半年時間終于簽下。
金融、運營商、能源等行業(yè),是公司重點布局的領(lǐng)域。
這些行業(yè)每天面臨海量數(shù)據(jù)的產(chǎn)生,痛點很明顯:日志數(shù)據(jù)產(chǎn)生于不同業(yè)務(wù)部門,分散在不同服務(wù)器上,規(guī)模可達上百TB級,缺乏集中收集和管理;系統(tǒng)一旦出現(xiàn)問題,需要登陸服務(wù)器進行事后手動查找和分析,這個過程耗時且效率低。
以一個統(tǒng)一日志管理平臺,對日志實現(xiàn)集中采集、存儲和實時索引,乃至分析、可視化和監(jiān)控告警,實現(xiàn)的是日志全生命周期管理。相當(dāng)于把事后管理變成事中,一出現(xiàn)故障苗頭,秒級告警。
日志易的早期產(chǎn)品版本,是基于通用開源軟件做的。服務(wù)大客戶時,我們意識到,TB級別的數(shù)據(jù)量,開源軟件無法滿足處理需求,不可持續(xù)。
公司要想長期發(fā)展,必須走向自研,開發(fā)自己的搜索引擎。
這個想法真正落地,花了整整3年。2018年底,公司發(fā)布了自研日志搜索引擎Beaver,技術(shù)指標(biāo)較開源搜索引擎有大幅提升,填補了國產(chǎn)空白。
過程很辛苦,中間有人動搖、離開。做自研的同時,雙線并行,老業(yè)務(wù)依舊在同步發(fā)展,不斷疊加功能,這是考慮到一旦停下,市場份額無法繼續(xù)增長甚至倒退,會有經(jīng)營風(fēng)險。
從產(chǎn)品競爭力來看,日志易的優(yōu)勢主要在于兩方面。
其一,自研的搜索引擎技術(shù),數(shù)據(jù)處理性能提升5-10倍,可處理PB級新增海量日志,能完全實現(xiàn)自主可控,同時硬件成本減少50%。
其二,自研的低代碼搜索處理語言SPL(Search Processing Language),專為日志分析而生,和傳統(tǒng)的數(shù)據(jù)庫查詢語言SQL相比更加靈活,具有上手快、開發(fā)快、運行快等優(yōu)勢,可實現(xiàn)“在搜索框里編程”。
過去幾年,我們以日志產(chǎn)品為核心,開始向更多領(lǐng)域橫向拓展業(yè)務(wù),發(fā)展的邏輯可以概括為“T型戰(zhàn)略”。
所謂“T型”,一豎即深耕日志,深挖機器大數(shù)據(jù)的價值,一橫指延伸開來的場景,已形成三條產(chǎn)品線,運維分析、安全分析、數(shù)據(jù)治理,每個產(chǎn)品線下又有多個產(chǎn)品,由此形成產(chǎn)品矩陣。
比如,安全分析這塊,2019年切入,目前已有SIEM安全大數(shù)據(jù)分析平臺、用戶實體行為分析UEBA等安全產(chǎn)品。
從日志的角度發(fā)現(xiàn)安全攻擊,日志易做這事有天然優(yōu)勢。
當(dāng)前市面上做安全態(tài)勢感知的廠商,很多基于國外開源日志搜索軟件二次開發(fā),一天只能處理幾百GB的數(shù)據(jù)量,再往上走非常吃力,并且安全分析規(guī)則內(nèi)置固化在產(chǎn)品里,變通性較差,安全攻擊往往“道高一尺,魔高一丈”。
基于SPL的安全事件分析,較傳統(tǒng)的內(nèi)置安全分析規(guī)則,可擴展性更強,分析是隨時隨地進行的。產(chǎn)品在應(yīng)對新的安全攻擊的時候,能不斷演進,對客戶來說,這也是投資保護,不至于因為產(chǎn)品過時而需要定期購買新產(chǎn)品。
回過頭來看日志易的開發(fā)節(jié)奏,從公司成立到拿下第一個大客戶,日志分析產(chǎn)品花了18個月,安全產(chǎn)品從2019年5月開發(fā)到簽下第一個大型股份制銀行客戶,也是18個月。
公司積累沉淀了一套產(chǎn)品開發(fā)方法論,從產(chǎn)品設(shè)計到簽下行業(yè)標(biāo)桿大客戶,基本用時不到2年。
做To B的軟件企業(yè),得邁過兩道坎,16%的市場滲透率、1個億的收入。對日志易來說,我們跨越了鴻溝。
日志易瞄準(zhǔn)中國最大的3000家企業(yè)和機構(gòu),目前進度已到700多家,市場滲透率超過20%,金融行業(yè)的滲透率更高,大約超過30%。
2021年,公司實現(xiàn)訂單金額過億,2022年訂單金額、營收均過億,營收增長超30%。
盡管去年整個投融資大環(huán)境比較慘淡,日志易依然完成了C輪融資。
行業(yè)分布來看,金融、運營商、能源等行業(yè)客戶貢獻較大,且老客戶復(fù)購率較高,客單價逐年穩(wěn)步提升。
IT運維領(lǐng)域,對新技術(shù)的追趕,中國大約落后美國五年。
幾個數(shù)據(jù)來看,中國IT支出占GDP的比重僅1.4%,相較美國的4.7%仍有較大差異;中國的GDP占了全球的1/6,但IT支出只占全球的12%,同樣不成正比;軟件開支差異更大,中國軟件支出占GDP的0.1%,美國是1.1%。
這意味著,未來中國的企業(yè)和政府?dāng)?shù)字化轉(zhuǎn)型,仍有巨大紅利和增長空間。
近幾年,自主可控的IT信創(chuàng)如火如荼,大量核心組件需要逐步從原來國外大廠的成熟產(chǎn)品替換為新開發(fā)的信創(chuàng)產(chǎn)品,這些新產(chǎn)品的穩(wěn)定性有待提升,給IT系統(tǒng)的運維監(jiān)控和排障帶來新挑戰(zhàn)。
日志易2020年開始投入信創(chuàng)領(lǐng)域,已能實現(xiàn)國產(chǎn)信創(chuàng)操作系統(tǒng)的全部適配,堅定看好這個方向。
新興技術(shù)方面,公司在2018年開始開發(fā)智能運維的產(chǎn)品,將機器學(xué)習(xí)的算法用在運維領(lǐng)域。
ChatGPT的出現(xiàn),帶給了我們啟發(fā),已在著手研究如何利用過去9年在機器大數(shù)據(jù)分析領(lǐng)域的積累,結(jié)合ChatGPT這類通用大模型,搭建日志分析的ChatGPT,“培養(yǎng)”一個專攻IT運維知識的AI專家。
中長期而言,我們希望能在三至五年內(nèi),完成科創(chuàng)板上市的目標(biāo),終極的愿景,則是成為機器大數(shù)據(jù)領(lǐng)域的龍頭,服務(wù)幾千家大型企業(yè)客戶。
我想,中國有這樣的市場體量和需求,日志易也具備這樣的前提條件。