文/本刊記者 任 芳
在智能物流時代,數據無論對物流裝備還是物流系統的作用都至關重要。WMS、WCS等軟件系統的基礎便是數據庫軟件。物流裝備行業迫切需要讀取速度更快,計算效率更高,而且開源可改進的數據庫軟件系統。對高校而言,開源代碼對算法人才培養必然起到很好的促進作用。在這方面,濤思數據提供了很好的行業借鑒和產學研合作基礎。
近期,工業和信息化部等八部門聯合印發《物聯網新型基礎設施建設三年行動計劃(2021—2023年)》,明確到2023年底,在國內主要城市初步建成物聯網新型基礎設施,物聯網連接數突破20億。這一數字背后,意味著更加龐大的數據規模。在物流領域同樣如此,隨著行業的發展,無論車聯網規模還是不同規模物流中心內智能設備的接入量都在大幅增加。面對隨之而來的具有時效性強、實時數據量大等特點的海量數據,如何實現高效的數據存儲和處理至關重要。
基于此,各種涵蓋數據采集、存儲、查詢、分析和計算等功能的物聯網數據平臺開始不斷涌現,北京濤思數據科技有限公司(以下簡稱“濤思數據”)便是其中之一。但是,不走尋常路的濤思數據,不僅摒棄傳統基于Hadoop生態的搭建方式,推出專為時序空間大數據設計的時序數據庫平臺,更是以開源的方式,突破行業傳統思維,開創了一條大膽創新探索之路,成為時序數據領域炙手可熱的標桿企業。
與濤思數據創始人陶建輝的初次會面,剛好在一場大雪之后。突然而至的大雪一夜之間便褪去了北京絢麗多彩的秋色,但雪后碧藍的天空,光禿的樹枝,與濤思數據所在的望京CBD設計別致的建筑群相互映襯著,倒也具有別樣的美。大自然總是充滿神秘莫測的變化,而對于軟件行業出身的陶建輝來說,最熟悉的卻莫過于變化。軟件行業可以說是技術更新換代速度最快的行業之一,就拿App來說,其平均壽命大概只有10個月。想做一款“長命”的基礎性軟件產品的念頭,很久之前就開始在陶建輝的腦中萌生。最終,兩方面的原因堅定了他的信念。

活力四射的濤思數據團隊
一是蓬勃的市場需求。隨著互聯網的發展,特別是通訊成本的急劇下降,各式各樣的數據被采集并發送到云端,數據量呈現爆炸式地增長。“10年前,你很難想象,幾乎每輛車、每臺設備都在源源不斷地產生數據;現在,這一切都在發生;未來,這一趨勢還將加速。工業領域在傳統的實時監控技術上,各種大數據分析技術、特別是人工智能技術,讓采集的大數據產生了巨大的商業價值,催生了一個前所未有的市場。”他表示。
二是技術的相對落后。他進一步分享道:“相對于數據量的快速增長,數據處理的技術卻相對落后。雖然市場上已經有從存儲、計算到分析較為完整的大數據處理框架,包括各種免費開源系統,但需要耗費大量的存儲空間和計算資源。一個運營商光存儲查詢半年的上網記錄就需要使用數千臺服務器,而且還需要不斷擴容。因此海量數據的增長對技術提出了更大的挑戰,也給我們這些技術極客們提供了一個巨大的機會。”
如何彌補現有技術的缺陷,充分滿足龐大的市場需求,成為陶建輝接下來要考慮的重點。在對整個物聯網和大數據生態進行研究后,他發現,通用大數據方案通常會將開源的Kafka、Redis、HBase、MongoDB、Cassandra等大數據軟件拼裝起來,利用集群來處理海量數據。因涉及多種系統,開發效率低、運行效率差、運維復雜、應用推向市場慢等問題頻發。對于數據采集量巨大的物聯網、工業互聯網等行業,傳統的通用大數據方案更加難以為繼。而通過存儲結構的優化則可以大大提升性能。海量時序空間數據處理(從采集、存儲、查詢、計算到分析)無疑是個巨大的機會。正是在此背景之下,2017年6月濤思數據正式成立,隨后,物聯網大數據平臺TDengine應運而生。
“作為一款基礎性軟件,TDengine就好比一塊小小的磚頭,無論整個軟件世界如何變化,迭代,若干年后它依然可以發揮價值,如此我便很知足了。”陶建輝笑著補充道。盡管濤思數據成立已經4年多了,但在回憶公司創立過程時,他的臉上依然滿是似乎創業者初期才有的激情與昂揚。
TDengine定位是物聯網大數據平臺,即時序數據處理平臺,其核心是將時序數據實時數據和歷史數據操作合一透明,同時具備緩存、數據訂閱、流式計算、消息隊列等功能,為物聯網數據處理提供全棧解決方案。

濤思數據自2017年成立以來獲獎無數

陶建輝
濤思數據創始人。
1994年到美國留學,1997年起,先后在芝加哥Motorola、3Com等公司從事無線互聯網的研發工作。2008年初回到北京創辦和信,后被聯發科收購。2013年初創辦快樂媽咪,后被太平洋網絡收購。
2017年5月創辦濤思數據,專注物聯網大數據的處理,產品TDengine開源后,在GitHub全球趨勢排行榜上多日排名第一位。濤思數據已獲紅杉、GGV、經緯、明勢資本等多家機構的近7000萬美元的投資。
獲得2020中國開源杰出貢獻人物。
所謂時序數據,即帶時間標簽的數據,指按照時間的順序變化、時間序列化的數據。陶建輝通過對物聯網、工業互聯網數據進行調研,總結出這類數據的十大特征:(1)所有采集的數據都是時序的;(2)數據都是結構化的;(3)一個采集點的數據源是唯一的;(4)數據很少有更新或刪除操作;(5)數據一般是按到期日期來刪除的;(6)數據以寫操作為主,讀操作為輔;(7)數據流量平穩,可以較為準確的計算;(8)數據都有統計、聚合等實時計算操作;(9)數據一定是指定時間段和指定區域查找的;(10)數據量巨大,一天的數據量就超過100億條。
針對這些特點,TDengine定義了創新的時序數據存儲結構,通過無鎖設計和多核技術讓數據插入和讀出的速度比現有通用數據庫高出10倍以上。除此之外,濤思數據還賦予了TDengine兩個核心技術創新點,分別是“一個數據采集點一張表”以及“超級表”,保證TDengine插入和查詢效率最優化,同時便于進行聚合查詢、多維分析。
除了在產品性能、性價比上不斷提升,TDengine能夠形成更加廣泛的影響,還在于陶建輝一個大膽的決定——開源。這一舉動在國外軟件市場尚不足為奇,但在相對保守的國內市場來說,無疑反響強烈。TDengine自2019年7月正式宣布開源,2020年8月,宣布將集群版本開源以來,所獲成績喜人,在開源社區GitHub(世界上最大的代碼托管平臺)已收獲17k Stars。在資本市場,濤思數據也備受關注,近兩年已經先后獲得近千萬美元的Pre-A輪融資、1000多萬美元的A輪融資以及4700萬美元的B輪融資。
在陶建輝看來,開源是中國軟件走向世界的最好捷徑。在目前的這些成績之外,陶建輝內心始終有一個堅定的目標——做時序數據領域的全球第一。“在基礎軟件領域,無論操作系統、數據庫、軟件開發工具還是現在的大數據處理平臺,幾乎都是美國公司的天下。在基礎軟件領域占有一席之地,是我們所有IT人的夢想,更是一個國家科技實力的象征。”談及中國軟件的現狀他略顯遺憾,但是隨即恢復了對于未來發展的信心,“中國擁有全球最大的數據市場,其采集的數據量和場景之多已經超過美國。在中國市場成功的大數據產品,一定會被全球市場所接納。”
開源不僅為濤思數據帶來了巨大的成功,為行業做出了很好的表率;對于中國軟件人才的培養來說,也具有非常積極的意義。
陶建輝表示,高校學生往往在跟導師做項目時才能夠接觸到源代碼,而各類開放平臺上的開源軟件也非常有限,但是隨著TDengine的開源,學生可以免費接觸到無數源代碼,這無疑是最好的學習機會和資源,會對中國軟件整體水平的提高起到積極的促進作用。為了促進大學生對開源的認識和理解,陶建輝先后在清華大學、復旦大學、重慶大學、西南大學、北京大學、中國人民大學、北京郵電大學和中國科學技術大學等20多個高校,分享 TDengine的核心技術,開源背后的思考,鼓勵大學生積極參與到開源建設中來。
值得一提的是,對于程序員來說,他們往往是默默地改變著大家生活的一群人,隨著軟件的開源,他們從產品背后開始走出來,和更廣泛的人群有了交流和互動,在相互促進之下,不僅可以進一步提升專業能力,用代碼打造屬于自己的“名片”,同樣也有利于行業整體水平的提高。這些在陶建輝眼中,都是比企業成功更加有意義、有價值的事情。

TDengine時序數據處理平臺
時序數據的處理,是一切數字化、智能化的基礎。在TDengine廣泛的服務領域中,物流是非常重要的部分。并且隨著物流行業的快速發展、自動駕駛等技術的升級和愈加廣泛的應用,對時序數據處理的需求也在不斷擴大。
“在物流領域最典型的應用如物流車輛的實時位置和運行軌跡數據,以及物流機器人、穿梭車等移動裝備的位置、電池狀態,以及路徑規劃、環境監測、軌跡追蹤等等數據,通過TDengine,我們可以實現用更小的空間存儲更加海量的數據,同時在最短的時間,將用戶需要的數據進行調用,以及分析計算等,為其他更多功能的實現提供支撐。”他針對TDengine在物流領域的應用進行了說明,并進一步舉例,國內某快遞巨頭旗下互聯網科技公司,由于其原來采用的時序數據庫OpenTSDB性能較差、占用存儲空間多、對大跨度高頻詞的查詢支持不夠等原因,將目光轉向了TDengine,在將大數據監控平臺遷移到TDengine之后,其所需服務器從之前的21臺減少到3臺。此外,TDengine在部署、寫入速度、查詢速度、存儲效率、緩存、流式計算等方面均凸顯出明顯的優勢。此外,如在煙草等行業,隨著企業業務的發展,生產中需要監測的指標從幾萬個增加到幾十萬甚至百萬個以上,TDengine的應用有利于企業提升數據存取效率、打破傳統數據孤島、提升數據有效利用率。
“技術是濤思數據的立身之本,通過技術創新潛心研發極致的產品,讓技術創造價值是我們努力的方向。”在整個交流過程中,從他不時爽朗的笑聲中,聽得出他對濤思數據未來發展的極大信心;從他始終富有激情且面帶微笑的臉上,也看得出他對手中事業的熱愛。 “一般來說,程序員的黃金年齡是25~35歲,像我這樣50歲還在寫代碼的程序員已經是稀有動物了。”陶建輝自嘲到,“但是,我還會繼續寫,寫一輩子。”陶建輝站在大大的落地窗前,窗外視野開闊,陽光正好。