數(shù)字化時代,信息如潮水,“存儲性能不足”成為橫亙在許多企業(yè)面前的一大難題。
基于存儲架構(gòu)的差異,存儲設(shè)備主要分為集中式存儲和分布式存儲。分布式存儲指基于分布式架構(gòu),通過軟硬件協(xié)同,依托高效網(wǎng)絡(luò)連接多個節(jié)點來實現(xiàn)存儲功能的IT產(chǎn)品和服務(wù)。與集中式存儲相比,分布式存儲更適合大規(guī)模數(shù)據(jù)存儲和高可用性需求的場景。
隨著自動駕駛、人工智能、機器人等領(lǐng)域在中國的迅速發(fā)展,傳統(tǒng)的集中式存儲已經(jīng)“力不從心”,面臨著單點故障風(fēng)險和可擴展性有限等多項缺陷。
轉(zhuǎn)向分布式存儲,勢在必行。
賽迪顧問發(fā)布的《中國分布式存儲市場研究報告(2025)》顯示,2024 年中國分布式存儲產(chǎn)業(yè)規(guī)模達(dá)到 198.2 億元,年增長率高達(dá)43.7%。
分布式存儲雖好,但門檻也高:系統(tǒng)復(fù)雜,研發(fā)周期長。
“由于研發(fā)周期長至5-10年,并且存在較大失敗風(fēng)險,國內(nèi)分布式存儲產(chǎn)品大多基于國外研發(fā)的開源軟件設(shè)計,完全自主研發(fā)者鳳毛麟角。”上海霄云信息科技有限公司(以下簡稱“霄云科技”)創(chuàng)始人李小勇告訴《瞭望東方周刊》。
霄云科技自主研發(fā)的碧海分布式存儲系統(tǒng)(BOSS),就是鳳毛麟角中的一個。
李小勇介紹,目前BOSS系統(tǒng)的穩(wěn)定性、可靠性和調(diào)閱速度在國內(nèi)外均處于領(lǐng)先地位,已實現(xiàn)存儲百億級文件性能不衰減、文件和對象互通訪問性能無損耗。
成立于2015年的霄云科技,經(jīng)歷數(shù)年積累,正進(jìn)入爆發(fā)期:已獲得2020年度“中國存儲峰會軟件定義存儲產(chǎn)品金獎”和2020年度“上海軟件核心競爭力企業(yè)”等榮譽稱號,并榮獲賽迪咨詢“2024分布式存儲醫(yī)療行業(yè)市場TOP1”認(rèn)證,正在推動國產(chǎn)存儲從“追趕”到“領(lǐng)跑”的跨越。
“霄云科技的目標(biāo),是打造國產(chǎn)分布式存儲第一品牌,在數(shù)據(jù)存儲領(lǐng)域樹起中國標(biāo)桿。”李小勇告訴《瞭望東方周刊》。
20世紀(jì)60年代,李小勇出生在甘肅農(nóng)村。他回憶,那個時候的西北農(nóng)村還相當(dāng)貧困,需要幾個家庭合作才養(yǎng)得起一頭牛。他從小就穿舊粗布衣,一邊幫家里干農(nóng)活,一邊在油燈下苦讀。
1989年,高中畢業(yè)的李小勇考上了西北師范大學(xué)物理專業(yè),人生第一次乘綠皮火車前往省城蘭州。當(dāng)時電腦還未在國內(nèi)普及,學(xué)校機房每天中午免費開放給學(xué)生使用一批VAX小型機(1977年問世的32位小型機,個人電腦前身),李小勇就天天泡在機房里寫程序。
大學(xué)畢業(yè)后,李小勇進(jìn)入國營慶華儀器廠(860廠)工作,但內(nèi)心深處,他還想接觸更大的世界。兩年后,他成功考入位于成都的電子科技大學(xué)(以下簡稱“電子科大”)通信專業(yè),攻讀碩士學(xué)位。
電子科大的電子信息科學(xué)技術(shù)專業(yè)實力全國領(lǐng)先。在校期間,李小勇有機會參與了國家第一代高性能路由器開發(fā)項目。
“當(dāng)時國內(nèi)互聯(lián)網(wǎng)不發(fā)達(dá),查找資料非常困難,我們還需要找校長簽字后,購買英特爾網(wǎng)卡去做研究,那個項目用時近3年才完成。”李小勇回憶。
2000年,李小勇又考入上海交通大學(xué)攻讀博士學(xué)位,師承計算機系白英彩教授。一開始,他的研究方向是“嵌入式系統(tǒng)”。2008年,經(jīng)過深思熟慮,他轉(zhuǎn)而全力主攻存儲領(lǐng)域。
“我的考慮是,選擇科研方向要‘頂天立地’:一方面要有足夠大的研究空間,符合未來30年的專業(yè)發(fā)展方向;另一方面還要能在實踐中有廣泛應(yīng)用。”李小勇說。
存儲,就是這樣一個“頂天立地”的領(lǐng)域:一方面,隨著科技發(fā)展,如何安全可靠地應(yīng)用海量化數(shù)據(jù),已是科研人員的“必答題”;另一方面,存儲在不同行業(yè)中有不同的應(yīng)用場景,且對于企業(yè)的未來發(fā)展日益重要。
下定決心后,李小勇給自己下達(dá)的第一個任務(wù),就是通讀過去幾十年中存儲領(lǐng)域的研究論文。他回憶,那段時間他每天至少工作16小時,長期住在辦公室,經(jīng)常半夜兩三點跑到學(xué)校旁邊的麥當(dāng)勞吃個夜宵,再繼續(xù)工作。
在導(dǎo)師白英彩的帶領(lǐng)下,李小勇成功申請到2010年上海市科委發(fā)布的“PB級海量存儲系統(tǒng)”項目,從此“有經(jīng)費支持可以買設(shè)備了”。
當(dāng)時,國內(nèi)研究開發(fā)存儲系統(tǒng),習(xí)慣基于國外開源軟件做優(yōu)化。李小勇卻決定從頭開始,自主研發(fā)。
項目周期為2年,直到1年半的時候,他的研究還是毫無進(jìn)展,“問題點太多了,不知道怎么解決,感覺像珠穆朗瑪峰一樣翻不過去。”李小勇回憶說。
2012年項目結(jié)案時,李小勇仍然未實現(xiàn)突破,最終只能選擇先走“老路”,在國外開源軟件的基礎(chǔ)上做優(yōu)化。
回首這段經(jīng)歷時,他意識到,當(dāng)時自己的能力儲備還不足以獨立研發(fā)出分布式存儲系統(tǒng),“像是一個自行車生產(chǎn)線上的技工,忽然被放到了飛機制造線上”。
“國產(chǎn)分布式存儲系統(tǒng)研發(fā)成功,具有特殊意義。我認(rèn)為,它甚至能比肩國產(chǎn)飛機發(fā)動機的自主研發(fā)。”
但李小勇并未知難而退,放棄自主研發(fā),而是一邊努力夯實自己的知識儲備,一邊尋找突破口。
那幾年,上海交通大學(xué)的致遠(yuǎn)湖邊,半夜兩三點鐘,常有個人影彷徨徘徊。月朗星稀之下,魚群躍出水面,一片粼粼波光打碎夜的靜謐,也驚醒了在湖邊沉思的李小勇。
“沒有拼命奮斗過的人,不會看見這樣的風(fēng)景。”李小勇說。
他深入研究了單機版存儲,開發(fā)了NAS存儲(一種基于文件級的存儲解決方案,通過網(wǎng)絡(luò)提供共享的文件存儲服務(wù))和ISCSI存儲(一種基于塊級的存儲協(xié)議,允許客戶端通過IP網(wǎng)絡(luò)訪問遠(yuǎn)程存儲設(shè)備),在此基礎(chǔ)之上研發(fā)自己的存儲系統(tǒng)。
自主研發(fā)的過程很煎熬:有時候感覺一個方案可行,但做到一半發(fā)現(xiàn)又走不通了,只能再換一個方案,循環(huán)往復(fù),至少需要嘗試三四次才能找到真正可行的方案,“感覺像是走在一條長長的隧道里,看不到盡頭”。
這段在失敗中積蓄力量的過程,被李小勇稱為“放水養(yǎng)魚,放馬跑洲”——“這是創(chuàng)新和研究的規(guī)律,不斷量變,最終會積累成質(zhì)變”。
2014年4月,李小勇出國訪學(xué)一年之后,在回國的航班上寫代碼時,忽然感覺很多問題想通了,像捅破了窗戶紙一般。
“在那個時間窗口,我自己研發(fā)出了一個分布式原型系統(tǒng),結(jié)合這幾年積累的科研成果,評測后效果很好。至此我才感覺到,自主研發(fā)不基于開源軟件的分布式存儲系統(tǒng)可行了。”李小勇說。
2015年4月,李小勇自主研發(fā)的分布式存儲閉源系統(tǒng)BOSS問世,在穩(wěn)定性、安全性和性能等方面都實現(xiàn)了自主且安全。
“國產(chǎn)分布式存儲系統(tǒng)研發(fā)成功,具有特殊意義。我認(rèn)為,它甚至能比肩國產(chǎn)飛機發(fā)動機的自主研發(fā)。”李小勇說。
不久后,李小勇籌集到500萬元啟動資金,正式創(chuàng)立霄云科技。
創(chuàng)業(yè)近10年后,李小勇回到了他從小長大的村莊。俯視著腳下的溝壑阡陌,他不禁感嘆:“創(chuàng)新如同登山,看似有100條路可以上山,但其中可能只有數(shù)條能夠登頂。選擇正確的道路需要點運氣,但更重要的是,要有‘執(zhí)拗’的勁頭。”
回看霄云科技的發(fā)展歷程,李小勇總結(jié)為三個階段:第一步是自主研發(fā)出產(chǎn)品;第二步是“拿著榔頭找釘子”,尋找能最大程度發(fā)揮產(chǎn)品優(yōu)勢的場景;第三步則是“從1到10”,實現(xiàn)規(guī)模擴張。
人工智能領(lǐng)域?qū)⑹窍鲈浦貍}的下一顆“釘子”。
“拿著榔頭找釘子”,是決定性的一步。在試水過金融、教育等多個領(lǐng)域后,霄云科技依然沒找到最能發(fā)揮價值的場景,原因在于上述領(lǐng)域?qū)Υ鎯浖阅艿囊蟛粔颉案呔狻保w現(xiàn)不出BOSS系統(tǒng)的優(yōu)勢。
直到他接觸到醫(yī)療領(lǐng)域,才真正找到了那顆最合適的“釘子”。
2019年,在衛(wèi)寧健康科技集團(以下簡稱“衛(wèi)寧”)引薦下,霄云科技團隊走進(jìn)上海市胸科醫(yī)院,發(fā)現(xiàn)醫(yī)療行業(yè)影像調(diào)閱速度慢的痛點已存在多年。
作為國內(nèi)胸外科領(lǐng)域的頂尖專科醫(yī)院,上海市胸科醫(yī)院的PACS系統(tǒng)(影像歸檔和通信系統(tǒng))承載的影像數(shù)據(jù)已達(dá)到十億級文件規(guī)模。這樣一家頂尖三甲醫(yī)院的醫(yī)療影像存儲系統(tǒng),容量一方面要足夠龐大,滿足未來不斷擴容的需求,另一方面在醫(yī)療高峰期還要能高速無卡頓調(diào)閱影像,挑戰(zhàn)之大可想而知。
盡管已經(jīng)使用了國外最先進(jìn)的設(shè)備,但醫(yī)院存儲系統(tǒng)調(diào)圖卡頓的情況已經(jīng)存在了近10年,一直沒有找到很好的解決辦法。
了解到這個痛點之后,霄云科技為上海市胸科醫(yī)院量身定制了新一代醫(yī)療PACS影像存儲解決方案:將PACS系統(tǒng)的調(diào)圖速度從業(yè)內(nèi)常見的每秒20-50幅,提高到每秒300幅以上,徹底解決了PACS影像調(diào)圖卡頓問題。與此同時,還能實現(xiàn)百億級文件性能不衰減且所有PACS數(shù)據(jù)全部可以在線高速調(diào)閱。
李小勇介紹,以火車來類比的話,從前的調(diào)圖速度就像是綠皮火車,但霄云科技定制的系統(tǒng)上線后,就升級成了高鐵,“推動了整個行業(yè)的變革”。
一開始,上海市胸科醫(yī)院對于霄云科技系統(tǒng)的可靠性也是半信半疑,只配置了少量存儲容量進(jìn)行試點,且所有數(shù)據(jù)都是一式兩份:一份存儲在霄云科技系統(tǒng)中,另一份留存在醫(yī)院原先的進(jìn)口設(shè)備上。調(diào)用時由霄云科技系統(tǒng)先讀,如果出現(xiàn)問題可及時切換至進(jìn)口設(shè)備。
但霄云科技經(jīng)受住了考驗。第二年,上海市胸科醫(yī)院決定,將所有數(shù)據(jù)遷移至霄云科技系統(tǒng)。
李小勇認(rèn)為,與上海市胸科醫(yī)院的合作“開創(chuàng)了業(yè)界先例”:此前醫(yī)院調(diào)用一組影像圖片平均需要約3分鐘時間,霄云科技系統(tǒng)則可以在3-5秒內(nèi)完成,且能在高速的同時保證穩(wěn)定和安全。
此外,醫(yī)療數(shù)據(jù)遷移速度也實現(xiàn)了突破:一般三甲醫(yī)院數(shù)據(jù)量遷移通常需要兩年,霄云科技則將其縮短至兩三個月。
如今,霄云科技已經(jīng)為包括復(fù)旦大學(xué)附屬腫瘤醫(yī)院、安徽省宿州市立醫(yī)院在內(nèi)的多家大型三甲醫(yī)院部署了類似的PACS存儲系統(tǒng)。
過硬的技術(shù)和服務(wù)能力,也讓霄云科技獲得了包括國內(nèi)著名基礎(chǔ)軟件投資機構(gòu)元禾重元在內(nèi)的多家投資機構(gòu)青睞。
李小勇告訴《瞭望東方周刊》,憑借差異化技術(shù)路線和場景深耕能力,霄云科技正在推動國產(chǎn)存儲從“追趕”到“領(lǐng)跑”的跨越。未來,公司將加大對“國產(chǎn)分布式存儲”的研發(fā)投入,進(jìn)一步擴大產(chǎn)品在性能和安全性方面的突出優(yōu)勢,為中國在分布式存儲領(lǐng)域?qū)崿F(xiàn)真正突破而努力。
“人工智能領(lǐng)域?qū)⑹俏覀冎貍}的下一顆‘釘子’。霄云科技正在面向人工智能存儲做系統(tǒng)研發(fā)和優(yōu)化,未來會把技術(shù)優(yōu)勢運用到各個人工智能新場景中去。”李小勇說。