Stacy Collett

大多數企業現在使用兩家甚至更多的云服務提供商,35%的企業使用多達五種監控工具來監視混合云和多云環境。要實現全網可視化,有哪些最佳方法?
企業中的網絡監控一直都是個大問題。據分析和咨詢公司企業管理協會(Enterprise Management Associates),即使企業還沒有把軟件和基礎設施遷移到云端,一家企業一般也會使用四到十種工具來監控自己的網絡,并排除故障。
在公有云環境下,網絡可視化實現起來更復雜。傳統的監控工具主要關注單個網絡單元的健康狀態和性能。當今的數字業務時代要求能夠更全面地把控網路,能夠使用大數據分析和機器學習從不同的云環境中收集并關聯數據。
據Kentik的一項調查,目前40%的企業認為自己是多云用戶,企業有兩家甚至多家云服務提供商。三分之一的企業有混合云環境,至少有一家云服務提供商,還有一些屬于企業的、位于同一位置或者第三方數據中心的傳統基礎設施。
EMA的研究主管Shamus McGillicuddy介紹說:“人們在網絡上收集和分析了很多不同類型的數據——從設備指標到網絡流量,直至數據包和日志,還有主動綜合監控,等等,但沒有一家供應商能把所有這些都做得很好。他們大部分甚至都不想去做所有這些工作?!?/p>
結果,35%的多云用戶擁有三到五種監控工具,包括日志管理工具(48%)、應用程序性能管理工具(40%)、開源工具(34%)和網絡性能管理工具(25%)。
McGillicuddy說:“網絡維護人員告訴我,他們只是找不到端到端的工具。他們能很好地了解數據中心,了解AWS,以及Azure,但是他們不能把所有這些整合起來?!?/p>
企業戰略集團(Enterprise Strategy Group)的高級分析師Bob Laliberte評論說:“環境變得越來越復雜。因此,他們必須找到非常成熟的工具,讓復雜的環境變得易于管理?!?/p>
但是,說起來容易做起來難。網絡專業人員經常抱怨,現有的以設備為中心的網絡監控功能無法擴展,也不能提供云和數字業務時代應用程序所需的可視化。云原生監控工具,例如,Amazon CloudWatch、Azure Monitor或者GCP StackDriver等,整合得比較好,可以觀察到所有基礎設施和應用程序層,但一些用戶發現云工具往往缺乏功能和可視化,更不用說它們與本地工具集成得不好。
分析人士評論說,目前還沒有一家供應商能給出“全局性”的監控解決方案,而且由于企業擁有的網絡與租用的網絡存在巨大差異,因此不應期待很快會有什么變化。但是有一些方法可以縮小這種差距,提高整個網絡的可視化。
連接網絡深度分析孤島
在一個混合云環境中,McGillicuddy指出:“總是會有可視化的孤島。重要的是尋找機會把這些孤島整合起來?!?/p>
網絡監控工具最有價值的一種數據源是管理系統API,用于從其他平臺提取數據——無論是來自AWS,還是像ServiceNow這樣發送票據數據的IT服務管理平臺,還是安全監控工具。
McGillicuddy解釋說:“如果想把所有這些整合在一起,那就需要一家網絡監控供應商,這家供應商在工具上有非?,F代的API,支持定制采集數據,使用定制工具,并且能夠構建新的儀表盤,支持企業以自己的方式查看云?!?/p>
他補充說,大多數新供應商都會有不錯的API。老供應商的API向客戶開放的速度可能會慢一些,因為他們認為通過分析生成的數據是私有的。
Laliberte說:“基礎設施部門可能在一些傳統工具上有優勢,這些工具目前正擴展到云原生環境中。”他補充道,像Riverbed這樣的工具集集成了SNMP輪詢、流和數據包捕獲功能,可以在混合云環境中獲得企業網絡的性能視圖,還有針對本地、混合和云的SolarWinds高級網絡監控工具集,這些工具集使得傳統監控和云監控相結合成為可能。
然而,很多傳統的網絡監控工具在采用云路線圖方面進展緩慢。EMA調查的大約74%的網絡管理人員說他們至少有一款網絡管理工具不能滿足他們的公有云需求。在這些網絡管理人員中,28%的人說這種失敗是由于供應商的不作為或者缺乏云支持路線圖而造成的。
McGillicuddy說:“我認為我們將能夠實現的是,所有供應商都非常擅長用他們的工具把一些深度分析結果應用到云中——但我還認為永遠不會有真正對等的時候?!?/p>
云服務提供商取得的進展
對于云原生和多云環境,Gartner云和IT運營研究主管Gregg Siegfried指出:“云提供商的工具使用起來一致性更好,能夠監控跨越其邊界的網絡?!?/p>
例如,微軟Azure添加了虛擬網絡TAP(目前在所有Azure區域中處于試用狀態),允許將虛擬機網絡數據流連續的傳輸到網絡數據包采集器或者分析工具中。采集器或者分析工具是由網絡虛擬設備合作伙伴提供的。
Siegfried說:“這更類似于網絡工程師在其現場所看到的,因此能夠集成類似功能肯定會有助于這些混合環境?!?/p>
據Kentik,盡管取得了進展,但很多云用戶不知道或者不會利用已有的一些監控功能。例如,超過半數接受調查的AWS用戶表示,他們正在使用由AWS提供的特定于云的監控工具,比如流日志。
Siegfried說:“我通常建議客戶在把時間和金錢花在第三方工具上之前,先嘗試云提供商的工具和云原生工具,但是,從云提供商那里獲得的可視化與使用這些附加產品獲得的可視化之間絕對存在著差異。”
打破壁壘:多云監控
新的工具已經出現了,能夠跨多云環境進行監控。
這些工具中重要的功能類型包括:適應能力、支持與產品開發和其他基礎設施部門協作的能力,以及集成來自多個源的數據的能力。Siegfried說,還要考慮成本和容量管理等因素,這些在混合網絡環境中非常重要。
Siegfried補充道,其中一些工具包括ThousandEyes、Kentik和APM工具,例如New Relic和Dynatrace,等等。
Kentik在今年4月份宣布,提供對微軟Azure的集成支持。Kentik從去年年底開始使用AWS和谷歌云平臺的數據流。該平臺還與其他云基礎設施數據源相集成,例如,主機級儀表、虛擬網絡設備以及容器編排和服務網格等。
Kentik主要收集兩點之間的NetFlow或者實際流量數據。它可告訴你網絡上發生了什么,并用其他數據源進行增強。
互聯網監控供應商ThousandEyes去年將其網絡智能產品擴展到了多云環境中。該公司預先配置了IaaS優勢點,包括15個AWS、25個Azure和15個GCP區域,使其可以全面了解某一云提供商在不同地區的表現。它還可以在云之間進行代理對代理測試,使IT部門能夠測量區域間、混合、云間和云內性能。
Kentik監視實時流量,而ThousandEyes生成了能夠模擬用戶的合成流量,然后指出在假設的網絡會話情況下可能會發生什么。
McGillicuddy說,“在過去三年里,人們對主動合成監控解決方案的興趣不斷增長。這是看待事物的兩種不同方式。合成是好事,因為有些會話是雙方都看不到的?!?/p>
AIOps和高級分析平臺
網絡監控在數據采集和獲取方面的重要性不亞于其在故障排除方面的重要性,由此,分析人員注意到出現了IT運營人工智能(AIOps)和高級分析平臺,這些平臺進行大數據分析和機器學習,把各種工具的深度分析結果關聯起來。
McGillicuddy說:“我們可以看到一些像CA這樣的供應商利用他們構建的大數據棧Jarvis來實現這一點,這些大數據??梢圆迦氲剿麄兿盗泄ぞ叩牟煌糠?,從而將他們的深度分析結果關聯起來。他們還嘗試怎樣從第三方供應商那里獲取數據,更方便地把深度分析結果關聯起來。一些專業的供應商也可以插入到企業所有的監控工具中,以一種很容易看到的方式為你關聯所有的東西。到目前為止,我們在研究中看到一些跡象表明,這實際上是一種很好的方法?!?/p>
展望:分布式網絡監控
Gartner建議使用數據驅動的網絡監控框架來提高跨多個云服務的網絡可視化,而不是依賴于傳統的基礎設施工具。
Gartner的高級主管兼分析師Simon Richard說:“使用云原生工具,而不是試圖把內部工具帶入云端,然后看看市場會怎樣發展。我認為云提供商會有更好的多云監控工具?!?/p>
Siegfried說:“無論我們稱之為混合網絡、云網絡還是SD網絡,未來的網絡都是由軟件定義的——采用分布式而非集中的智能或者控制功能。顛覆基礎設施管理其他領域的同樣的自動化理念、基礎設施和編碼技術也在網絡中得以應用。想一想一個以數據為中心的網絡監控框架——用于構建一類網絡監控平臺,為這些不斷發展的體系結構提供支持。”
Stacy Collett是《計算機世界》、CSO和《網絡世界》的特約撰稿人,他的文章涉及各種安全和風險問題。
原文網址
https://www.networkworld.com/article/3398482/network-monitoring-in-the-hybrid-cloudmulti-cloud-era.html