John+Gallant
Informatica首席執行官Anil Chakravarthy指出,控制好數據整合和完整性對于創新工作和保證企業安全非常重要。
如果您想成功實現數字化轉型計劃,首先要清理您的數據。這是Informatica首席執行官Anil Chakravarthy的觀點,該公司的主要數據管理產品幫助企業360度全方位了解客戶、供應商和其他重要資產。在IDG首席執行官系列采訪的這一期中,Chakravarthy與首席內容官John Gallant就數據質量和整合問題進行了探討——這些問題阻礙了創新和數字化轉型工作。他還介紹了在公司自己數字化轉型策略的推動下,這一歷經25年的公司于2015年決定轉向私有。
Chakravarthy在安全行業有深厚的背景,曾在賽門鐵克和VeriSign擔任高級職位,他還解釋了為什么我們的安全重點應從周界防護轉到數據層。用他的話來說,在此之前,安全仍然是“懸而未決的問題”。
CIO.com:您為客戶解決了哪些問題?
Informatica首席執行官Anil Chakravarthy:Informatica提供我們所謂的企業云數據管理,這意味著我們為要進行數字化轉型的公司提供數據管理產品和服務。所有人都專注于某種數字化轉型工作,幾乎所有的數字化轉型都是由某種數據驅動的變革所推動的。
我們幫助客戶打好數字化轉型的數據基礎。我們構建了我們所謂的智能云數據平臺。智能云數據平臺是內部部署和云端的混合——它幫助客戶構建各種數字化轉型應用程序和流程。
CIO.com:最近,我主持了一個關于數字化轉型的圓桌會議,參會者有來自相關企業的首席信息官以及職能相近的同行們。討論的主要議題是關于成為分析主導的或者數據主導的企業,而每個參會者都認識到其主要難點在于數據問題。企業必須處理好哪些問題才能真正成為分析驅動的企業?
Chakravarthy:我認為這就涉及到數字化轉型的核心問題。首先,需要由首席執行官和董事會進行領導,因為這會對整個公司產生影響。這可能意味著業務模式會出現一些變化。例如,如果您留意一下通用這樣的大公司正在進行的數字化轉型,他們把業務模式從銷售高端設備和服務計劃轉變為基于實時數據的新業務模式,他們將與客戶共同承擔風險。他們把提供高端設備作為服務。這是業務模式的轉變。
我們看到的第二個重大變化是新流程。例如,無論是移動銀行還是移動自助服務,企業現在都以某種形式的服務為客戶提供了更多的功能。所有這些都意味著新的流程。
數字化轉型的第三大變化是新用戶和新應用支持。例如,在過去,分析應用程序主要用于報告或者事后分析。以您要進行季度總結為例。現在,您想對季度工作進行分析,哪些細分市場表現良好,哪些細分市場表現不佳,等等。這是事后分析,而且是以批次的方式完成的。現在,這類新用戶和新流程的含義是,您需要把分析功能內置于其工作流程中。這是一個很大的變化。
數據要求是,首先,您必須能夠從現有系統以及新系統中訪問數據。您必須能夠訪問任何來源的數據——無論是在內部,云中還是Hadoop等新數據平臺上。您還必須能夠理解這些數據。您可能有來自多個來源的客戶數據,如果您想全面了解這些數據,必須使用元數據把它們整合在一起。
最后一件大事是,做這一切時思想上要有清晰的數據治理的概念。這不能是事后的做法。在這個新環境中,必須從一開始就把數據治理建立起來。
CIO.com:和這些首席信息官們交流的時候,人們提到了數據質量、數據標準化等各種問題。您能在這些方面幫助別人嗎?
Chakravarthy:首先,我們幫助人們把數據從多個來源匯總到一個通用數據存儲庫中,然后用于數據分析和報告,為流程提供支持。對于可用數據源的數量,從大型機時代到物聯網,以及期間的所有一切,有各種各樣的數據源,大量不同類型的數據庫,非常多的API;在很多情況下,由于開發的時間較早,因此沒有API。以不影響源系統的方式獲取數據不會影響任何正在進行的操作流程,仍會在正確的時間幫助您把數據提供給正確的用戶;這是我們解決的第一個問題。這是數據獲取問題。
第二,現在假設您已經解決了這個問題,得到了以自己的格式表示的原始數據,這就是我們開始討論的質量問題的第一步。在不同的數據庫中可能沒有相同的客戶ID。您可能在一個地方有一個客戶ID,而在其他不同的地方您可能根本就沒有任何ID。您可能有輸入,但輸入可能不完整或者不正確。由于開發這些數據庫和數據源時并不是建立在數據將被從這些系統中取出并重新利用的假設之上,因此有很多問題。這是我們解決的第二大問題。數據質量是一個很廣的話題,使用元數據,或者可以預先制定規則的數據質量產品,或者使用機器學習等新技術來確定規則。
與數據相關的下一組問題是如何理解與某一具體業務實體相關的數據?舉個例子,如果您是一家石油公司,那么您可能會關注一條石油管道,想獲得來自各種系統的數據。有些可能是ERP型系統,其他可能是提供實時輸入的新型物聯網系統。您想要得到所有這些,并能夠360度全方位地查看石油管道。它運行良好嗎?符合目標嗎?盈利嗎?數據的業務實體視圖是我們解決的第三大問題,將數據放到一種格式中,以便您可以對數據進行360度全方位的查看。最后一個問題是數據治理。這些數據來自哪里?我們有這些數據的譜系嗎?這是數據的權威來源嗎?數據是否安全?所有這一切都要歸結于治理標準。這是我們針對數據解決的第四大問題。
CIO.com:什么樣的痛點促使客戶說:我必須得和Informatica的這些人談談?
Chakravarthy:通常,當他們要開始這些數字化轉型大計劃的時候。然后,他們認識到他們有的數據不正確或者不完整,或者他們無法在正確的地方獲取正確的數據,在對數據進行正確的轉換,使其可用時也遇到了問題。這些是他們打電話給我們希望解決的典型問題。
CIO.com:我想深入了解一下您的主要產品。讓我們從客戶360產品開始吧。
Chakravarthy:“客戶
360”是最容易使用的產品,因為它名副其實。Nordstrom就是一個例子,這個客戶至少從2008年起一直在使用該產品。當您走進Nordstrom時,其員工有一類平板電腦設備,他們想在您進入時找出您的基本信息。然后,他們在您的基本信息中加入了許多內容,以便為您提供個性化的服務。您可能是Nordstrom Rack的顧客。您可能已經呼叫了客服,您可能已經在線退回了一些產品,等等。這些數據來自許多應用程序和數據庫,這就是“客戶360”要做的。我們把這些數據放到一起,然后客戶或者我們的一個合作伙伴在這些數據基礎上開發定制應用程序。我們不開發應用程序。我們把它們放到一起形成一個基礎,方便進行應用程序開發。
例如,在Nordstrom的例子中,它可能是個性化的應用程序。這個客戶是我們最賺錢的客戶之一。他每幾個月才來一次,但一旦決定購買,就不會退貨。或者,這是一個做決定很快的人,但他退了一半的貨。這有助于提供個性化的服務。這些就是建立在數據之上的一類應用程序。我們在每個行業都有這樣的客戶。例如,在保險行業,MetLife是一個很好的例子。在他們看來您并不是客戶;您只是一個保險號碼。但現在他們想知道客戶是誰,還有誰在家里,他們的生活發生了什么變化?他們有什么樣的生活?他們結婚了嗎?他們有孩子嗎?他們離婚了嗎?家里有親人去世了嗎?他們希望全面了解您的家庭,因為這有助于他們更好地掌握能為您提供哪些其他產品,以及如何與您建立更好的關系。這正是“客戶360”產品所做的。
CIO.com:我覺得針對業務合作伙伴的“供應商360”產品做的事情完全一樣。
Chakravarthy:是這樣的。我們在行業中看到的最常見的是“客戶360”、“供應商360”、“產品360”以及我們所謂的“資產360”,這是您的業務資產,就像我談到的石油管道。您怎樣360度全方位地了解這些?但產品本身,就是我們所說的主數據管理產品,是非常容易擴展的。其實我們現在有140個具體的數據域。
FDA是一個很好的客戶實例。對于FDA而言,藥物就是一個域,他們希望能夠360度全方位地了解藥物。我們有一些醫療保健和生命科學客戶就是這樣做的。他們為關鍵業務實體建立了360度全景視圖。最常見的是客戶、產品等,我們有預開發的解決方案,他們可以在其基礎上進行定制。
CIO.com:您目前在云中提供什么,將來會在哪里?
Chakravarthy:我們的云戰略是三重的。首先,我們堅持開發適合于云應用的云產品。我們過去的系列產品中有很多功能。我們是一家有35年歷史的公司。我們采用了很多這些功能,將其置于云產品中。換句話說,我們不打算把現在內部部署的產品搬運到云端。我們擁有云數據集成產品、云應用和流程整合產品、云計算主數據管理以及我們發布的其他新產品;云數據質量和云數據安全等。這是我們云計算策略的一部分。
我們策略的第二部分是制定混合策略。我們的一些內部部署產品支持云作為數據源或者數據目標。例如,您可能會在內部使用分析數據倉庫,但您希望從salesforce.com或者Workday或者您正在使用的任何其他云應用程序中提取數據。這是我們支持的非常常見的用例。實際上,例如,對于Salesforce-to-SAP整合,我們支持全球超過40%的Salesforce-to-enterprise整合。這就是一個混合的例子,數據被引入,云被用作數據源。我們還做了很多工作,其中云被用作數據目標,最常見的是Amazon Redshift、Azure SQL Server等。數據倉庫在云端,我們處理來自源系統的內部數據,進行數據整合、數據質量、治理等,然后在Amazon Redshift或者Azure SQL Server中對數據進行處理,用于分析應用程序。
我們云計算的最后一個策略是確保我們自己處在云的關鍵生態支持系統中。其中最大的四家是Salesforce.com、Amazon、Azure和Tableau。我們也在努力,您很快就會聽到其他幾家的消息。我們希望本身就在生態支持系統中,這意味著,例如,在Salesforce中,我們使用在force.com上運行的應用程序,而這些應用程序嵌入在Salesforce中。作為亞馬遜整個數據層的一部分,我們一直與亞馬遜密切合作,我們希望在這方面成為亞馬遜全包合作伙伴之一。他們邀請我們參加他們的re:Invent大會。我們在亞馬遜內部提供了完整的數據管理層。我們現在也和Azure在Azure數據管理層上做同樣的事情。
CIO.com:您能談談為什么公司轉向私有,為什么這對客戶有好處?他們能從中得到什么?
Chakravarthy:我們轉向私有主要因為我們自己的轉型,就像客戶正在經歷數字化轉型一樣。我們的轉型主要是從內部許可軟件公司轉為企業級云公司,這意味著轉型首先是圍繞業務模式,從基于許可的軟件公司轉變為訂閱軟件公司。正如您所知道的,業務的增長非常迅速,轉向私有更利于業務的增長,因為這在公有市場上很難做到,而這對公司的財務有影響。
從客戶角度的看,轉型是非常有好處的。云公司做得非常好,而且我們也在做的一件事就是從客戶成功的角度來看待一切。一旦您擁有訂閱業務模式,這意味著客戶有可能把您關掉。如果他們有更好的解決方案,他們可以在一年或者六個月后關掉您。保持增值非常重要。A,確定客戶采用了軟件;B,他們對軟件的使用感到滿意,整合得很好,實現了他們的目標。我們公司自己的轉型過程中,我們在客戶成功方面付出了巨大的努力,因為這是推動訂閱軟件增長以及續訂和公司保持成功的原因所在。
從客戶的角度來看,由于我們對此非常關注,因此這種變化非常有利。對我們的客戶有利的第二個原因是,即使我們轉向私有,我們也保持了與公有公司同樣的研發投入。我們15%的收入用于研發,我們一直保持了這種投資水平,因此,我們能夠在這些新領域繼續創新。
CIO.com:您一直從事的是安全市場。為什么要進入數據管理領域?
Chakravarthy:每個公司都開始轉變為以技術為中心的公司,或者以數據為中心的公司。這對我們來說是很大的機遇。我看到了機遇。這是一個原因。第二個原因是我確信,要解決安全問題,最合適的層應在數據層。我長期以來從事基礎架構安全工作,在這一層上,保護硬件設備,但是您對數據了解不夠,您不知道什么對業務很重要。
公司在基礎設施安全方面進行了大量投資,但仍不安全,有非常多的漏洞。我相信一個根本的答案,即正確的安全方法是在數據層。這是您可以控制的層面,無論是在內部還是在云中,這也是黑客關注的層面。他們不在乎是否能入侵您的硬件設備。他們想要您的數據。因此,安全的重點應轉到數據層面。這就是我們一直在做的。我們一直在這方面進行投入。我們的數據安全產品在RSA會議上獲得了11個獎項。而Informatica幫助我們,讓我們能夠一箭雙雕。
CIO.com:您曾說數據安全是“一個懸而未決的問題”。我想知道您能不能再深入一些,多介紹一些關于Secure@Source的發布。
Chakravarthy:如果這個問題已經解決了,那就不會這么頻繁的出現泄露事件。我自己也是董事會成員。幾乎每個董事都對網絡安全、數據安全有所了解。但大多數董事會成員還不清楚今后會怎樣。他們接受采訪,盡可能保持清醒。這是技術問題,很難。我之所以認為這是一個未解決的問題,主要是因為以前有很多投資已經投入到網絡和基礎設施安全領域,那時公司有明確的分界線,有明確的周界,有明確的數據中心,公司控制不了的數據量非常有限。
現在,正如您所知道的,沒有周界了,大多數公司正在快速轉到云端。幾乎所有公司都在使用幾十甚至幾百個基于云的應用程序,這些應用程序都有自己的數據。我們認為,安全的第一步是您應該清楚的知道敏感數據在哪里。這個問題并不難,我對遇到的每個首席信息官都會問他們:您有多少數據庫?看起來這么簡單的一個問題,也得不到一個直接的答案。可以告訴我有多少路由器。可以告訴我有多少筆記本電腦。但不能告訴我有多少數據庫?如果您不能告訴我有多少數據庫,您怎么知道敏感數據放在哪里?這就是我所說的未解決問題的意思。
我們確信,解決問題的第一步是獲取敏感數據所在位置實時、清晰的視圖,以及企業里誰能夠訪問并控制這些數據。這是第一步,也是Secure@Source要解決的。這就是Secure@Source解決的問題。幾乎就像給您張地圖一樣。有了這種視圖后,它可以讓您內部的谷歌告訴您敏感數據所在的位置,然后您應優先考慮誰擁有訪問權限,如何確保其訪問權限等等,然后才能查看視圖。
CIO.com:您能談一下關于幫助客戶實現其大數據計劃的策略嗎?
Chakravarthy:我們把大數據視為既能存儲數據又能處理數據的新平臺。例如,Hadoop就是。我們為新的云平臺提供云自有能力,我們提供與在Hadoop和NoSQL上運行的大數據功能相同的功能。換句話說,您擁有數據集成、數據質量、主數據管理、數據安全等功能,所有這些都運行在大數據技術上,例如Hadoop上的Spark。
給客戶帶來的真正好處是我們還提供遷移功能。換句話說,假設您使用我們的技術15年前在傳統系統上開發了數據渠道或者數據供應鏈。假設您開發了數據,但計劃將其從大型機系統中卸載,并將其轉移到基于Unix的數據倉庫中,并且您正在使用所有這些數據。我們將處理所有業務邏輯,自然地在大數據上運行,而無需重寫所有這些邏輯。這是我們真正的優勢所在,能夠重用業務邏輯,能夠重用客戶已經擁有的產品技能,但是他們得到的基礎平臺是一個自然支持大數據的平臺。
CIO.com:您認為誰是最主要的競爭對手?
Chakravarthy:在我們面臨的競爭形勢中,有三種類型的公司。有非常大的公司,數據管理是其系列產品中的產品線之一。例如像IBM這樣的公司,他們有數據管理。這不一定是他們的核心重點領域,因為他們太大了,但他們在系列產品中的確有數據管理。和我們競爭的另一類公司專門提供一部分功能,或者專注于某一種平臺。
例如在大數據領域,我們有像Hadoop這樣的競爭公司。例如,我們與專注于某個特定生態支持系統或者一個特定平臺的云計算公司相競爭,他們提供我們為該平臺提供功能的部分功能。第三類公司專注于開發新的縱向應用。例如,有人可能會為生命科學行業開發整套應用程序,并把提供數據管理作為其中的一部分。這顯然并不與我們端對端地100%重疊,但他們的確為他們提供的應用程序進行數據管理。
CIO.com:在與IDG新聞服務的一名記者討論時,您曾談到Dell Boomi是云領域最大的競爭對手。您只是把它們定位為云競爭對手?
Chakravarthy:是這樣的。他們在專注于云,我們在云整合上和他們競爭。我們提供云數據管理,如云的主數據管理、數據質量、數據安全等,而他們并沒有提供。但在云整合領域,我們與他們競爭。
CIO.com:最近我恰巧和Chris McNabb在Dell Boomi上討論了同樣的問題,因此,我想再多了解一些。您認為您與他們的主要區別是什么?
Chakravarthy:首先,我們是真正的混合。如果您要處理數字化轉型等大問題的數據管理,那么僅有云這種方式是不夠的。您需要的是真正的混合;內部部署、云、大數據平臺,上述的任意組合。如果您是希望有數據管理合作伙伴的企業,那就是您所需要的。他們解決了一小部分難題。如果一個客戶找到他們,他們將不得不為解決難題的其他部分而購買類似的工具,然后客戶就成為系統集成商,把所有這些整合在一起。如果客戶需要的是數據管理企業提供商時,這才是我們最大的區別之處。
另一個大的差異是我們在云中提供的組合功能。他們提供云整合,就像我剛剛提到的,即使在云端,只需要一個與Salesforce和Amazon一起工作的生態支持系統——您是否需要不同的工具來實現整合、數據質量和數據安全等,或者為生態支持系統提供一套綜合的數據管理工具?
CIO.com:Informatica有哪些進展?
Chakravarthy:機會來臨時我們感到非常興奮。我們的目標市場是首席信息官,數字化轉型是他們的頭等大事。我認為很多首席信息官還處在數字化轉型規劃階段。我們認為首席信息官將成為首席數字官。越來越多的首席信息官們正在做的事情是運行數據中心和運行基礎設施等,他們以某種形式進入云端,或者變得非常商品化,以至于不用自己去做這些事情。他們越來越重視數字化和數據,我們有能力為他們提供服務。
John Gallant是IDG US Media的首席內容官。
原文網址:
http://www.cio.com/article/3190592/leadership-management/why-data-quality-is-key-to-successful-digital-transformation.html