




在本文中,作者整理了在中國境內活躍的大數據領域最具影響力的企業,它們有的是計算機或者互聯網領域的巨頭,有的則是剛剛創辦不久的初創企業。但它們有一個共同點,那就是它們都看到了大數據帶來的大機會,并毫不猶豫地挺進了這個領域。
首先來盤點一下那些提供大數據工具的老牌廠商,看看他們是如何利用自身優勢地位沖擊大數據領域,并將新產品及新方案推廣到新一輪技術浪潮當中?
大數據是比云計算還要新興的一個術語,但是從(表一)中列舉的一些公司不難發現,在業內,大數據被科技企業看作是云計算之后的另一個巨大商機,包括IBM、微軟、谷歌、亞馬遜等一大批知名企業紛紛掘金這一市場;另外,很多初創企業也開始加入到大數據的淘金隊伍中,如Cloudera、Clustrix等。但縱觀國內大數據服務提供商市場,大數據這一概念,對國內企業來說或許還稍顯陌生,在最具影響力的前30家企業中,國內企業幾乎還是一片空白,相對來說,國內大數據起步較晚,但依舊有些企業不遺余力的投入大數據這片藍海,并且發展態勢良好,下面就來盤點下大數據領域國內的主力陣營吧!(見表二)
國內做大數據的公司依舊分為兩類:一類是現在已經有獲取大數據能力的公司,如百度、騰訊、阿里巴巴等互聯網巨頭以及華為、浪潮、中興等國內領軍企業,涵蓋了數據采集,數據存儲,數據分析,數據可視化以及數據安全等領域;另一類則是初創的大數據公司,他們依賴于大數據工具,針對市場需求,為市場帶來創新方案并推動技術發展。其中大部分的大數據應用還是需要第三方公司提供服務。
越來越多的應用涉及到大數據,這些大數據的屬性,包括數量,速度,多樣性等等都是呈現了大數據不斷增長的復雜性,所以,大數據的分析方法在大數據領域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。基于此,對大數據進行分析的產品有哪些比較倍受青睞呢?(見表三)
而在這里面,最耀眼的明星當屬Hadoop,Hadoop已被公認為是新一代的大數據處理平臺,EMC、IBM、Informatica、Microsoft以及Oracle都紛紛投入了Hadoop的懷抱。對于大數據來說,最重要的還是對于數據的分析,從里面尋找有價值的數據幫助企業作出更好的商業決策。下面,我們就來看看以下十大企業級大數據分析利器吧。(見表四)
隨著數據爆炸式的增長,我們正被各種數據包圍著。正確利用大數據將給人們帶來極大的便利,但與此同時也給傳統的數據分析帶來了技術的挑戰,雖然我們已經進入大數據時代,但是“大數據”技術還仍處于起步階段,進一步地開發以完善大數據分析技術仍舊是大數據領域的熱點。
在當前的互聯網領域,大數據的應用已經十分廣泛,尤其以企業為主,企業成為大數據應用的主體。大數據真能改變企業的運作方式嗎?答案毋庸置疑是肯定的。隨著企業開始利用大數據,我們每天都會看到大數據新的奇妙的應用,幫助人們真正從中獲益。大數據的應用已廣泛深入我們生活的方方面面,涵蓋醫療、交通、金融、教育、體育、零售等各行各業。
大數據特色介紹
在IBM圍繞大數據開發出的產品中,DB2、Informix與InfoSphere數據庫平臺、Cognos與SPSS分析應用可謂最為知名。近期發布的POWER8是IBM第一個面向大數據設計的系統。
英特爾Hadoop發行版最大特色就是憑借英特爾硬件加速獲取高性能和高安全性。但英特爾近來宣布停止發行自己的Hadoop版本,轉而支持Hadoop發行商Cloudera,并成為Cloudera最大的股東。
在捕獲大數據的環節: 提供了Oracle數據庫和Oracle NoSQL數據庫;在大數據分析階段:提供了Oracle Exadata數據庫云服務器、Oracle Exalytics商務智能云服務器、Oracle數據倉庫和Oracle高級分析等解決方案。
HP提供與大數據相關的硬件、軟件以及服務,其最為知名的當數Vertica分析平臺。
Teradata憑借自家硬件平臺、數據庫以及分析軟件而聲名遠播。它同時針對零售及運輸行業推出了專門的分析工具。Teradata Aster大數據分析平臺,客戶無需部署,就可以受益于開源Apache Hadoop。
SAP推出了一系列分析工具,但其中知名度最高的當數其HANA內存數據庫。
Amazon歷來以企業云平臺著稱,但同時也推出了眾多大數據產品:如基于Hadoop的Elastic MapReduce、DynamoDB大數據數據庫以及能夠與Amazon Web Services順利協作的Redshift規?;⑿袛祿}儲方案。
EMC發布的Apache Hadoop發行版Pivotal HD,可以與Greenplum數據庫進行整合,而不僅僅是在Hadoop中運行SQL。
富士通的Hadoop內存計算一體機平臺可全面提升大數據分析計算速度;全新M10小型機平臺打造可插拔的Oracle數據庫服務機。
微軟發布的新一代并行數據倉庫一體機SQL Server Parallel Data Warehouse(簡稱PDW),提供了大規模并行處理并具備靈活線性橫向擴展能力的數據倉庫平臺。
谷歌公司推出的大數據產品包括BigQuery——一款基于云的大數據分析平臺。
為企業級市場提供大數據系統處理的創業公司 Cloudera,于2008年首次為企業客戶帶來Apache Hadoop平臺。
戴爾在數據分析端有Kitenga軟件,幫助企業用戶做更深的數據挖掘。
SAS的核心競爭力就體現在集群環境下的運算和算法,是第一家把大量且復雜的精密數據分析運算應用到Hadoop集群。
Splunk主要關注機器數據分析業務,全新版本Splunk Enterprise 6.1為全球化企業提供任務關鍵型運維智能。
專注于Apache Hadoop框架,支持跨計算機集群分布式處理大型數據集,主要產品為Hortonworks數據平臺。
VMware vSphere大數據擴展版使得vSphere能夠控制Hadoop部署并幫助企業用戶簡化大數據項目啟動流程。
作為企業級大數據及分布式軟件開發方案提供商,產品線包括企業級Hadoop和軟件開發生命周期管理。
專注于數據集成領域Informatica推出的HParser是一種針對Hadoop而優化的數據轉換環境;還有PowerCenter大數據版在減少新技術風險、降低大數據項目成本方面頗具優勢。
Red Hat和Hortonworks擴展大數據戰略聯盟,通過緊密整合HDP和開放式混合云技術,為客戶部署下一代大數據應用程序。
Pivotal推出的Pivotal大數據套件(Pivotal Big Data Suite)整合了Pivotal所有領先的數據技術,客戶可以隨時隨地按需使用其中的任何一種技術。
NetApp的存儲產品 Filer 可提供簡單、快速、可靠、可擴展的數據管理解決方案,解決數據共享、數據保護、數據管理等一系列問題。
對tweet、支付、簽到和一些與互聯網相關的問題進行了分析,為客戶提供了很好的數據分析支持,客戶只需在幾天就能安裝和運行。
Clustrix可以為SQL數據庫提供專利數據應用方法,幫助人們處理大量的數據,使SQL數據庫無限擴容成為可能。
在收購ParAccel之后,Actian的數據庫產品套件包因為引入了大數據能力而會變得更加豐富。其分析工具SecureAlert能夠識別犯罪行為,并向執法機構提供了參考性較高的犯罪預測。
1010data以電子表格的形式為用戶提供大數據的處理界面。
parStream是入圍的唯一一家“快數據”公司,其產品能夠實時分析海量結構化和半結構化數據。
10Gen最具影響力的得意佳作要數其開源MongoDB——一款業界領先的NoSQL數據庫。該公司的戰略投資伙伴包括英特爾、紅帽以及In-Q-Tel。
Tableau專注于將數據可視化應用在地圖上。
MapR已將一套特殊功能融入其Hadoop發行版中。例如網絡文件系統(NFS)、災難恢復以及高可用性功能,還有最具代表性的NoSQL數據庫M7。
MarkLogic為非結構化數據配備了自己的數據庫, MarkLogic Server。
Syncsort在高性能數據處理、數據集成以及數據保護與恢復軟件上頗具實力。
NoSQL數據庫的初創企業,其商業模式是與大型企業合作推廣其旗艦產品Couchbase Server。
Datameer分析解決方案(DAS)是一款面向Hadoop、針對企業用戶的商業智能(BI)平臺,可通過JDBC、Hive、HTTP或其他標準,連接到任何數據源。
在分析數據庫Sybase IQ 15.4中,添加了如MapReduce API、對預測模型語言的支持、集成的Hadoop以及擴展數據挖掘算法函數庫等功能。
大數據特色介紹
阿里巴巴擁有交易數據和信用數據,更多是在搭建數據的流通、收集和分享的底層架構。
華為云服務整合了高性能的計算和存儲能力,為大數據的挖掘和分析提供專業穩定的IT基礎設施平臺,近來華為大數據存儲實現了統一管理40PB文件系統
百度的優勢體現在海量的數據、沉淀十多年的用戶行為數據、自然語言處理能力和深度學習領域的前沿研究。近來百度正式發布大數據引擎,將在政府、醫療、金融、零售、教育等傳統領域率先開展對外合作。
浪潮互聯網大數據采集中心已經采集超過2PB數據,并已建立5大類數據分類處理算法。近日成功發布海量存儲系統的最新代表產品AS130000。
騰訊擁有用戶關系數據和基于此產生的社交數據,騰訊的思路主要是用數據改進產品,注重QZONE、微信、電商等產品的后端數據打通。
中興通訊推出的“聚焦ICT服務的高效數據中心整體服務解決方案”,可幫助運營商有效解決大數據時代建設IDC面臨的大部分問題,提升運營商ICT融合服務能力。
中科曙光XData大數據一體機可實現任務自動分解,并在多數據模塊上并行執行,全面提高了復雜查詢條件下的效率。
勝天成自主研發的大數據產品“i維數據”,頗具創新,近期又與IBM達成戰略合作關系,涵蓋Linux on Power市場、智慧城市、存儲業務、管理服務、咨詢與應用管理服務。
神州數碼啟動了“智慧城市”戰略布局,先后推出了市民融合服務平臺、自助終端服務平臺等產品,并在佛山、武漢等智慧城市建設中實踐運用。
用友在商業分析、大數據處理等領域進行研發,先后推出了用友BQ、用友AE等產品。
東軟大數據戰略以醫療行業為突破口,憑借在社保、醫療行業積累的資源,搭建了東軟熙康這一智慧醫療平臺。
金蝶KBI與金蝶ERP無縫集成,實現BI數據采集——集成——分析決策支持的一體化應用。
寶德大數據云備份,是一個專為大數據而設的云備份方案,支持實體機及虛擬機備份,而且具有無限擴充的可能,并且完全自動。
大數據時代的IP治理和審計,啟明星辰提供了終端審計、終端數據防泄露、日志審計,通過綜合審計平臺來幫助用戶解決IP治理需求等解決方案。
通過收購天行網安,可以拓展在公安行業的應用,目前正著力開拓行業應用市場,挖掘各個產業鏈中的大數據價值。
零售、證券、生物、政府等都是榮之聯大數據業務的主要目標行業,已為零售業提供了大數據分析的解決方案,解決了庫存問題。
作為國內領先的高端IT綜合服務商,主要服務于金融業的大數據。
專注于公安市場,其業務包括電子數據取證、電子數據鑒定、網絡輿情分析、數字維權、公證云、搜索云以及取證云服務。
國內存儲技術與服務供應商賽思信安推出了自主研發的大數據管理系統,適用范圍包括互聯網、公眾服務、商業智能、金融、醫療衛生、能源等多個行業。
作為大數據、食品安全、法務軟件等相關熱門行業軟件,同時也是公安領域大數據的上市公司。
天璣科技的數據中心運維管理服務,為大數據的分析能力提供了強大的后臺支撐和保障。
東方國信主營業務為企業商業智能軟件及系統解決方案,收購北科億力和科瑞明,有效拓展了工業和金融大數據領域。
華三全融合虛擬化網絡技術能夠極大簡化網絡結構,減輕網絡管理和維護量,為企業數據中心大規模建設提供最強有力的技術支持。
??低暬谟⑻貭朒adoop發行版,并融合可以靈活按需調配IT資源對應用和服務進行支持的開放架構云計算技術,打造出了視頻智能云計算方案。
高德與阿里將在地圖搜索、產品商業化、數據共享、云計算等領域展開合作,特別是在數據共享方面,高德和阿里巴巴將共建一個大數據服務體系。
作為提供導航地圖、地理信息系統軟件建設的內容提供商,現在已嘗試使用大數據為政府部門提供決策。
專注于商業智能領域(BI)、數據倉庫領域、數據庫領域的專業咨詢、項目實施、軟件開發、系統集成等方面,為金融、電信、快速消費品等行業提供相應方案。
信合運通專注于為運營商和行業客戶提供基于大數據的深度分析和挖掘技術、渠道支撐服務及行業解決方案。
專注于從事數據可視化,可為客戶提供數據可視化的創意設計、制作和軟硬件集成系統服務。
在國內唯一以企業大數據分析的角度對有投資價值和并購價值的企業進行價值判斷,持續跟蹤企業動態變化的金融大數據公司。
永洪BI通過完全自主知識產權的數據集市產品(Z-Data Mart)支持大數據,Z-Data Mart匯聚了數十項自有專利,涵蓋了分布式存儲和計算、分布式傳輸和實時通信等關鍵領域。
作為大數據服務提供商,其DataQuate解決方案主要用于解決運營商大數據的接入、挖掘及應用,為運營商大數據的價值轉化提供端到端服務。
以數據挖掘為核心、以商業智能和精準營銷為主線、以SAAS云平臺為主要服務模式,目前專注于電商領域,為客戶提供行業領先的數據分析和精準營銷平臺服務。
致力于為浙江、全國公安交通管理行業提供一流的信息化服務、產品和方案解決能力,其借助英特爾Hadoop分發版,已解決了大數據的采集和處理問題。
勒卡斯是致力于為客戶提供全方位直復營銷解決方案和服務的大數據公司,主要有潛客溝通、會員管理、CRM軟件定制及客戶市場調研四大業務。
專業數據采集系統的制造商。
主要做中國主流社交平臺的“大數據”分析,通過整合各大社交平臺的用戶數據、行為數據和 UGC 內容,為企業和個人用戶提供定制化服務。
數據中心擁有基于OLAP技術的強大交互式數據挖掘平臺,可提供不同深度的分析報告,滿足不同視角的數據挖掘和分析需求。
今日發布了醫療領域的大數據“未病”預警云服務“康諾云”,有針對個人健康管理而設計的云律血壓節律儀、云悅體質分析儀和云動智能健康監測腕表3款智能硬件。
主要為電子商務企業提供站內流量轉化和商業智能分析的整體優化解決方案,旗下有推薦引擎技術平臺以及跨網站消費偏好平臺。產品主要有BRE和BAE。
AdMaster是國內少有的第三方數字營銷監測和調研機構,專注于為廣告主提供全流程的網絡廣告效果監測、分析評估、媒介優化咨詢和技術解決方案等服務。
介紹
一個分布式系統基礎架構,不僅可以運行在商用硬件系統,還可以輕松地集成結構化、半結構化和甚至非結構化數據集。
用于處理高速、大型數據流的分布式實時計算系統,為Apache Hadoop添加了可靠的實時數據處理功能,同時還增加了低延遲的儀表板、安全警報。
Spark是一個基于內存計算的開源的集群計算系統,用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且運行速度比MapReduce快100倍。
高性能計算與通信,是美國實施信息高速公路而上實施的計劃。
世界最老牌的數據分析、數據挖掘軟件,憑借Visual Analytics軟件進入到大數據領域。
用于統計分析的R語言有個擴展R + Hadoop,可以在Hadoop集群上運行R代碼。
將數據分析、分類以及篩選的算法引入Hadoop集群當中,輕松實現了大數據的分析、挖掘工作。
作為全球應用最廣泛的統計分析軟件,可用于統計學分析運算、數據挖掘、預測分析和決策支持。
RapidMiner是世界領先的數據挖掘解決方案,其數據挖掘任務涉及范圍廣泛,包括各種數據藝術,能簡化數據挖掘過程的設計和評價。
Apache Drill 實現了 Google's Dremel,有助于Hadoop用戶實現更快查詢海量數據集的目的。