(上海立信會計金融學院,上海 201209)
隨著世界經濟一體化的持續推進,信息技術突飛猛進,人類社會正逐步從工業經濟時代向知識信息經濟時代轉變。對于大部分行業和企業,與之相關聯的信息技術已經成為組織關鍵性的、戰略性的資源。信息系統在優化企業組織內部的知識、信息流動以及實現組織資源優化配置等方面有著舉足輕重的地位,而數據資源管理技術則是信息系統必不可少的核心技術。目前,以大數據為代表的信息化浪潮將重塑數據管理理論,推動數據管理和信息分析的技術創新。
根據勞登夫婦給出的定義,從技術上講信息系統就是一組相互關聯的能夠收集、處理、存儲和傳播信息來支持組織內部決策和控制的部件的集合。從管理信息系統的功能上來看,它可以從不同側面滿足企業各個管理層次的信息需求,同時給相應職能部門的管理活動提供支持,以使企業的管理活動更加科學有效。越來越多的企業領導者已經意識到管理信息系統的重要作用,主要體現在:一,信息是正確決策的基礎。管理者要對環境變化做出正確的決策,除了借助個人經驗進行理性判斷外,還需要收集大量正確、及時、可靠的信息。信息管理系統的應用可以提高管理決策的準確性同時兼備預測功能,并且可以減少不必要的時間花費,提高效率降低人力成本。二,信息系統可以幫助企業收集到提高銷售和市場技巧方面的數據,幫助企業降低內部成本、防止客戶流失、緊固供應商。信息管理系統是可以使公司具有強力競爭優勢的工具。最后,信息管理系統改變了人們的工作方式,使管理體制更加合理化。企業信息系統的引入使管理的分散化向集中管理轉化。使得組織的機構扁平化,企業部門組織層次減少,形成部門之間的有機結合,保證高層管理者能夠迅速對決策效果進行評價和控制。
隨著云時代的來臨,一場大數據革命正在進行。各行各業均存在大數據,根據文獻的定義,這些數據量大類多、實時性強、蘊藏巨大價值,需要搜索、處理、分析、歸納、總結其深層次的規律。普遍認為“大數據”爆發的根本原因有二:數據價值越來越受到關注以及收集處理數據的技術顯著提高。數據生產要素化使得信息系統模式和理念推陳出新,也使得大數據技術得以發展和深化??梢哉f大數據正是以信息系統這一有力載體為基礎的前沿技術,代表著今后數據分析的發展方向。
近年來隨著信息化技術的不斷發展,現有的企業管理信息系統無論是規模還是架構都很難適應在海量數據場景下的數據管理和分析,直接影響了企業形勢預判和重大決策。因此,需要創建新的能夠匹配當前大數據場景的業務系統。借助此信息系統,可從海量數據中選取最有價值含量的信息,并對其進行有效整理和邏輯分析,以期發現隱藏在繁雜數據背后的因果邏輯關系,實現對海量數據的深度應用、綜合應用和高端應用,承擔起對組織戰略應用的支撐和服務。具體來說,信息系統在大數據時代的適用技術如下所述:
不斷推進的信息化建設以及飛速增長的數據規模,都對信息系統的數據存儲能力提出了新的更高要求。為了滿足大規模數據的存儲和分析,信息系統應支持單一系統擴展至10PB以上規模,以滿足數據爆發的存儲需要。
高質量的數據是數據分析挖掘等應用行之有效的必要前提,面對企業不同部門之間產生的繁復數據,信息系統勢必需要將這些多源異構的數據進行抽取、轉換及裝載,實現數據的整合、消重,提供高質量的數據,并在此基礎上進行關聯、建模,為實戰業務提供可用的數據。
百億條記錄的檢索、上千張表的碰撞、大量的移動互聯網和社交媒體數據處理等應用,無一不對信息系統的數據分析能力提出更高的要求。
大數據的實質是對數據的管理與開發利用,要想借助大數據技術推動企業管理工作的發展和變革,在行業競爭中占得先機,技術選型非常重要。文獻指出在各路組織和技術人員的助推下,信息系統在大數據相關領域中的技術呈現出百家爭鳴的局面,在涵蓋數據收集、存儲、計算、挖掘、資源調度等方面不斷取得突破和創新,下面就以最核心的計算層和存儲層兩個維度介紹一下信息系統的相關技術路線和發展趨勢。
數據處理:無論使用何種應用,一臺服務器面對海量數據的計算仍然束手無策,而分布式計算則對此類問題的處理游刃有余。與此同時,HadoopMapReduce的重要創新便是化繁為簡把整體大數據集拆分成一個一個的小任務,并由同時運行的多個節點進行處理。這種批量處理框架常用于離線的復雜的非結構化數據處理,如ETL、數據挖掘等場景;與Hadoop的使用硬盤來存儲數據不同,Spark是基于內存的迭代計算框架,適用于需要多次操作特定數據集的應用場合;而Storm則是專門針對實時數據類型的流式計算分析框架,應用在低延遲的場景中,實現海量事件的實時分析、處理和決策。除此之外,為應對不斷增長的海量結構化數據的存儲和快速處理以及靈活的業務建模需求,信息系統所依存的數據庫必將引入分布式架構、MPP處理技術。
數據存儲:MapReduce可以將處理海量數據的任務分解至多個節點服務器同時進行。而對于分布式計算,每臺節點服務器都必須擁有數據訪問權限,這就是HDFS所具有的功能。HDFS有著高容錯性、高吞吐量的特點,適合大數據集的應用。與此同時,業內也有許多其他類型的文件系統推出,不僅能解決了傳統存儲體系結構存在的難題,又能提高存儲利用率和數據讀寫性能,可以替代HDFS作為Hadoop架構的底層文件系統/數據存儲。
不同的技術思路各有偏重。由于不同類型的組織有著不同的組織結構,業務種類繁多,大數據應用場景多樣化,只有積極引進大數據領域的先進技術,才能推動組織管理工作邁入大數據發展階段。
通過上述分析,我們不難看出,未來信息系統必將圍繞“大數據”進行建設。通過合理規劃企業信息系統的建設路線,積極引進大數據技術,企業才有可能在未來激烈的市場競爭中占據優勢地位。對未來信息系統在大數據時代的發展趨勢,具體有下面幾點思考。
作為二十一世紀最重要的戰略資源,數據信息越來越受到關注和追捧。所以,企業為了能在市場競爭中取得先機,就必須提前制定有關大數據的企業戰略。而在制訂計劃時,需要信息系統提供支持。那么,數據資源化就需要一個合理的規范和標準,以保證數據質量等要求。
云計算作為大數據的設備依托,是大數據產生的源泉。企業管理信息系統需要積極引進此類技術,主動進行技術革新,關注信息安全和接口安全等方面的新技術、新方法,為大數據革命添磚加瓦,讓大數據在計算機時代發揮出更大的作用。
信息革命如火如荼,與數據相關的云計算、大數據等一系列新概念新觀點也應運而生,這對全球企業來說是把雙刃劍。為了把握機遇,積極迎接挑戰,在行業競爭中拔得頭籌,設計建立一個合適的企業管理信息系統意義重大。只有以信息系統平臺為基礎,實現企業信息共享,才能深度利用海量數據背后的有利信息,在競爭者中脫穎而出。更重要的是,大數據儼然成為信息時代一種最重要的資源,各個領域和各部門都受到其影響,從這一層面上來說,大數據對于推動國民經濟發展舉足輕重。