束楊宇 安徽問天量子科技股份有限公司
大數據是巨量資料,這些資料運用普通的軟件是無法進行搜集、整理、分析、運用的,大數據需要借助一些新型模式或途徑才能獲取,約翰.羅瑟曾指出,大數據是計算機無法捕捉到的數據,原因就在于大數據量大到使計算機也無能為力,因此需要借助其他軟件才能收集并分析運用。
⑴量大。大數據數量空前壯大,不管什么行業什么時間段,都需要各種各樣的數據,數據的計量字節的發展也體現了量大這一特點。
⑵多樣。大數據的類型多種多樣,種類繁多,包括文字、圖片、表格、音頻、視頻等信息。
⑶快速。大數據的搜集、整理、分析、應用等各個環節的速度都很快。
⑷復雜。形形色色的數據內在顯示著復雜性,其來源途徑多而廣,比較復雜。
⑸可變。數據不是一成不變的,而是隨著技術更新、社會發展而不斷變化的,這一特點在一定程度上不利于管理各種數據。
統計軟件是可以進行數據采集、錄入、整合、分析等事項的軟件工具。大數據分為結構化、半結構化、非結構化數據,對于不同的數據,采用不同的軟件進行分析,結構化數據可以采用Excel、SPSS、Stata等軟件,半結構化和非結構化數據可以采用Python和R等進行分析。
醫療行業中涉及很多數據,包括各個患者的信息,醫務人員的信息,藥品以及醫療過程等復雜的數據,通過應用一些統計軟件比如SPSS、Eviews、R等,可以為患者、醫務人員建立完善的信息資料庫,也可以為醫療機構的各種醫療信息提供備案,還可以通過對這些信息的分析進行相關的預測,進而可以更好地完善醫療機構,使得醫療工作變得安全、高效與便利。
在教學工作中,大多數教工人員對于數據的分析僅僅局限于學生的出勤率、請假情況、遲到早退情況、某次考試的成績情況,比如最高分、最低分、平均分、及格率等內容,這些數據分析太過于簡單,不能從根本上對某位學生進行評判,不利于完全了解學生的情況,也不利于教工根據數據分析的結果制定相應的教學計劃,需要運用相關的軟件進行數據分析,運用SPSS軟件可以很好地對學生的試卷進行系統分析,可以發現其薄弱環節,更加全面科學地評估教學活動,進而不斷改善,提高教學質量。
通信工具在生活中的作用不亞于柴米油鹽,通信行業的發展關乎每個人的生活質量,當今,通信行業中存在一些比較嚴重的問題,競爭也比較激烈,統計軟件如果能夠運用得當,可以有效促進通信技術的開發與應用,進而提高通信企業的經營效益。通過SPSS、Stata等軟件的應用,可以預測客戶的行為,發現企業自身缺陷,進而制定相應的策略,還能夠通過大數據分析,對于通信企業的業務進行監控、整合、預測,分析出潛在市場的需求,及時更新技術、開展新業務,從而迎合市場需要,獲得效益。
數據分析中,云計算的涉及范圍已經越來越廣泛,云處理是產生并管理大數據的重要方式,單純依靠一些統計軟件進行數據分析在如今是可以應付的,但是隨著數據數量的不斷增多,人們對此要求越來越高,行業發展復雜程度越來越大,統計軟件應該與云計算、物聯網等新興形態緊密結合起來,不斷改進軟件的功能,使得統計軟件能適應更加復雜多樣的數據背景,這樣,數據分析才會真正做到益民益社會。
如今統計軟件的種類與功能已經算得上比較豐富與完善了,但是社會發展日新月異,大數據時代還會繼續發展,我們不會滿足于當前,隨著統計學、計算機知識等理論的不斷發展補充,數據挖掘、人工智能等技術也會不斷發展起來,統計軟件的一些開發、應用的理論知識會得到突破性進展,到那時,統計軟件在數據分析中的作用將會更加明顯與突出,新型軟件會讓數據分析工作變得更加簡便、準確、可靠與高效。
現在大多數家庭、企業或者單位使用比較頻繁的統計軟件包括Excel、SPSS、SAS、R等,其一個重要原因就是容易獲得且操作較簡單,尤其是Excel、R等軟件,而SPSS、SAS等軟件雖常見,但還是盜版產品居多,隨著社會科技發展水平不斷提高,人們的法律意識、維權觀念不斷增強,對產品的要求越來越高,價格便宜合理且使用簡便的統計軟件將會受到廣大用戶認可,因此,軟件開發商應該順應市場需求,加大軟件開發投入,迎合市場需求,多開發出價格合理且功能有保障的統計軟件,只有這樣,在大數據背景下,統計軟件在數據分析中的地位會越來越重要,人們會運用統計軟件更好地促進社會發展,造福人類。
[1]張文霖.數據分析初體驗[J].數據,2013(05)
[2]古福.讓大數據分析更快速、更簡化[J].互聯網周刊,2013(11)