中科軟科技股份有限公司 趙凱
應用統計學作為教育領域的基礎學科,與人類的日常生活和工作模式密切相關。尤其是在進入大數據時代后,應用統計學可以利用數學公式計算和數據分析等方式解決科研數據問題。雖然大數據技術研究方向與應用統計學學科研究之間具有明顯差異,但結合實踐累積經驗分析發現,兩者可以進行融合聯系更好的解決問題。在大數據時代背景下有效對接大數據技術和應用統計學作為目前學術界探討的主要課題。本文在了解應用統計學概念的基礎上,根據大數據與應用統計學之間的關系,分析在大數據背景下如何應用和創新發展應用統計學,以此為現代經濟建設發展提供技術支撐。
統計學做一門基礎研究學科,是指通過搜索、整理、分析、描述數據等方式,判斷分析檢測對象的本質或未來,實際應用范圍幾乎覆蓋了社會科學和自然科學的各個領域,通常認為統計學理論研究源于古希臘的亞里士多德時代,發展至今已有2300 多年的歷史。但是在進入大數據時代后,傳統統計學從某種角度上來講,已經無法滿足時代快速發展需求,因此要在原有發展的基礎上進行應用創新。現如今大數據革命正以勢不可擋的姿態席卷全世界,為各國領域的技術發展產生了重大影響和沖擊,其中最具代表性的就是應用統計學。因此,本文主要研究應用統計學在大數據背景下的應用與創新發展。
應用統計學主要研究統計學的基本理論和應用方法,以此解決不同領域的實際問題。相關研究涉及到統計調查、數據管理、數據分析等。從實踐應用角度來看,工作人員會先收集有關數據信息,而后在預處理和整理分析中,總結出未來的發展趨勢[1]。統計學作為一門古老的研究學科,包含知識面非常廣,因此在現實生活中應用存在數據混亂、數據遺漏等問題。在當今社會環境中,人類在成長過程中都會留下特定或巧合性的規律,為了尋找這種規律以及適應這種情況,于是誕生了統計學這門學科。由于這門學科在日常生活中具有極強的應用性,要利用大數據技術準確記錄下來,運用計算機處理和分析數據信息,并在對比分析中發掘更多有價值的內容。
在1998 年首次提出大數據概念后,各國學者的科研活動發生了巨大變化。在研究初期,大數據只作為數據參考,但是隨著互聯網技術的不斷發展,大數據被看作是一種有效資源,在多個領域中應用都可以取得精準的預測效果。應用統計學作為主要研究數據的一門學科,在長久發展中已經具備較為完善的應用系統,并在各種科學學派和通用信息學派之間的相互對抗中,在現代科學領域展現出了積極作用[2]。在大數據時代背景下,人們面臨的數據信息越來越多,開始通過系統整理獲取更多內容,而應用統計學獲取的數據需要經過精細對比研究獲取更加準確的答案。
面對當前社會發展現狀,應用統計學更加適合計算大量數據。通過運用較為穩定的基礎知識收集數據,設計并且處理一些包含數據的工作,最終可以在分析探討中處理相關問題。需要注意的是,在統計過程中要利用計算機輔助技術完成數據化分析。從近年來應用統計學發展情況來看,應用統計學主要研究方向是針對數據展開各種統計和分析,其中應用統計學為大數據的發展奠定了一個扎實的基礎,目前大數據領域的眾多數據分析技術都發展自應用統計學研究。其中數據比較分析是最常見的應用研究領域,相關數據調查研究分析體系也比較完善。在進入大數據時代后,通過有效調整研究內容、調查方向、數據采集等,會結合未來發展方向和大數據帶來的具體效果,逐步擴展應用統計學的發展范圍。由此可見,大數據浪潮已經直接影響了應用統計學的未來發展方向,相關技術發展的應用統計學研究調查提供了有力支持,因此要從應用統計學的數據收集入手,基于大數據浪潮進行資源創新,最終獲取符合新時代要求的發展途徑。
(1)數據預處理。在大數據時代的影響下,應用統計學在處理大批量的信息資料時,非常重視數據的預處理工作,其中涉及到清洗、糾正、填補等多個環節。為了檢查這項操作具有合理性和規范性,科研學者可以利用抽樣調查的形式,準確判斷數據集合是否存在問題。以大數據為核心的技術軟件能夠解決比如更新速度較慢、數據信號單一、花費時間較長等問題,可以盡量糾正出現錯誤的數據信息,以此在統籌管理中達成決策目標[2]。
(2)大數據抽樣。從實踐應用角度來看,統計學抽樣要在明確具體條件后,在多種數據信息中隨機挑選內容統計分析;大數據抽樣是在眾多動態化的數據信息中,選擇具有代表性的內容統計分析,以此得到具有精確度和完善性的計算結果。通過對比兩種不同的方式可以發現,后者既可以掌握某些內容的內在聯系,又能滿足數據研究的動態性、關聯性、適應性等要求。在以往統計學中,廣泛運用的人工篩選方法存在技術局限性,而大數據抽樣能在持續獲取數據樣本的基礎上,利用軟件硬件得到完善的計算結果。
(3)大數據分析。以往統計學分析的工作非常繁瑣,既要準確選擇某一項目的樣本數據,又要根據變量之間的各種關系進行深層研究。在大數據時代背景下,有關數據分析工作的統籌能力更強,實際包容性更大,所以可以將不同環境的數據資源整合到一起,最終得到較為正確的數據統計結果,降低中間數據的參與率[3]。
(4)網絡圖模型建構。從大數據時代發展角度來看,最大的特征就是建立推廣網絡平臺。而以往統計學只能進行線下統計計算,常見方式以調查問卷、學校課題等研究為主。在大數據時代背景下,為應用統計學構建網絡平臺,能讓系統用戶從多角度入手發掘更多信息,并將用戶在平臺上的所有信息看作基礎依據,基于信息技術的革新發展,開發建設對應的處理軟件。比如說,當前市場提出的高維數據處理工具,既可以準確計算事件的概率,又能構建數據因果關系圖,這符合新時代下信息的傳播應用。
從宏觀角度來看,研究大數據時代特征可知,原本的細分化工作開始向著統一化的方向穩步革新,要求統計學整合運用所有數據和技術軟件,在科學規劃中分析不同領域的信息資源。對比以往提出的專家模式分析可知,大數據技術作為綜合專家,可以在深層挖掘中掌握更多有價值的內容,且能同時解決多領域的信息問題。從長遠發展角度來看,以大數據為核心的應用統計學,可以在發現問題的同時有效解決問題[4]。根據這一特征分析可知,大數據時代為統計學變革提出了以下兩個方向:一方面,弱化傳統數據的統計職能。傳統統計學會安排專業部門負責處理數據信息的研究工作,而大數據技術會整合運用計算機軟件獲取結果,并運用到生產決策當中;另一方面,改變傳統統計學的研究模式。以往統計學工作需要消耗大量紙質資源,而大數據則優先選用計算機技術軟件,既可以為部門資源共享提供有力渠道,又能加快信息的傳播速度,提高結果分析的效率和質量。
可持續發展作為社會進步及學科創新必然遵守的基本原則,在大數據時代背景下,面對機遇和挑戰并存的市場環境科研學者更需要用辯證和發展的眼光來看待統計學發展。現如今,大數據作為一個具有統一性、創新性、時代性的技術框架,應用統計學只屬于其中的基礎組成部分,將其融入到學科研究和技術創新中,可以為其提供全新的發展思路[5]。以往統計學分析和計算都具有技術局限性,因此在大數據時代下,為了保障數據信息的完善性和透明性,科研學者在研究中提出要隨機挑選信息,嚴格遵守“以小見大”的計算原則,獲取完善的統計結果。從實踐研究角度來看,以大數據思維為核心的應用統計學,既可以解決傳統數據復雜、信息整理難等問題,又能將所有信息看作計算分析的重要依據。由于以往統計學研究會出現結果并存的情況,這需要在簡化數據信息內容的基礎上得到更加準確的結果,而后再進行計算分析。但在大數據技術加持下科研人員不需要刪減數據,可以直接搜索相關內容,此舉可以保障數據分析精確性,又能降低數據出現誤差的概率。由此可見,在大數據環境下的應用統計學技術方法,更符合新時代下的發展需求,因此要繼續拓展應用統計學的研究體系,提出更多分析研究的方法。
以往統計學在分類數據信息時,需要先準確定義分類內容,再進行有效分類,而后按照定義的標簽有針對性地收集數據信息。雖然這種方式可以更便捷地尋找所需內容,但從數據統計過程來看,所有信息都會固定在已有框架中,實踐操作流程非常單一。從數據預處理過程來看,分類和梳理是兩個非常重要的操作環節,員工在操作期間的工作質量直接決定了計算結果。在大數據環境的影響下,不管是數據分析還是獲取形式,都具有開放性、多源性、豐富性等特征,因此只需要設定好信息類型就可以按照分類標識和關系判斷分類,能在不同領域篩選統計所需信息。需要注意的是,在研究期間所有信息數據的需求條件并不是確定的,可以選擇的收獲渠道和儲存方式很多,因此不能按照統一標準來設定要求[6]。基于大數據環境下的應用統計學,能在數據預處理中獲取所需信息,并在計算分析時達到預期要求。尤其是在數據分類過程中,可以選擇的處理方式有很多,需要考慮的分析條件也會隨之增加,這就證明以往統計學并不符合大數據時代下的統計研究需求。因此應用統計學的未來發展,要在保留原有方法優勢的同時,繼續開發研究全新的分類和梳理技術,注重結合大數據環境下的數據特征進行優化創新,只有這樣才能滿足全新時代環境的要求。
在大數據環境中包容性和融合性是最為關鍵的特征之一,因此傳統統計學的研究方法只會讓其發展陷入困境中,無法進行技術創新,破解難題。大數據會在收集大量數據信息后,在總結分析中判斷不同時期的狀態和形式,也可以結合數據變化規律,推導出總體發展趨勢和發展方向,為不同領域的決策者提供有效依據,幫助其制定具有前瞻性和規范性的管理決策。傳統統計學主要是利用具體的數據信息,總結推斷數據信息的總體特征,但是這種形式掌握動態化的數據發展,個體可以得到的知識信息并不多。從長遠發展角度來看,傳統統計學雖然也可以對數據信息及其規律進行深層研究,能幫助各領域推導出發展趨勢和發展方向,但是最終結果并不完善,也很難保障數據分析的精確度。同時,傳統統計學還會利用演繹推理法進行研究,需要深層挖掘數據信息的緊密聯系,快速掌握不同事物的變化趨勢,以此根據以往經驗推導事物的未來進程[7]。這種方法得到的最終結論具有研究價值,會根據變化期間的細節排除事件的偶發性,因此在現代應用統計學發展中具有積極作用。結合實踐研究獲取的結論分析可知,統計學方法會將多種單一化的方式整合到一起,同時解決一個問題,這樣不僅能進一步提高統計分析方法的效率和質量,還可以全面掌控數據信息的發展規律和變化趨勢。
綜上所述,應用統計學作為一門應用范圍較廣、包含知識較多的基礎學科。在大數據時代背景下,被廣泛運用在多個技術領域中,加快了我國社會經濟和城市建設的發展步伐。從實踐應用角度來看,市場經濟的宏觀調查、政府部門的數據整理、社會環境的調查評估、城市人口的全面普查等都需要運用統計學知識和技術,因此雖然目前我國應用統計學的教學現狀不容樂觀,但在大數據時代的引導下,應用統計學在整合以往累積經驗的基礎上,根據不同領域的應用需求和數據特征,各國學者在實踐探究中提出了多項研究課題,并從中收獲了大量有價值的數據信息。
引用
[1] 高文濱,楊映瑤.應用統計學在大數據背景下的應用與創新[J].江蘇科技信息,2019,36(19):68-70.
[2] 姚昕金.大數據視角下應用統計學的創新發展研究[J].商情,2020(7):262+264.
[3] 王慧芳.大數據背景下經管類專業統計學課程改革與創新研究[J].科教文匯,2021(17):128-130.
[4] 馬艷芝.標準大數據下統計學教學的探索與實踐[J].大眾標準化,2021(22):116-118.
[5] 直敏,高天哲,孫楊.基于大數據分析的計算機信息處理技術應用[J].計算機產品與流通,2021(2):7-8.
[6] 宮汝鋒,劉姣,丁文靜,等.基于大數據背景探究應用統計學的應用與創新[J].數字化用戶,2019,25(10):199+211.
[7] 王明明.創新創業背景下應用型民辦高校《統計學》課程教學改革探索[J].產業與科技論壇,2016,15(21):224-225.