周保健 對外經濟貿易大學統計學院在職人員高級課程研修班學員
在傳統的時代,我們要想對處理數據進行有效的分析,就必須要依靠人工開展一系列的統計工作。這種工作的效率不僅非常低下,工作的準確性也難以得到保障。而隨著當前科學技術的不斷發展,在信息時代的背景下,大數據也進入了一個全新的發展階段。如今,社會中各個領域通常通過大數據技術來幫助人們的生產和經濟活動。因此,分析大量數據的方法發展迅速,引起了社會各界的注意。研究表明,得益于信息和數理統計,人們可以通過數據布局規則更好地找到數據之間的正確性,并理解關聯的重要性和大數據的隱藏值。中國有關科學家在數理統計分析過程中引進了先進的科技成果。通過這種方式,可以在來自大型數據庫的大型數據和不斷變化的數據趨勢中找到規則。本文就在大數據背景下以研究計算機技術和梳理技術的必要性為切入點,探討計算機技術與數理統計技術相結合后共同處理數據的可能性,為信息時代大數據與數理統計工作的研究提供理論成果。
互聯網時代,人們的生活發生了巨大的變化,中國的各個領域也進入了信息時代。多虧了互聯網,我們每天接觸的信息在口譯方面呈現出增加的趨勢。雖然互聯網大大縮短了人與人之間的時間和空間,但目前互聯網上的數據洪流也變得更加嚴重。在中國的學術研究中發現,在互聯網時代,人們不僅可以用大數據提問和收集他們需要的所有類型的信息,還可以通過適當的信息在不同學科之間建立密切的交流與合作。在大數據環境下,人們每天都會接觸到大量的信息,這在一定程度上促進了人與數據信息之間的交流與合作。通過分析數據信息,人們可以接受數據分析的結果作為與自己生活相關的參考因素。大數據時代的互聯網經濟發展中,大數據技術應用已經成為具有代表性的先進信息技術應用之一,保證互聯網企業的良好發展和穩定運行,是離不開大數據技術的,我國的互聯網產業在大數據技術的支持下不斷探索和創新。針對大數據技術的應用,相關人員應加強對大數據技術的不斷優化和探索,結合互聯網經濟發展的實際需求,使大數據技術的應用實現更進一步的更新,優化互聯網環境,保證互聯網的良好經濟發展態勢。例如,如果人們在網上購物時無法獲得實物產品,消費者可以使用賣家對商品的描述以及其他買家評論中的相關數據作為購買參考。這種現象也稱為數據分析。因此,處理和分析人們生活中的經濟數據的需要更加迫切。也正因此,在當前信息時代發展的大背景下,對計算機技術和數理統計進行有效的研究,既能夠推動計算機技術的蓬勃發展,同樣也加快了數理統計的發展進程。
計算機技術主要研究隨機數據的數量特征。另一方面,數理統計中的數據統計主要是指在互聯網環境下對相關數據進行統計和分析。目前,數理統計在我國的科學實驗、藥品檢驗、數據統計等領域得到了廣泛的應用。將計算機技術與數理統計相結合,可以準確地找到相關數據,并對具有相同特征的數據進行正確分類。在這個過程中,大量不正確的數據會給使用帶來實際意義和價值。此外,在數據分析過程中,計算機技術可以提供與統計所需數據相當的基本信息,數理統計也可以在計算機技術分析過程中提供相關的理論知識,以便更好地處理數據。經過文獻調研和信息檢索等方式,文章選取可能影響我國經濟發展的相關因素,包括國內生產總值、人民幣兌美元匯率、全社會固定資產投資、實際利用外資額、居民消費水平指數、中國外匯儲備。收集了我國1989年到2019年相關經濟指標數據,利用大數據與數理統計建立如下ARCH預警方法模型:

其中Y為被解釋變量,代表我國年度經濟發展,Xi(i=1,2,3,4,5,6)為解釋變量,代表選取的六個經濟影響因素指標,β0表示截距項,它表示解釋變量均為0時候,被解釋變量的數值情況,是不受解釋變量影響的我國經濟發展起始值。βi(i=1,2,3,4,5,6)代表斜率項系數,表示當解釋變量Xi(i=1,2,3,4,5,6)變動1個單位,被解釋變量Y相應的變化β1、β2、β3、β4、β5、β6個單位,ε表示隨機誤差,將影響Y的其他因素歸入其中。根據大數據與數理統計構建的ARCH預警方法模型,選取我國年度經濟發展Y作為因變量,以我國國內生產總值X1、人民幣兌美元匯率X2、我國全社會固定資產投資X3、實際利用外資額X4、居民消費水平指數X5以及中國外匯儲備X6這幾個經濟指標作為自變量,通過線性回歸和指標的檢測,以確定對我國經濟發展有明顯影響的經濟指標。同時研究篩選出來的各個經濟指標對我國經濟發展的影響大小,并進行預測分析。通過對這幾個經濟指標的有效研究,就能夠分析出這幾個經濟指標對我國經濟發展的影響,從而依據此原則,制定合適有效的經濟發展策略。
由于信息技術、互聯網技術的飛速發展,傳統的數據處理方法已經不能滿足當前的需要。即使使用傳統的數據處理方法,也會導致數據分析結果與實際情況之間出現一些差異。這主要是因為傳統數據處理方法的表面相關性相對狹窄,因此數據量相對較小,而將概念理論和數理統計應用到大數據中,可以實現人與數據的有機結合。然后,根據這種社會身份和不同社會群體的作用,我們可以分析這些群體在生活過程中的適當選擇和結果。此外,在大數據環境下,可以為計算機技術和數理統計提供有效的研究條件和物質支持。尤其是對大數據本身特點的分析,可以通過網絡和基本信息手段,對基本的數據進行快速的收集和分類。在利用計算機技術和數理公式對數據進行進一步的分析,了解數據背后所表現的具體 含義。
在創建一個包含大量經濟數據和數理統計的操作體系的過程中,我們應該緊跟當前社會主義市場經濟的本質。在改革過程中,我們應該調整市場資源的比例,始終以保護知識產權、單一的市場結構、平等的市場交換、可持續和公平的出口、有效的監督和維護契約精神為基本方向,逐步建立現代社會主義經濟和法律制度。然而,中國目前建立大數據和經濟體系方面的基礎相對薄弱,公司內外的法律體系需要完善,建設水平與建設中國社會主義制度的預期目標存在很大差距。因此,根據規則,當前的市場來源大力推動多元化、系統化、理性化改革,符合經濟運行原則。大數據和數理統計工作體系的建設是以大經濟數據和數理統計工作體系為基礎,加強企業改革措施,激發改革企業的利益。根據以上經濟大數據與數理統計工作模型,以社會固定資產投資金額、居民消費水平指數、中國外匯儲備為自變量,預測得出2010—2019年我國經濟發展數值。通過對比預測值和真實值的差額的絕對值得出誤差值,誤差值除以真實值得到誤差率。可以看出,該模型在2010—2019年的誤差率基本都在0.06以內,模型擬合度整體很好,也意味著我國經濟發展受社會固定資產投資、居民消費水平指數以及中國的外匯儲備影響很大,該模型在實踐中具有較高的參考價值。
從大數據與數理統計工作可以看出,經濟常數不變,若調整后經濟常數,由于經濟常數中會摻雜解釋變量對擬合優度的影響,因此引入調整后,由上可知的兩項數據都很大,都超過了98%,表明模型對該樣本的擬合優度非常高。使用F檢驗確認該經濟大數據與數理統計工作方程總體顯著性,首先,提出原假設H0:β1=β2=β3=β4=β5=β6=0,給定顯著性水平α=0.05,F統計值的P值為0.000,遠小于0.05的顯著性水平,因此可認為該ARCH預警方法方程整體上顯著成立。表明如上描述的幾個經濟指標聯合起來對于我國經濟發展影響顯著。也正因此,原本相對較復雜的經濟發展情況,用幾個簡單的指標就可以代替,這也可以看出,當前為了能夠提高大數據的處理技術,我國的計算機技術和數據統計技術都得到了更快的發展,綜合能力都得到了有效的提升。
大數據環境為計算機技術和數理統計提供了一定的研究基礎和研究條件。此外,通過收集大量數據和分析復雜數據,可以更加協調和分析原始復合數據,以有效確保數據的完整性。在大型環境中,數據分析員接觸的通常是第一批數據。對這部分數據的有效分析可能反映這個社會的真實面貌。此外,當前的計算機技術和數理統計形成了一種相對標準化的研究形式,能夠滿足當前數據的分析需求。
在這個階段,中國不同地區的許多公司通常使用經濟數據管理來分析公司的業務流程。通過分析業務流程中產生的大量數據,可以確保業務的順利發展,預測業務的未來狀態,提高業務的業務效益。經濟效益分析,可借助大數據與數理統計工作,從回歸系數顯著性檢驗的數值可以看出β0、β1、β2、β3、β4、β5、β6的t統計量的P值中,只有β3、β5、β6的t統計量的P值小于0.05,呈現出小概率事件,即拒絕原假設βi=0(i=3,5,6),而β0、β1、β2、β4的t統計量的P值均大于0.05,不拒絕原假設βi=0(i=0,1,2,4)。綜上可得解釋變量X3,X5,X6對被解釋變量Y影響顯著,其他變量的影響并不顯著,即中國全社會固定資產投資、居民消費水平指數、中國外匯儲備對我國進出口影響顯著。
通過上述對于信息時代背景下,大數據以及數理統計的分析,我們對于基本的情況已經有了一定的了解。可以發現,在當前大數據的環境,無論是計算機技術還是數據統計都進入了一個全新的發展階段,實現三者的有機統一,能夠有效的對原始數據進行協調和分析,從而提高數據使用的質量和綜合效率。而尤其是對于一些相對來說較復雜的數據,可以通過有效的協調和分析能力,反映當前社會發展的整體面貌。本文討論的大數據和數理統計的工作方法主要基于市場經濟中大數據的結構,作為多目標監測方法部署的結果,它評估了不同部署規模下大數據和數理統計的故障,并監測和補充了其他延時的經濟數據。進一步豐富大數據和數學統計業務狀態監測結果,有利于對市場經濟進行調節,提高市場經濟的發展健康狀況。而隨著未來經濟發展水平的不斷提高,在信息時代的大背景下,夠有效地做到大數據與數理公式的融合發展,實現數據的有效利用。