徐藝歌


【摘要】? ? 隨著計算機、電子通信等現代化信息技術的迅速發展和技術的逐漸成熟,當下人類社會已經進入到了深化發展時期的信息時代,與之相應的就是基于信息時代下多種現代化信息設備及技術而產生的種類豐富多樣、傳播便捷迅速、價值密度高且總信息量龐大的數據,即意味著人類社會進程邁入大數據時代,而基于大數據時代背景下數據的高效率收集、安全存儲、正確分類處理、具有邏輯性的分析成為了當下發展的熱點以及未來市場潛力挖掘的有效途徑,本文就通過對相關文獻的閱讀,闡述大數據挖掘的有效途徑——統計學分析技術在多領域中的應用,以實現對統計學的進一步認識,為更好的挖掘其價值發揮作用。
【關鍵詞】? ? 大數據? ? 統計學? ? 應用
引言:
隨著信息時代進程的不斷推進,每個人所扮演的角色不再僅僅是信息的接收者,同時也在扮演著信息的發出者,因此各行各業會在日積月累中形成極為龐大的數據量,這些數據可能會存在著一些規律和對某種未來發展方向的預測價值,統計學作為一種重要的信息分類方式和價值挖掘手段,在各個領域的數據分析處理中發揮了重要的作用,成為極為重要的科研方法之一,本文就從統計學分析方法在金融、醫療、科研、教育等領域中的應用進行闡述,以實現對統計學分析應用的深層了解,與實際生活應用接軌,從而在掌握統計學方法的同時能挖掘出龐大數據中的潛在價值,以實現各個領域的創新和再發展。
一、統計學在金融領域中的應用
1.1統計學在金融投資風險管理中的應用
金融投資和股票基金的投資管理都存在著一定的風險。而統計學方法在金融領域中的應用就可以在極大程度上使得股民和基金購買者在金融投資中規避風險,同時獲得一定的收益。
例如,通過對金融領域中的指標選取,建立市場走勢風向標,利用諸如統計學中的馬柯威茨組合理論等分析投資理財中的損失概率分布、可能獲得收益和與其收益的偏離程度等具有指導價值的信息,從而得出以何種分散化的投資方法來規避金融投資風險的風險管理理論[1]。
筆者也嘗試著以股票市場中的上市一周年市盈率、歷史PEG、區間漲跌、換手率、Wind全A指數區間收益率等作為樣本,進行統計學的因子分析理論處理,以獲得股票投資的紅利價值指標、股票的影響價值指標和投資價值指標,如表1所示,獲得了較為滿意的預測結果。
1.2統計學在金融定向服務中的應用
統計學除了可以分析指導金融投資和進行風險規避之外,對金融行業的業務開展也具有重要的意義,例如通過對參與金融業務的客戶的工作、收入、家庭等數據信息的獲取,建立相應的信息庫,并對這些數據進行分類、關聯、聚類、序列模式等分析,以實現對用戶信用等級體系的建立以及對客戶履約和投資能力進行一定的預估,評定用戶金融守約能力的同時,也能挖掘潛在的具有更高價值的客戶,從而實現對金融交易對象的個性化、特色化的定向服務,服務具有針對性,交易的成功率也得以保障。
二、統計學在醫學領域中的應用
2.1統計學在醫學流行病學中的應用
醫學中很多疾病的發生呈現出一定的傾向性,傾向性可表現為時間、地域、性別等,因而對這些疾病的發生數據進行收集,運用統計學的離散、中位、均數等方法分析,從而確認這些疾病發生的季節性、性別趨勢、年齡段、地域特點等,從而使得疾病的治療和預防以及篩查工作得以順利的開展,例如普外科的腹疝,兒童好發斜疝、中老年男性好發直疝,而中年婦女好發股疝,這就為腹疝的診斷提供了一定的流行學診斷依據;胃癌多發于中年男性,因此中年男性成為胃癌篩查的重點人群;子宮內膜癌多表現為女性停經后的不規則流血[2],這為患者疾病的早發現提供警示作用;冬春季高發流感,這就為流感的預防提供了依據。
2.2統計學在醫學預防中的應用
統計學在醫學預防中的應用,主要是針對某種疾病發生的高危因素的挖掘,從而實現對這些致病高危因素行為的規避,以及對具有高危因素群體的疾病篩查、診斷具有提示作用。例如,研究心臟病的危險因素,選擇指標有年齡、性別、體重、最大攝氧量,自變量為患病與否,可先進行這些單因素與因變量之間的t檢驗或者卡方檢驗,從而篩掉一些無意義的指標,再將這些納入的指標進行二分類Logistic回歸分析[3],最終回歸方程中納入的具有統計學意義的指標即為與疾病發生相關的指標,連續變量的OR值意味著自變量每增加一個單位,疾病發生風險的增加值,分類變量的OR值則意味著賦值高的指標是賦值低的多少倍[4]。如圖1所示,即年齡每上升一歲,疾病發生的風險就會增加1.089倍;若女性賦值為0,男性賦值為1,則男性發病率是女性的7.026倍。
2.3統計學在其它多領域中的應用
除了上述在醫療、金融領域的深入應用外,統計學在其他諸多領域中的應用也十分廣泛和成熟,例如在工程領域中,不同的建筑對混凝土的強度需求不同,為了達到設計的標準,將混凝土強度進行數學期望模型的建模,并通過強度的正態分布以確定可達標的混凝土強度,此外,工程領域中的工程管理和張拉力與油表讀數也涉及到了統計學方法的應用[5];統計學在產品的個性化服務中也發揮了重要的作用,例如我們用的音樂播放器會根據聽歌習慣進行數據收集,然后有針對性地推薦用戶可能會喜歡的歌手或者歌曲,瀏覽器會根據瀏覽記錄進行相關新聞推送,購物網站根據瀏覽記錄推送配套商品等等;統計學也在社會學、管理學等諸多領域中發揮作用,并朝著多學科融合的方向發展,在更多領域中發揮著更重要的作用。
三、結論
綜上所述,在信息時代下,數據潛在價值的挖掘為各個領域的創新、健康、穩步的發展創造良好的條件,也提供了有效的途徑,隨著其在多個領域中應用的深入,大數據分析也具有更為廣闊的發展前景和空間,諸如統計分析等研究方法也將不斷地與時俱進,以實現對未來更龐大、更繁雜、更深層價值挖掘需求的滿足,從而推動人類社會進程翻開新的篇章。
參? 考? 文? 獻
[1].馮瑩.淺談統計學在金融及證券領域的應用[J].商情,2012(49):1-1.
[2].楊曦,馬珂,吳成.子宮內膜癌的流行病學及高危因素[J].實用婦產科雜志,2015, 31(7):485-488.
[3].張聰聰.先天性心臟病危險因素分析[D].復旦大學,2011.
[4].馮磊,年士艷,趙陽,等.不同分析策略下應用二分類Logistic回歸進行疾病風險評估的結果差異性分析[J].中華檢驗醫學雜志,2018,41(3):232-236.
[5].張毅,余成起.淺談統計學在工程中的應用[J].四川水泥, 2015(8):91-91.