999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

管理實踐中常見的回歸陷阱

2021-11-02 04:13:34顧金鳴
科技信息·學術版 2021年20期

摘要:回歸分析是常被應用于商業管理領域的“萬金油”統計推斷方法,由于在統計工具中運用回歸分析十分便利,工具背后的統計原理和假設常常被人忽略,以致于在實際問題中運用時容易經不起推敲,甚至誤人子弟。為了糾正管理工作者常出現的錯誤認識,本文將結合自身的管理實踐經驗梳理九個常見的回歸陷阱。

關鍵詞:統計;回歸分析;陷阱;數據

統計學是研究如何收集、整理、分析和解釋涉及社會、經濟、管理問題的數據,并對研究對象進行統計推斷的一門科學。

商業管理活動需要能夠洞察個人、組織并對其行動和狀態進行部分改善的的統計學。人類個體多樣,決策機制復雜,用自己的行為去強制改變別人很困難,因此在商業管理領域從事分析工作時,無論身處哪個行業、哪種職業,都需要用數據來洞察、預測個人和組織的行動,進而尋找干預方法。

在筆者管理咨詢工作經歷中,直接或間接地看到、聽到了很多運用數學、統計工具的案例,其中最常被人掛嘴邊的、堪稱統計學王道的方法便是“回歸分析”。

回歸分析能夠在控制其他因素的前提下,對某個具體變量與某個特定結果之間的關系進行量化分析,是一件深奧到值得人研究一輩子,又簡單到人人能夠運用的強大的統計工具。咨詢或者說管理工作中,我們可以運用它量化地搭建預測模型、評估模型或者導出一些系數的值,但即便是行業內的高材生,由于久疏研究,也會漸漸淡忘一些工具背后的原理和假設、忽視了每一步操作背后的實質意義,以致于在實際問題中運用時容易經不起推敲,甚至誤人子弟。為了糾正管理工作者常出現的錯誤認識,下面就梳理、介紹一些較為常見的回歸陷阱。

陷阱一:用線性回歸分析非線性關系

一般統計工具默認的回歸操作是線性回歸,生活中很多因素之間的關聯也確實是偏線性的,因此很多人建模時就習慣性地在工具中將自變量、因變量選上,然后導出結果。然而復雜的現實問題中也存在大量非線性關系,比如有規模經濟效益的業務量增長與成本投入的關系、資本結構與經營績效的關系、經濟增長與失業的關系、員工年齡與流失率的關系、物質獎勵與激勵效果的關系等等。線性關系是互不相干的獨立關系,而非線性則是相互作用,而正是這種相互作用,使得整體不再是簡單地等于部分之和,而可能出現不同于"線性疊加"的增益或虧損,這時僅僅用單純的線性回歸,哪怕僥幸通過統計檢驗,結果也沒有任何意義,甚至會引人做出危險的決策。

陷阱二:迷信P值

做過實證研究的,哪怕對統計原理一知半解,也應該知道P<0.05這個足以給研究結果判生死的指標,事實上它只是費舍爾提出的一個經驗值,它的內涵通俗點講就是“如果原假設是正確的,出現觀測樣本這種情況的可能性,如果低于5%,那就可視為小概率事件,拒絕原假設”。通過P值檢驗并不代表變量間的關聯度就有多大(significance在中文中被稱作“顯著性”,這種說法常常引起人們對其內涵的誤解),未通過也并不意味著你所搭建的模型就一定不成立,很可能只是樣本量不夠、數據質量不佳罷了,事實上增大樣本量確實是降低p值的有效手段。美國統計學協會

2016年專門發布了官方吐槽,認為P值已經遭到了相當程度的誤解、迷信和濫用,有調查表明約有三分之一的號稱有統計學差異的P<0.05的研究結論都是錯誤的。這種迷信和濫用主要表現在:1.認為P值代表假說為真的概率率;2. 忘記了“合理的推斷過程需要完整的報告和透明度”,覺得只要把P值放出來就大功告成;3. 僅僅用P值來得出科學結論、商業決策或制定政策。

因此,成功的科學決策取決于很多方面,包括實驗的設計,測量的質量,外部的信息和證據,假設的合理性等等。僅僅看P值是否小于0.05是非常具有誤導性的。對于在商業管理領域應用統計方法的我們,畢竟不是在做自然科學研究,在有充分外部證據以及對假設的信心時,適當放寬P值門檻也沒有問題。

此外,統計學研究方法并不只有一個P值,還有諸如95%可信區間、偽發現率、貝葉斯分析方法等大量的統計學方法指標,可以用做P值的補充或者替代品。一定程度上的聯合運用有助于彌補各個方法本身的漏洞,使得結論更為可信。

陷阱三:顯著但應用價值不大

商業管理領域很多問題的影響因素都非常多非常復雜,說實話不是很推薦在資源有限的情況下去嘗試通過回歸分析建模。

R方的含義是預測值解釋了因變量的方差的多大比例,衡量的是預測值對于真值的擬合好壞程度。對于做學術研究的人來說,找到一個顯著的影響因素,哪怕R方不是太大,即對結果的解釋力度不是很大,也算是一種學術貢獻。但在商業應用中,我們需要找到影響力度足夠大的那個因素或那一系列因素,并以最小的管理成本去進行干預,對結果變化影響甚微的所謂的模型再顯著也沒有太大的應用價值。

陷阱四:缺乏對因果關系的深入探究

“因果”是個大命題,看似回歸分析成功導出了一個結果,也不意味著因果關系就必然確定了。一個古老的謬誤是:如果B緊跟著A出現,那么A一定導致B。比如有的管理者曾費盡周折探求抽煙越多是否就越會導致員工績效變差,研究的結果似乎也給了肯定的結論,但此例難道不能是相反的解釋嗎?也許正是因為績效變差才促使員工壓力更大、抽更多煙呢?

要弄清楚因素之間的作用機制,我個人認為至少在復雜的管理領域就很有必要考慮是否可能存在調節效應或者中介效應,以此找到真正有效的干預目標。當然也很有可能的是所有變量互相間均沒有任何影響,只是有一個第三因素恰好能影響這些變量,比如A銷售公司收入與某產品價格同步上漲,很可能只是因為全國物價水平上漲了,而非存在內幕關聯。此外,必須避免出現因果倒置的情況,典型的例子就是拿失業率預測GDP,通過回歸分析很可能會得出降低失業率能促進GDP增長的結論,但事實上真正的作用機制應該是通過促進GDP增長來降低失業率。甚至于,因果關系有時候是雙向的,比如某地K12教育投入和經濟增長的關系,我們既可以說K12教育的發展推動了經濟增長,也可以認為只有經濟水平高的地方才有錢在K12教育領域投入更多資金,還可以說K12教育支出推動了經濟增長,從而為進一步增大教育投入提供了可能,即互為因果。這里的關鍵就在于盡量避免使用受結果影響的因變量,不然因果的方向將無休止地爭議下去。

陷阱五:選取的自變量相互之間高度相關

當兩個或兩個以上自變量彼此間高度相關時,回歸分析的結果將可能無法分清每一個自變量與因變量之間的真實關系,這種情況在統計學中稱為多重共線性。比如在引入財務變量時,常有人將總收入、營業收入、主營業務收入等一系列指標均導入工具跑回歸,事實上這些都是反映收入規模這一因素的變量。當變量較多時,我們主觀上未必能識別出所有變量之間的關系強弱,所以多重共線性是很容易發生的,研究者一定要對此足夠敏感,先用數據檢驗變量間的相關性,再通過變量取舍、創造新的綜合性變量或直接通過逐步回歸等方法來盡量消除多重共線性。

陷阱六:變量過多

有些人擔心遺漏重要的因素,會將大量可獲取的變量加入回歸分析,以期得到完美的模型。然而當變量過多,尤其是無關的變量過多時,回歸的結果反而容易被稀釋。當回歸中加入了過多無關變量,總會有一個兩個恰好顯著性水平達標,那研究者往往就會花大量精力去事后解釋這些看似有用的、具有統計意義的因素,徒增成本。

陷阱七:脫離數據進行推斷

嚴謹來說,回歸分析的結論僅僅是對與所分析樣本相似的對象有效,未必能泛化到更廣闊的群體。比如我們依據一家單位總部員工的數據搭建了一個模型,得到的各個系數,甚至適用的變量都不一定能直接應用到下屬單位、外地單位、其他業務線。還有常見的就是考慮到獲得方便,只拿行業內上市公司的數據進行分析,但每個行業內的上市公司只是少數經營得好的代表,回歸分析前必須充分考慮分析結果是否能夠泛化到自己想論證的假設。

陷阱八:缺乏嚴格的統計診斷

統計診斷是數據分析的重要組成部分,是對實際問題中收集起來的數據和提煉出來的模型以及由此出發所作的推斷方法的合理性進行細致的分析,并通過一些診斷統計量來檢查數據、模型及推斷方法中可能存在的“毛病”,進而提出“治療”方案,也就是說對統計方法解決問題的全過程進行診斷。診斷的要點主要就是:1.模型或假設是否合理;2.數據與模型是否大體一致;3.是否有異常點、強影響點、高杠桿點;4.數據或模型的擾動對推斷的影響如何;5.是否需要作數據變換以及如何作變換。對非統計科班出身的經營管理者來說,統計診斷或許是陌生的概念,很多人做回歸前甚至都不會考慮以上這些問題,但這些問題的存在都是有可能撼動模型基礎的,嚴格的診斷十分必要。

陷阱九:缺乏嚴謹的抽樣策略

調查數據有一個顯著特征,即一般情況下都存在一定誤差,管理活動中想獲得高質量的、以人為調查對象的數據是比較困難的,要將人的主觀因素干擾降到最低限度不僅僅需要與人打交道的藝術,還需要在技術上設計科學的抽樣策略。

在選取數據時,一定要想清楚目標對象的內部結構(確保能對總體有足夠的代表性),綜合測算抽樣誤差和抽樣成本后,最優化地選擇簡單隨機抽樣、分層抽樣、整群抽樣、系統抽樣、多階段抽樣等。此外,一定要避免非概率抽樣,即根據自己的方便或主觀判斷抽取樣本的方法,方便抽樣、滾雪球抽樣均屬于非概率抽樣,這是在抽樣實踐中常常被人忽略的問題。

另外在抽樣中,如果我們建模的數據是通過問卷調查得來的,那問卷的話術和設計思路也必須嚴格起來,引入心理測量學的方法提高問卷信度和效度。

雖說有以上陷阱影響分析的結論,回歸分析依然是非常棒的統計學工具,但用數據說謊很容易,讓數據說真相缺很難(事實上,統計學的內在原理并沒有那么直觀和易理解)。因此在使用時一是要想清楚選擇哪些變量、如何收集數據;二是必須以觀察樣本為立足點(其他大部分統計推斷也是同樣道理)。總之,作為商業管理領域的從業者,我們在運用統計科學解決現實問題時既不能盲目依賴便利的工具憑感覺搭建模型,也不能盲目迷信數據而忽略了對事實情況最起碼的觀察和理解。

參考文獻:

[1]查爾斯·惠倫. 赤裸裸的統計學[M]. 中信出版社,2013. 11.

[2]西內啟. 統計思維[M]. 浙江人民出版社,2017. 12.

[3]金勇進. 抽樣:理論與應用(第二版)[M]. 高等教育出版社,2016. 1.

[4]黃江寧. 統計學在現代企業管理中的應用[J]. 統計與管理,2016,(08).

[5]毛青. 論現代企業管理中統計學的應用[J]. 民營科技,2013,(01).

作者簡介:顧金鳴(1993.1—),男,漢族,江蘇蘇州人,碩士研究生學歷(在讀),中國人民大學研究生,研究方向:管理統計學。

主站蜘蛛池模板: 99视频精品全国免费品| 久久久久人妻一区精品色奶水 | 精品视频一区二区三区在线播| 国产区福利小视频在线观看尤物| 亚洲综合久久一本伊一区| 国产产在线精品亚洲aavv| 亚洲成A人V欧美综合天堂| 福利一区在线| 欧美成一级| 国产男人的天堂| 色噜噜中文网| 国产精品蜜臀| 尤物精品国产福利网站| 国产激情无码一区二区免费| 成人91在线| 日本欧美一二三区色视频| 熟女日韩精品2区| 亚洲黄色高清| 日韩天堂在线观看| 久久人体视频| 97人人做人人爽香蕉精品| 国产精品无码作爱| 亚洲色中色| 亚洲国产精品一区二区高清无码久久| 日韩大乳视频中文字幕| 精品视频一区二区观看| 欧美亚洲欧美| 综合社区亚洲熟妇p| 中国精品自拍| 国产av剧情无码精品色午夜| 亚洲欧美日韩精品专区| 亚洲午夜国产片在线观看| 国产成人禁片在线观看| 免费观看精品视频999| 黄色网在线| 亚洲成人一区二区三区| 男女男免费视频网站国产| 国内自拍久第一页| 中文字幕中文字字幕码一二区| 精品久久蜜桃| 国产精品亚洲va在线观看| 美女视频黄又黄又免费高清| 波多野吉衣一区二区三区av| 欧美福利在线| 国产精品福利在线观看无码卡| 亚洲美女高潮久久久久久久| 天堂成人av| 伊伊人成亚洲综合人网7777| 国内精品免费| 精品无码一区二区三区电影| 国产亚洲精品91| 在线免费观看AV| 国产精品jizz在线观看软件| 国产在线麻豆波多野结衣| 成人福利免费在线观看| 亚洲另类第一页| 欧美性爱精品一区二区三区| 热这里只有精品国产热门精品| 波多野结衣亚洲一区| 四虎永久在线精品国产免费| 久久亚洲高清国产| 亚洲精品无码久久久久苍井空| 亚洲啪啪网| 国产办公室秘书无码精品| 国产又黄又硬又粗| 伊人查蕉在线观看国产精品| 国产福利一区二区在线观看| 九色视频一区| 欧美成a人片在线观看| 中文字幕欧美日韩高清| 欧洲欧美人成免费全部视频 | 青草91视频免费观看| 这里只有精品在线| 四虎国产在线观看| 中文字幕第4页| 99青青青精品视频在线| 欧美色图第一页| 无码电影在线观看| 亚洲精品第一页不卡| 免费又黄又爽又猛大片午夜| 又爽又黄又无遮挡网站| 中文字幕永久在线观看|