■廖國威(安徽財經大學)
睡眠對人體健康有不可忽視的影響,每個人一生花費在睡眠上的時間約占生命總長度的1/3,另外2/3的人生旅程直接受這1/3時間的影響,也就是說和睡眠質量息息相關。人的精神狀態取決于睡眠質量,高質量睡眠自然保證了人們保持充沛的精力。然而,統計數據顯示,目前我國正有38.2%的成年人飽受失眠癥的摧殘,青少年失眠率也在同時上升。
造成失眠的諸多復雜因素通常可以被分為客觀和主觀兩方面。客觀因素包括茶或咖啡等提神物質的影響以及外部環境的變化等;而主觀因素可以分為:情感上的失落、生活上的壓力和精神上的興奮和其他的精神因素。
目前國內外學者在利用數據對睡眠進行模型分析的領域稍顯空白,現有的文獻屈指可數。呂曉萌等學者基于多元分類 logistic 回歸、判別分析等分析方法分別建立了睡眠質量等次分類及疾病診斷模型,制定出一套切實可行的睡眠計劃,并提出相應措施對睡眠計劃方案進行有依據的優化;李浩然等學者結合睡眠等指標利用BP神經網絡模型對睡眠進行了健康的規劃,建立起神經網絡模型視角的睡眠模型;米碩等學者基于LSTM循環神經網絡模型探究了患病概率與睡眠之間的關系。本文的創新之處在于從較為新穎的因子分析和主成分分析角度出發,結合數據建立起精度較高的睡眠模型,對睡眠時間進行科學的規劃。
主成分分析法是在盡可能少減少或不減少問題內涵蓋的信息和指標的前提下,找到N個能夠控制原本變量的隨機變量,將原來復雜的多個因子變量抽絲剝繭成幾個因子變量來研究問題,而這幾個變量必須能夠精確表述問題的內部關聯性。其主要思想就是將幾個有關聯的指標縮小成幾個綜合指標,繼而通過主成分分析,選出 K個主要的因子對其進行分析,考慮這K個主因子與原始指標間的關系,然后確定每個主因子的含義,主成分分析法的評價模型是由每一個主因子的方差貢獻率作為權重得到的。該分析方法的數學模型是:設問題有P個變量每個變量的平均值是0,標準差是1,獲得的數據矩陣是Xn*p,這個變量分別用的線性組合來表示,將到如下的方程組:

其中Xp×n是原始變量構成的矩陣轉置,因子載荷矩陣是Ap×m,公共因子是,元素ijα是因子載荷,同時用代表無法測量的特殊因子,代表無法解釋的那部分量,的平均值為 0。由于載荷矩陣被用來反映公共因子的重要程度,因此要求 A 的元素的取值方便客觀的解釋,理想情況是每列兩極分化。
取正交矩陣Tm×m(叫做旋轉矩陣)其中是做旋轉的單位矩陣:

在經過主成分分析的步驟將數據標準化后,根據表1的相關數據可以看出,各項指標相關系數小。這說明他們無法完全滿足主成分分析法在信息重疊方面的要求,因此本文接下來選擇因子分析模型
因子分析法借助分析N個變量間相關系數矩陣內部之間的依存關系,以期找出少數幾個隨機變量來涵蓋所有的變量信息,以此替換所有初始變量去解答原來的問題。
因子的形成取決于變量的相關性,并且具有較大相關性的變量被組合在一起,使得因子彼此不相關,并且所有變量都是公因子的線性組合。
其數學模型表達式為:設有 N 個樣本,P 個指標,隨機變量為是要尋找得到的公因子,因子模型為:因子載荷矩陣為:A=(aij),因子載荷是aij,其本質即為公因子iF和Xi變量之間的相關系數。特殊因子ε代表那些在實際分析時不可避免的、幾乎可以忽略不計的誤差以及公因子以外的影響因素。首先通過各指標的載荷矩陣可以得出各公因子的實際意義,接著旋轉因子可將其更加清晰的說明。得到所選取變量的公因子后,利用回歸估計等方法列出數學表達式對因子得分進行描述,即各公因子是所選變量的線性形式,進一步測算出因子得分,并對各案例進行綜合評價。
(1)表2的KMO檢驗和Barlett檢驗結果表明:KMO值為0.774表示可以進行因子分析。為了檢驗數據是否服從多元正態分布的總體是Barlett檢驗的主要目的。由表2可知本例子中SIG值為0,說明正態分布總體是數據來源,適合進一步分析。
(2)變量共同度:表3變量共同度是用來說明各變量中所包含初始信息能被提取的公因子所描述的程度。不難看出,本例中變量共同度較好,因此上述所提取的公因子可以對各變量進行解釋。
(3)解釋的總方差:由表4可知,只有前兩個初始特征值大于1,所以SPSS只挑選了前兩個主成分進行分析;由表中第一欄“提取載荷平方和”的數據可知第一主成分的貢獻率為38.042%;表中數據顯示,前兩個主成分的方差占所有主成分方差的57.004%。由此可知,相對于主成分分析法,因子分析法有了進步。“旋轉載荷平方和”一欄顯示的是旋轉以后的因子提取效果,與未旋轉之前差別不大。
(4)碎石圖:圖1的碎石圖的結果也顯示,有兩個成分的特征值超過了1,只考慮兩個成分即可。
(5)旋轉成分矩陣
第一個因子在睡眠質量、睡眠時間、睡眠障礙、入睡時間、睡眠效率有較大的負荷;第二個因子在年齡,睡眠藥物、日間功能障礙上有較大的負荷。
(6)成分得分系數矩陣

表1 KMO與Bartlett鑒定

表2 Communalities變量共同度

表3 說明的變異數總計

表4 元件矩陣
可直接得到各因子的表達式。需要注意的是,表達式中呈現出的各個變量是標準化變量而不再是原始變量。兩成分因子的表達式如下:

圖1 碎石圖分析結果
F1=0.012*Zscore(年齡)+0.278*Zscore(睡眠質量)+0.249*Zscore(入睡時間)+0.225*Zscore(睡眠時間)+0.241*Zscore(睡眠效率)+0.234*Zscore(睡眠障礙)+0.118*Zscore(催眠藥物)+0.156*Zscore(日間功能障礙)
F1=0.515*Zscore(年齡)-0.040*Zscore(睡眠質量)-0.086*Zscore(入睡時間)+0.160*Zscore(睡眠時間)+0.076*Zscore(睡眠效率)-0.205*Zscore(睡眠障礙)+0.260*Zscore(催眠藥物)-0.481*Zscore(日間功能障礙)
利用每個主成分所對應的特征值在所提取主成分總的特征值之和中占的比例作為權重計算主成分綜合模型。
睡眠模型分為離散時間情況和連續時間情況,我們討論離散時間情況,以便對休息時間進行科學規劃。我們使用效用變量(U)來表示人們的健康狀況,并認為睡眠計劃會影響人們的睡眠質量。此外,人們的能量增加將受到咖啡等提神物品的影響。在此基礎上,建立睡眠模型,以確定人們最佳的睡眠時間。假設效用函數與通過睡眠獲得的能量A相關并表示為以下函數:

ts是睡眠時間,t是時間段T(T)中的非睡眠時間,滿足等式(2)。

C代表咖啡或茶等提神物品,當C>1時,表示使用提神物品,當C≤1時表示沒有使用提神物品。能量A和t之間的關系是

其中,α等式(3)表明,睡眠時間越長,精力越充沛,但非睡眠時間也隨之減少。
效用函數表示為:

獲得的最大效用的一階條件是:

非睡眠時間與C成正比,當C增大時, 非睡眠時間變長,根據所以在T 時間內,睡眠時間減少。
結果表明,睡眠時間會影響能量,假設 T是一天24小時:
因為T是常數,可以在T時間討論睡眠時間和能量A之間的關系,可得:又因為T是24小時,由上述關系可知當睡眠時間=8.66小時的時候,人的精力最充沛。
因此,根據模型筆者建議科學的睡眠計劃應該是在晚上十點半之后入睡,每天早上六點鐘左右起床,中午在有可能的條件下盡量保證一個小時的午休,通過以上途徑以保證一天充足的睡眠,為充沛的精力和良好的學習工作狀態打下基礎。