999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于近視篩查數(shù)據(jù)的近視影響因素分析和近視預測

2021-04-09 03:10:14黃峻嘉蘇宇涵
電子科技大學學報 2021年2期
關(guān)鍵詞:分析

黃峻嘉,張 琪,趙 娜,李 蓉,蘇宇涵,周 濤

(1. 云南大學軟件學院 昆明 650504;2. 小艾眼科診所,艾視醫(yī)療科技成都有限公司 成都 610041;3. 電子科技大學大數(shù)據(jù)研究中心 成都 611731)

2010 年全球近視人群約有19.5 億,占世界總?cè)丝诘?8.3%[1]。2018 年我國兒童青少年總體近視率為53.6%[2],遠超國際水平[3]。目前美國[4-5]、新加坡[6-7]、澳大利亞[8]等國家已采用隊列研究的方法對兒童近視影響因素展開研究。國內(nèi)也有不少針對中國各城市青少年近視情況的分析,如上海[9-10]、安陽[11]、廣州[12]、溫州[13]、北京[14]等。文獻[15]分析了來自O(shè)rinda 近視縱向研究的數(shù)據(jù)子集MYOPIA,認為父母近視情況、戶外運動時間、閱讀時間和性別等因素對近視有較大影響。Orinda近視縱向研究[15-17]、CLEERE 父母近視史的研究[18]以及近視影響因素研究[19]都認為青少年早期屈光度能夠用于預測其未來近視的發(fā)生。文獻[20]分析了長達10 年的臨床屈光數(shù)據(jù),發(fā)現(xiàn)機器學習方法可以有效預測高度近視發(fā)生的幾率。

現(xiàn)有研究中使用最多的方法為隊列分析和邏輯回歸[21]。其中隊列研究是探討疾病病因的常用方法之一,能較好地揭示兩事件間的因果關(guān)系。但設(shè)計和組織實施較難,收集與分析資料較復雜。邏輯回歸分析其決策面是線性的,難以處理數(shù)據(jù)不平衡的問題。本文利用斯皮爾曼相關(guān)系數(shù)(spearman's rank correlation coefficient)[22]分析各影響因素與未來視力的相關(guān)性,并細分高度近視與普通近視隨年齡的變化情況。斯皮爾曼相關(guān)系數(shù)是衡量兩個變量的依賴性的非參數(shù)指標,利用單調(diào)方程評價兩個統(tǒng)計變量的相關(guān)性,適用于總體分布未知或有序變量相關(guān)性分析。本文構(gòu)建了適用于小數(shù)據(jù)集和一次檢查數(shù)據(jù)的集成學習算法模型,僅需輸入一次檢查數(shù)據(jù)即可對未來任意時刻視力情況進行量化預測。通過對比5 種常見的集成學習算法,發(fā)現(xiàn)隨機森林模型的綜合表現(xiàn)最佳。本工作在近視預測及防控方面具有一定的參考價值。

1 標準與數(shù)據(jù)

根據(jù)2019 年10 月15 日國家衛(wèi)健委辦公廳印發(fā)的《兒童青少年近視防控適宜技術(shù)指南》,近視率指近視人群的占比,而篩查近視的標準為裸眼視力低于5.0,且非睫狀肌麻痹情況下電腦驗光等效球鏡(簡寫為SE,后均指在非睫狀肌麻痹情況下進行的檢查)度數(shù)小于-0.50D,其中等效球鏡度數(shù)為球鏡度數(shù)加上1/2 倍柱鏡度數(shù)。在已判斷為近視的人群中,近視程度劃分標準如下:1) 低度近視——SE 度數(shù)在-3.00D~-0.50D(含)之間;2) 中度近視——SE 度數(shù)在-6.00D~-3.00D(含)之間;3) 高度近視——SE 度數(shù)小于-6.00D。

本文分析了3 個視力檢查數(shù)據(jù)集。其中數(shù)據(jù)集A 和B 來自艾視醫(yī)療科技成都有限公司(簡稱艾視科技)2019 年6 月-2020 年7 月成都市3~16 歲用戶雙眼近視檢查,包含性別、年齡、球鏡、柱鏡、裸眼視力、等效球鏡、是否近視等數(shù)據(jù)項。已經(jīng)排除了近期有眼部活動性病變者和近期配戴接觸鏡者的對應(yīng)數(shù)據(jù)。數(shù)據(jù)集A 中每個用戶僅有一次檢查數(shù)據(jù),共19 467 條。納入的研究對象平均年齡(9.23±2.55)歲,男性10 137 例,占52%,女性9 330 例,占48%。左眼等效球鏡平均(-0.79±1.75)D,右眼等效球鏡平均(-0.90±1.76)D,左眼裸眼視力平均 (4.8±0.32),右眼裸眼視力平均(4.78±0.33)。裸眼視力采用五分記錄法。整體近視率為41.1%。其中近視程度為不近視、低度、中度、高度的分別占比58%、28%、12%、2%。數(shù)據(jù)集B 中每個用戶有兩次檢查數(shù)據(jù),共1 470 條、735 對。納入的研究對象平均年齡(8.42±2.23)歲,男性748 例,占51%,女性722 例,占49%。左眼等效球鏡平均(-0.21±0.89)D,右眼等效球鏡平均(-0.26±0.9)D,左眼裸眼視力平均(0.96±0.22),右眼裸眼視力平均(0.97±0.24)。裸眼視力采用小數(shù)記錄法。同一個檢查對象兩條數(shù)據(jù)之間的間隔時間從30~180 天不等。第一次檢查時整體近視率為19.6%。第二次檢查時整體近視率為32.0%。第一次檢查未近視的樣本中有15.4%在第二次檢查時變?yōu)榱私暋?shù)據(jù)集C 來自O(shè)rinda 近視縱向研究數(shù)據(jù)子集,每年由父母或監(jiān)護人完成一次調(diào)查,包括調(diào)查對象視力檢查數(shù)據(jù)以及年齡、近視家族史和相關(guān)視覺活動時間數(shù)據(jù)。本文使用的部分來自618 名進入研究時并非近視受試者的初次檢查結(jié)果。數(shù)據(jù)均來自對象的右眼。納入的研究對象中男性302例,占49%,女性316 例,占51%。其中年齡平均(6.3±0.71)歲,每周戶外活動時間平均(11.95±7.96) h,每周閱讀時間平均(2.8±3.07) h,每周電腦使用時間平均(2.11±3.05) h,每周學習時間平均(1.49±2.11) h,每周看電視時間平均(8.95±5.71) h。其中戶外活動、閱讀、使用電腦、看電視和學習時間僅統(tǒng)計校外活動。該數(shù)據(jù)集樣本的近視率為13.1%,所有近視對象均為低度近視。

2 影響因素分析

本文分析了性別和近視以及高度近視發(fā)生的關(guān)系,發(fā)現(xiàn)在我國的數(shù)據(jù)中,性別和近視發(fā)生無顯著的關(guān)聯(lián)關(guān)系,故后文不以性別為影響因素。圖1 給出了根據(jù)數(shù)據(jù)集A 得到的不同年齡段近視發(fā)生率:深色代表近視人數(shù),并用數(shù)字標識;淺色代表非近視人數(shù);曲線給出了不同年齡的近視率。其中6 歲以下及14 歲以上數(shù)據(jù)量較小,故未計算其所對應(yīng)的近視率。由圖可見,6~14 歲隨著年齡的增長,近視率逐漸升高,到14 歲時近似率已經(jīng)接近80%,遠遠超過世界平均水平。

圖1 數(shù)據(jù)集A 中不同年齡的近視情況

為分析近視人數(shù)增長情況,本文計算了不同年齡的近視轉(zhuǎn)化率a(t)=[p(t+1)-p(t)]/[1-p(t)],其中p(t)是年齡為t 的孩子中的近視率,a(t)表示有多少比例在年齡為t 時還不是近視的孩子恰在這一年轉(zhuǎn)化為近視。根據(jù)數(shù)據(jù)集A,孩子在6~13 歲的近視轉(zhuǎn)化率分別為6.87%、14.22%、17.94%、20.38%、18.77%、21.89%、18.20%和14.14%。從轉(zhuǎn)化率分析可以看到,8~12 歲是近視新增的高發(fā)時期,平均每年約有20%的非近視學生轉(zhuǎn)為近視學生,13 歲以后每年從非近視轉(zhuǎn)化為近視的風險開始顯著下降。

圖2 給出了根據(jù)數(shù)據(jù)集A 得到的不同年齡段高度近視發(fā)生率:深色代表高度近視人數(shù),并用數(shù)字標識;淺色代表非高度近視人數(shù);曲線給出了不同年齡的高度近視率。其中6 歲以下及14 歲以上數(shù)據(jù)量較小,故未計算其所對應(yīng)的高度近視率。由圖可見,高度近視的占比隨年齡的增長而不斷增長。從8 歲開始高度近視率顯著提升,且隨年齡的增長逐漸升高。類似地,本文計算了不同年齡的高度近視轉(zhuǎn)化率,從6~13 歲分別為-0.98%、-0.33%、0.36%、0.81%、1.72%、2.77%、2.60%和4.36%。其中在6 歲和7 歲出現(xiàn)負數(shù),可能有兩個原因,一是因為數(shù)據(jù)量太小造成統(tǒng)計上波動太大,二是有一些遺傳性的眼病導致極年幼就出現(xiàn)高度近視,這部分孩子的增長規(guī)律與其他孩子有所不同。隨著未來數(shù)據(jù)量的增長,可以得到統(tǒng)計上更可信的結(jié)果。與此同時,8 歲以后高度近視占比的增長非常顯著,且10~14 歲是高度近視快速增加的高危時期。14 歲以上孩子數(shù)據(jù)較少,留待以后分析。

圖2 數(shù)據(jù)集A 中不同年齡的高度近視情況

本文計算了數(shù)據(jù)集C 各數(shù)據(jù)項與“近視與否”的斯皮爾曼相關(guān)系數(shù),并做雙尾檢驗。數(shù)據(jù)結(jié)果顯示,父親是否近視、母親是否近視和每周戶外活動時間與“近視與否”有顯著影響(98%置信度水平上顯著),其余各項(包括閱讀、使用電腦、看電視和學習)在98%置信度上均無顯著影響。

圖3 給出了父母近視與否對孩子近視情況的影響。父母中有一人近視時孩子的近視率為13.2%,是父母均不近視時的4 倍,父母均近視時孩子的近視率為22.3%,為父母均不近視時的6.75 倍。可見遺傳對于近視影響是巨大的。

圖3 父母是否近視對孩子近視與否的影響

圖4 給出了每周戶外活動時間和近視率的關(guān)系,其中統(tǒng)計在內(nèi)的只包括離開學校后的戶外活動。由圖可知,除了曲線前部因為樣本數(shù)量少出現(xiàn)波動外,整個曲線是近似單調(diào)的——戶外活動時間越長,近視比例越低。在4 ~9 h 區(qū)間內(nèi),增加戶外活動時間帶來的近視率的降低尤為顯著。當每周戶外活動時間大于15 h 的時候,近視率不再顯著變化。

圖4 每周戶外活動時間和近視率的關(guān)系。其中縱坐標給出的是每周戶外活動時間不超過給定值的情況下近視的比率

3 近視預測

本文選取了隨機森林(random forest)[23]、自適應(yīng)提升(AdaBoost)[24]、裝袋(bagging)[25]、梯度提升(gradient boosting)[26-27]和極端梯度提升(XGBoost)[28]5 種集成學習模型,把數(shù)據(jù)集B 中同一個檢查對象的前一個時間點數(shù)據(jù)(含個人信息)和間隔時間一起作為訓練數(shù)據(jù),預測其后一個時間點的近視情況。樣本數(shù)據(jù)隨機劃分為70%訓練集和30%測試集,預測對象為裸眼視力和等效球鏡,并用預測值與真實值差的絕對值作為誤差。預測模型的結(jié)構(gòu)如圖5 所示。

圖5 預測模型結(jié)構(gòu)

如表1 所示,隨機森林方法和梯度提升方法的誤差相對最低,但梯度提升方法在間隔時間較長之后,會出現(xiàn)結(jié)果突變和失穩(wěn),特別是突然出現(xiàn)視力大幅度變好的情況,而這與醫(yī)學實踐知識是不符合的,也沒有在其他具有更長時間間隔的真實數(shù)據(jù)中觀察到。因此,綜合考慮算法的精確性和魯棒性,我們認為隨機森林是最好的模型,而如果只預測較短時間之內(nèi)的視力變化情況(如半年之內(nèi)),則梯度提升方法效果也很好。如果用隨機森林算法,只對下一個時間點“是否是近視”進行預測,則準確度可以達到92.8%。

表1 不同模型預測誤差對比

4 結(jié) 束 語

本文分析結(jié)果顯示中國青少年近視發(fā)生率遠遠超過國際水平,其中8~12 歲是近視新增的高發(fā)時期,平均每年約有20%的非近視學生轉(zhuǎn)為近視學生,而10~14 歲是高度近視新增的危險時期。父母近視情況和戶外活動時間對近視形成的影響最大。本文還構(gòu)建了一個僅需單次檢查數(shù)據(jù)即可得出未來視力預測結(jié)果的模型,可以定量給出未來指定時間點的左右眼裸眼視力及左右眼等效球鏡值,可以據(jù)此進行近視及近視程度的預測。如果只對近視與否進行判斷,預測準確度接近93%,有相當?shù)膮⒖純r值。

結(jié)合影響因素的分析,本文認為我國青少年近視率遠高于世界平均水平的一個很重要的原因,就是課后戶外活動時間嚴重不足,這可能歸因于中國孩子從小課業(yè)壓力過大。根據(jù)數(shù)據(jù)分析結(jié)果,本文建議應(yīng)盡量保障每個孩子平均每天在校園外有2 h的戶外活動時間,在非周末也應(yīng)該每天至少1 h 以上的戶外活動時間。在8~12 歲近視轉(zhuǎn)化率是最高的,這個時間點恰好在小學階段,如果教育部門能夠持續(xù)有力地推動素質(zhì)教育,降低考試成績在小學學習過程中的重要性,學校和家長就能夠更從容主動保障孩子的戶外活動時間,降低近視發(fā)生率。如果孩子在小學階段視力很好,后面轉(zhuǎn)為近視的風險會相應(yīng)降低。

本研究的數(shù)據(jù)還具有明顯的局限性,缺少6 歲以下以及14 歲以上的數(shù)據(jù),樣本區(qū)域集中代表性不充分,在國內(nèi)還沒有大規(guī)模針對家庭情況和生活習慣的調(diào)查。這使得本文結(jié)論的適用度和可信度都有相當大可提高的空間,特別是無法準確判斷海外數(shù)據(jù)(數(shù)據(jù)集C)對中國情況的解釋力——這還需要針對國內(nèi)類似調(diào)查數(shù)據(jù)的分析。目前研究組正在進行針對數(shù)十萬青少年的視力篩查,并匹配對數(shù)萬抽樣家長的問卷調(diào)查,有望在近期給出更充分全面的分析。

青少年近視防控是一項系統(tǒng)工程,需要政府、學校、醫(yī)療衛(wèi)生機構(gòu)、家庭和學生本人共同努力。政府應(yīng)該主動出臺近視防控計劃,每3~5 年為一期,給出明確的目標和可操作的方案,并通過廣覆蓋的篩查數(shù)據(jù)分析獲得定量化的反饋,切實有效地提升青少年視力水平。

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
經(jīng)濟危機下的均衡與非均衡分析
對計劃生育必要性以及其貫徹實施的分析
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫(yī)結(jié)合治療抑郁癥100例分析
偽造有價證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 久久99热这里只有精品免费看| 免费日韩在线视频| 国产区福利小视频在线观看尤物| 国产精品天干天干在线观看| 国产精品lululu在线观看| 99精品高清在线播放| 久久这里只有精品国产99| 五月综合色婷婷| 9久久伊人精品综合| 亚洲毛片在线看| 40岁成熟女人牲交片免费| 国产成人夜色91| 91精品在线视频观看| 五月激情综合网| 久久久久青草大香线综合精品 | 亚洲一区波多野结衣二区三区| 久久久久人妻一区精品色奶水| 国产永久在线视频| 她的性爱视频| 91久久国产综合精品女同我| 国产成人a在线观看视频| 欧美成人aⅴ| 精品国产香蕉伊思人在线| 国产精品主播| 亚洲精品国产自在现线最新| 毛片视频网| 97在线视频免费观看| 第九色区aⅴ天堂久久香| 国产十八禁在线观看免费| 国产综合亚洲欧洲区精品无码| 人妻21p大胆| 亚洲免费毛片| 国产91久久久久久| 亚洲男人的天堂在线观看| а∨天堂一区中文字幕| 国产亚洲欧美在线人成aaaa | 青青青亚洲精品国产| 小13箩利洗澡无码视频免费网站| 粗大猛烈进出高潮视频无码| 国产一级视频久久| 天堂网国产| 国产精品久久自在自2021| 毛片免费在线| 国产永久在线视频| 99久久成人国产精品免费| 国产第一页免费浮力影院| 美女潮喷出白浆在线观看视频| 97se亚洲综合| 亚洲精品亚洲人成在线| 亚洲一欧洲中文字幕在线| 日韩专区欧美| 国产福利小视频在线播放观看| 欧美精品在线视频观看| 91在线丝袜| 无码粉嫩虎白一线天在线观看| 久久久精品国产亚洲AV日韩| 91亚洲精品国产自在现线| 网友自拍视频精品区| 国产熟睡乱子伦视频网站| 亚洲视频免费在线| 四虎永久免费地址| 2022国产91精品久久久久久| 国产成人无码综合亚洲日韩不卡| 国产性爱网站| 黄色网在线免费观看| 久久精品国产一区二区小说| 色综合中文综合网| 伊人久久久大香线蕉综合直播| 欧美、日韩、国产综合一区| 国产免费精彩视频| 自慰高潮喷白浆在线观看| 国产一区亚洲一区| 视频一区视频二区中文精品| 亚洲成a∧人片在线观看无码| 91激情视频| 国产精品欧美激情| 久久精品国产国语对白| 国产丝袜第一页| 精品国产香蕉在线播出| 成年女人a毛片免费视频| 国产精品欧美亚洲韩国日本不卡| 亚洲天堂视频网站|