










摘 要:世界衛(wèi)生組織統(tǒng)計數(shù)據(jù)顯示,2023年乳腺癌依然是全球女性最常見的癌癥之一,在亞洲地區(qū),中國乳腺癌患者占比居高不下。乳腺癌的早期診斷對提高患者的生存率和治愈率方面至關重要。本文探討了改進的數(shù)據(jù)包絡分析-判別分析(DEA-DA)模型在乳腺癌病情診斷中的應用,并將其與機器學習算法進行了對比分析。該模型在判別精度方面與機器學習方法并無顯著性差距,但該模型因其明確的線性表達式具備了更強的可解釋性,從而在實際病情診斷及后期治療方面具有了更強的可操作性。這一研究為眾多現(xiàn)實判別問題奠定了良好的可解釋性模型基礎。
關鍵詞:數(shù)據(jù)包絡分析;判別分析;機器學習算法;早期診斷;模型優(yōu)化
中圖分類號:R737.9文獻標識碼:A文章編號:1673-260X(2024)11-0028-07
根據(jù)世界衛(wèi)生組織(WHO)和國際癌癥研究機構(IARC)在2022年發(fā)布的數(shù)據(jù),全球癌癥新發(fā)病例數(shù)逐年增加,2022年約為2 000萬例,預計這一趨勢在未來幾十年將繼續(xù)上升,可能到2050年每年新增病例數(shù)將達3 500萬。癌癥負擔的增加主要反映了全球人口老齡化及生活方式因素(如吸煙、飲酒、不良飲食習慣和肥胖等)帶來的影響。此外,全球癌癥相關的死亡人數(shù)已接近1 000萬[1],占全球總死亡人數(shù)的很大比例,癌癥已成為全球范圍內(nèi)嚴重影響公共衛(wèi)生的因素之一。
乳腺癌是全球女性中最為常見的癌癥之一,占女性新發(fā)癌癥的24%以上,且在某些地區(qū),乳腺癌的發(fā)病率和死亡率仍在上升。亞洲是全球乳腺癌發(fā)病率最高的地區(qū),其中中國乳腺癌患者占據(jù)了很大一部分比例[2]。乳腺癌早期診斷至關重要,因為早期發(fā)現(xiàn)可以顯著提高患者的生存率并減少治療的侵入性。在早期階段,腫瘤通常較小,并且尚未擴散至淋巴結或其他器官,因此手術切除的可能性較大,且療效較好[3]。
在疾病病情診斷方面,傳統(tǒng)的方法主要包括臨床檢查、影像學檢查、實驗室檢查、組織活檢及病史采集等方法[4]。這些傳統(tǒng)方法各有優(yōu)缺點,通常需要結合使用以提高診斷的準確性和有效性。而相較于以上傳統(tǒng)的疾病病情診斷方法,利用機器學習算法與之相結合可以進一步在分析、個性化醫(yī)療以及綜合診斷方面提高自動化水平、準確性以及敏感性。在乳腺癌診斷中,機器學習技術已經(jīng)廣泛應用于早期病情的篩查、診斷以及預后預測等多個方面,顯著提高了診斷的準確性和效率。例如乳腺X線攝影和超聲波圖像是乳腺癌篩查中常用的影像技術。機器學習算法,尤其是深度學習中的卷積神經(jīng)網(wǎng)絡,已被廣泛應用于自動檢測乳腺影像中的腫塊、鈣化點和其他病變區(qū)域[5]。MIT的研究團隊也通過深度學習模型來預測乳腺癌風險[6]。除了影像和組織病理數(shù)據(jù),乳腺癌診斷中還使用基因數(shù)據(jù)進行分析和預測。通過機器學習對基因組數(shù)據(jù)的分析,能夠為患者提供更個性化的診斷和治療方案。支持向量機和隨機森林等傳統(tǒng)機器學習算法,廣泛應用于基因表達數(shù)據(jù)分析,用于預測癌癥的預后、藥物響應以及確定最佳治療策略。
此外,機器學習算法能夠結合多種數(shù)據(jù)源(如病人的臨床信息、治療歷史、腫瘤類型等)進行綜合分析,提供準確的預后預測。K-最近鄰算法和邏輯回歸也常用于乳腺癌的存活率預測。研究表明,通過分析患者的年齡、腫瘤大小、淋巴結轉(zhuǎn)移情況等臨床數(shù)據(jù),機器學習模型能夠較準確地預測患者的5年生存率。深度學習模型已經(jīng)用于預測術后復發(fā)風險和長期生存情況。通過結合影像、基因表達數(shù)據(jù)和患者的治療歷史,模型能夠提供比傳統(tǒng)預后模型更精確的長期預測[7]。
數(shù)據(jù)包絡分析(Data Envelopment Analysis, DEA)是一種多變量非參數(shù)統(tǒng)計分析方法,主要用于評估一組決策單元(Decision Making Units, DMUs)在利用一定資源(輸入)產(chǎn)生成果(輸出)方面的效率。這種方法最初由Charnes等在1978年提出,并迅速成為評估效率和生產(chǎn)力的一種重要工具,特別是在那些難以用單一指標衡量效率的場合中。由于DEA方法能夠處理多輸入多輸出的問題,并且不需要預設生產(chǎn)函數(shù)的形式,所以在銀行金融、醫(yī)療保健、教育和制造業(yè)等領域都有廣泛的應用。
近年來DEA方法在醫(yī)療領域得到了廣泛應用。首先在醫(yī)院效率評估領域[8],DEA方法被用于評估醫(yī)院的資源使用效率,分析輸入(如人員、設備、資金)與輸出(如患者滿意度、治療結果)的關系,幫助識別低效率醫(yī)院并提出改進建議。而在醫(yī)療服務質(zhì)量評估方面,DEA方法被用于評估醫(yī)療服務質(zhì)量,分析影響服務質(zhì)量的因素,以提升治療效果和患者滿意度。此外,在資源有限的情況下,DEA方法能夠優(yōu)化醫(yī)療資源配置[9],合理分配人力和物力資源,提高整體服務效率。DEA方法還被應用于醫(yī)療政策的制定與評估[10],通過比較不同政策下醫(yī)院的效率變化,為政策調(diào)整提供依據(jù)。
在疾病診斷方面,DEA方法的應用主要體現(xiàn)在以下幾個方面:(1)診斷工具效率評估:DEA可以用于評估不同診斷工具或方法在疾病診斷中的效率。例如,比較傳統(tǒng)的診斷方法(如影像學檢查、實驗室檢測)與新興技術(如機器學習算法)在識別特定疾病方面的效果,幫助確定哪種方法在資源使用上更為有效。(2)多種診斷指標綜合分析:在疾病診斷中,DEA方法可以綜合考慮多種輸入和輸出變量。例如,在癌癥的早期篩查中,可以將患者的基本特征、臨床指標以及檢驗結果作為輸入,通過DEA評估其對診斷準確性的影響,從而優(yōu)化篩查流程。(3)決策支持系統(tǒng):DEA方法可以與其他決策支持工具結合使用,幫助醫(yī)生在多種可能的診斷結果中做出最佳選擇。通過分析不同病例的特征與診斷結果之間的關系,DEA方法能夠為臨床決策提供有力支持。(4)優(yōu)化醫(yī)療資源分配:在公共衛(wèi)生領域,DEA方法可以幫助識別在特定疾病診斷中資源分配的效率,以確保醫(yī)療資源得到合理利用。這對于改善公共衛(wèi)生政策和提高醫(yī)療服務質(zhì)量具有重要意義。
判別分析(Discriminant Analysis, DA)是一種統(tǒng)計方法,主要用于分類預測問題,即根據(jù)一組特征變量(輸入變量)來預測類別標簽(輸出變量)。判別分析的核心在于開發(fā)一種算法,該算法能夠基于特征變量將觀測值正確地分配到已知的類別中去。判別分析方法能夠有效地處理多變量問題,其在醫(yī)學診斷領域有著非常廣泛的應用。例如在疾病診斷、患者分類、療效評估等領域。在乳腺癌疾病的診斷方面,判別分析可以用來區(qū)分良性和惡性腫瘤。通過對腫瘤標志物、細胞形態(tài)學特征等數(shù)據(jù)進行分析,可以開發(fā)出能夠有效識別不同類型腫瘤模型。通過這些應用,醫(yī)生可以更好地理解疾病的特征,提高診斷準確性,并為患者提供更個性化治療方案。
有關數(shù)據(jù)包絡分析方法和判別分析方法的學術研究起步比較早,自1978年起便開始有學者提出了相關的DEA方法評價模型[11],后續(xù)也陸續(xù)取得了一系列的成果,從此判別分析方法逐步引起了學者們的關注。到了1999年,學者Sueyoshi[12]將DEA方法和判別分析方法結合并提出了兩階段的判別分析方法——DEA-DA,其中第一階段需要找到?jīng)Q策單元的分類指標權重,第二階段實現(xiàn)對重疊部分的進一步分類。之后Sueyoshi又分別在2001年和2004年提出了非線性的判別分析方法和基于混合整數(shù)規(guī)劃的DEA-DA方法[13,14]。2006年Sueyoshi又提出了適合多組判別的DEA-DA方法[15],并在該論文中將DEA-DA方法與神經(jīng)網(wǎng)絡和決策樹進行了比對分析。然而,DEA-DA方法的研究存在如下兩個缺點:(1)指標權重約束的考慮問題:經(jīng)典的DEA模型中我們具有規(guī)模收益不變的CCR模型,規(guī)模收益可變的BCC模型[16],規(guī)模收益非遞減ST模型[17],規(guī)模收益非遞增FG模型[18],并將這些模型統(tǒng)一為CCW模型[19]。然而,在DEA-DA模型中目前僅有與CCR和BCC模型類似的對應約束模型,未發(fā)現(xiàn)權重累加約束大于1,小于1的情況,并且在引入無約束及權重累加小于1的情況還需要考慮平凡解問題。(2)投入產(chǎn)出指標的考慮:傳統(tǒng)DEA-DA模型未考慮各個指標權重正負性及適度性,模型中不能對指標權重的正負進行指定,直接計算出的權重可能造成與實際含義相悖的情況。
為此,本文在傳統(tǒng)DEA-DA模型的基礎之上提出了更為通用的改進DEA-DA模型。最后我們以569位病人的有關于乳腺癌患者的相關腫瘤標志物、細胞形態(tài)學特征的數(shù)據(jù)進行病情診斷結果分析,并與常見的幾種機器學習算法結果進行了比較分析。
1 改進DEA-DA模型
1.1 傳統(tǒng)DEA-DA基本原理
傳統(tǒng)的DEA-DA模型旨在對多個決策單元的效率進行評估與分類。DEA的效率測度能力和DA的分類能力,不僅能夠準確地評估各個決策單元的效率,還能進一步對這些單元進行有效的分類和預測。其模型基本原理如下:(1)DEA階段:利用DEA模型評估各DMU的相對效率。DEA是一種非參數(shù)方法,適用于多輸入多輸出情境,無需預設生產(chǎn)函數(shù)。通過線性規(guī)劃問題獲取每個DMU的效率評分,并將DMUs分為“有效”(評分為1)和“無效”(評分小于1)兩類,以識別資源浪費或產(chǎn)出不足。(2)DA階段:基于DEA結果,運用DA分析有效和無效DMU的差異。DA旨在找到判別函數(shù),最大化兩類DMU的分離程度,并識別影響效率的關鍵變量。最終判別模型可用于未來DMU的分類預測,幫助決策者優(yōu)化資源配置并提升效率。
1.2 改進DEA-DA模型
結合傳統(tǒng)DEA-DA方法存在的問題,引進兩階段改進DEA-DA的投入產(chǎn)出模型。
階段一(分類并識別重疊部分模型1):
min∑S+∑S
-∑vixij+∑wryrj+S-S=d,j∈G1-∑vixij+∑wryrj+S-S=d-,j∈G21(∑vi+∑wr+2(-1)=1vi≥0,i=1,2,…,m,wr≥0,r=1,2,…,sd:unresticted,≥0S,S≥0,j∈G1,S,S≥0,j∈G2 模型1
在模型1中yrj為第j個決策單元的第r個產(chǎn)出指標值,xij為第j個決策單元的第i個投入指標值,wr和vi分別是第r個產(chǎn)出指標和第i個投入指標的權重。G1,G2為事先已經(jīng)確定好的組別。η為大于零的某一實數(shù),根據(jù)實際指標數(shù)據(jù)特征進行靈活取定。β為權重,考慮兩組樣本數(shù)量可能相差較大且兩組判別重要性不等的情況。例如當樣本數(shù)量不均衡時可取定β=g1/g2,其中g1,g2分別為兩組樣本的數(shù)量,當兩組樣本重要性不同時也可靈活選取。
模型1的目標函數(shù)為兩組判別誤差加權總和的最小化。第一行約束條件為第一組樣本的判別約束。當S≥0時表示當前樣本指標評價值低于d,需要加上一個正數(shù)才能滿足約束條件,即誤判的情況。當S=0時,即S≥0指標評價值高于d,從而判別是正確的。第二行約束條件為第二組樣本的判別約束。當Sgt;0時表示當前樣本指標評價值高于d-η,需要減去一個正數(shù)才能滿足約束條件,即誤判的情況。當S=0時,即S≥0指標評價值低于d-η,從而判別是正確的。
模型1中的第三行約束條件中的δ1,δ2,δ3為模型的凸性約束條件。模型參數(shù)可取定四組特殊的取值用以代表四種不同的指標權重約束。分別是δ1=0,δ2=1,δ3=1、δ1=1,δ2=0,δ3=0、δ1=1,δ2=1,δ3=0和δ1=1,δ2=1,δ3=1。當δ1=0,δ2=1,δ3=1時,由于δ1=0,故而第三行約束條件沒有任何作用,即模型變?yōu)闊o權重約束的模型。當δ1=1,δ2=0,δ3=0時對應約束條件變?yōu)椤苬i+∑wr=1,δ1=1,δ2=1,δ3=0時,對應約束條件變?yōu)椤苬i+∑wr+γ=1,此時模型約束條件與∑vi+∑wr≤1等價;δ1=1,δ2=1,δ3=1時對應約束條件變?yōu)椤苬i+∑wr-γ=1,此時模型約束條件與∑vi+∑wr≥1等價。
通過模型1可將數(shù)據(jù)集G劃分為如下子集:
R1={j∈G|-∑vi*xij+∑wr*yrj≥d*}
R0={j∈G|d*gt;-∑vi*xij+∑wr*yrjgt;d*-η}
R2={j∈G|d*-η≥-∑vi*xij+∑wr*yrj}
C1={j∈R0|j∈G1}
C2={j∈R0|j∈G2}
其中,R0為重疊部分需要進一步處理,R1和R2分別為判別成組1和組2的樣本。若R0不為空,C1和C2分別為重疊部分來自組1和來自組2的樣本。引入d*到d*-η之間的指標評價值c,并通過模型2對重疊部分進行判別。
階段二(處理重疊部分模型2):
min∑S+∑S
s.t.-∑vi*xij+∑wr*yrj+S-S=c,j∈C1-∑vi*xij+∑wr*yrj+S-S=c,j∈C2d*≥c≥d*-S,S≥0,j∈C1,S,S≥0,j∈C2 模型2
在模型2中vi*,wr*均由模型1計算得出,β和η的取值與模型1相同。其目標函數(shù)為兩組判別加權誤差總和的最小化。第一行約束條件和第二行約束條件分別使C1中樣本大于指標評價值c以及C2中樣本小于指標評價值c的約束。第四行約束為指標評價值c應處于d*到d*-η之間。其余變量和約束條件的解釋與模型1相同。此外,模型2相較于線性DEA-DA模型,舍去了判別到其他類的極端數(shù)據(jù),僅關注并處理重疊部分,沿用了階段一的權重。
利用模型2可將重疊部分劃分如下:
(1)若-∑vi*xij+∑wr*yrj≥c*則j∈C1。
(2)若-∑vi*xij+∑wr*yrjlt;c*則j∈C2。
2 實證分析
2.1 改進DEA-DA模型分析結果
利用本文所提出的模型對569位病人的有關于乳腺癌患者的相關腫瘤標志物、細胞形態(tài)學特征的數(shù)據(jù)進行病情診斷結果分析。首先對數(shù)據(jù)進行缺失值、極端值與異常值處理,刪除對應行列的數(shù)據(jù),同時刪除與數(shù)據(jù)分析無關的指標變量。最終剩余18個相關指標變量和1個目標類別變量。所選取的變量指標特征、描述和數(shù)據(jù)類型如表1所示。
將處理過的訓練集和測試集數(shù)據(jù)輸入改進后的DEA-DA模型進行處理,得出以下的實驗結果,改進DEA-DA模型的分類報告如表2所示。
通過該模型的分類報告結果可以看出,對于類別1來說,Precision值為0.94;對于類別2來說,Precision值為0.8。對于類別1來說,Recall值為0.87;對于類別2來說,Recall值為0.9。F1-Score綜合考慮了Precision和Recall兩個指標,對于類別1來說,F(xiàn)1-Score值為0.9;對于類別2來說,F(xiàn)1-Score值為0.85。最終該模型準確率為0.88。
從該模型的混淆矩陣和誤差分布圖結果可以看出,在真實標簽為1(良性腫瘤)的情況下,有92個樣本被正確地預測,而有14個樣本被錯誤地預測為了2(惡性腫瘤)。在真實標簽為2(惡性腫瘤)的情況下,有6個樣本被錯誤地預測為了1(良性腫瘤),而有57個樣本被正確地預測為了2(惡性腫瘤)。
從圖1看出,橙色的ROC曲線在開始階段迅速上升,并在大部分時間里保持在藍色虛線上方,表明模型在識別正例樣本時表現(xiàn)較好。曲線下面積AUC為0.89.說明了模型的性能顯著優(yōu)于隨機猜測(AUC=0.5),并且接近完美分類器(AUC=1.0)。
從以上的數(shù)據(jù)可以看出,模型在類別1上的性能較好,特別是在精確率方面,這表明模型在預測類別1時很少有誤報。類別2的召回率非常高,但精確率相對較低,這表明模型在預測類別2時存在較多的假陽性。總體來看,模型的性能良好,特別是在準確率方面。
2.2 常用機器學習方法實驗結果
將訓練集和測試集數(shù)據(jù)輸入常用的機器學習模型,得出的結果如圖2所示。
從圖2分析結果可以看出,四個機器學習模型在預測良性和惡性腫瘤時展現(xiàn)出不同的性能特點。支持向量機模型表現(xiàn)最優(yōu),準確率達到0.96,在類別1和類別2上均有較高的Precision和Recall,分別為0.98和0.94,表明其在兩類之間的平衡性良好,適合對精確性要求較高的任務。神經(jīng)網(wǎng)絡模型的表現(xiàn)也非常優(yōu)秀,準確率為0.95,尤其在類別1上具有高Precision和Recall,說明其對多數(shù)類的預測能力較強,是一種穩(wěn)健的分類模型。
相比之下,隨機森林和決策樹模型的總體準確率分別為0.92和0.88,表現(xiàn)較好。隨機森林模型在類別1上的Precision和Recall較高,但在類別2上略有下降,表明其對小類別的區(qū)分能力稍弱。決策樹模型的Recall在類別2上最低,僅為0.75,存在較多漏判,但其在類別1上的Recall較高,適合不對小類別有特殊要求的情境。
圖3和圖4中給出了機器學習模型誤差分布圖和機器學習模型混淆矩陣。能夠觀察出不同方法的優(yōu)劣勢。
根據(jù)圖5和圖6的分析結果,四種模型在ROC曲線和AUC值上均表現(xiàn)較好。神經(jīng)網(wǎng)絡和支持向量機模型的表現(xiàn)最為突出,AUC均為0.99,表明它們在分類任務中的準確性和區(qū)分能力非常高,適合精度要求較高的任務。隨機森林模型的AUC為0.98,表現(xiàn)也非常優(yōu)異,接近神經(jīng)網(wǎng)絡和支持向量機,說明其對正類和負類的識別能力較強。決策樹模型的AUC為0.94,雖然略低于其他模型,但仍表現(xiàn)出不錯的分類效果。總體來看,神經(jīng)網(wǎng)絡和支持向量機在精度和泛化能力上更為出色,隨機森林次之,決策樹則適合對模型簡單性要求較高的場景。
從決策邊界圖和分類報告來看,各模型在區(qū)分兩類數(shù)據(jù)時的表現(xiàn)有明顯差異。神經(jīng)網(wǎng)絡和支持向量機模型的決策邊界相對平滑,尤其是支持向量機顯示出非線性的邊界,能更靈活地適應復雜數(shù)據(jù),結合其高AUC和分類指標表現(xiàn),這些模型適合復雜的分類任務。隨機森林的邊界較為穩(wěn)健,但靈活性不及支持向量機。相比之下,決策樹模型的邊界呈現(xiàn)出明顯的方塊形狀,說明其分類規(guī)則較為簡單,這在某些任務中可能導致誤判或欠擬合。總體而言,神經(jīng)網(wǎng)絡和支持向量機表現(xiàn)優(yōu)異,隨機森林次之,決策樹適合簡單分類任務。
2.3 模型比較分析
通過對改進DEA-DA模型與各機器學習算法模型分析結果以及表3模型指標的對比,可以得出以下結論。
(1)支持向量機模型在所有模型中表現(xiàn)最優(yōu),類別1和類別2的Precision、Recall和F1-Score均接近完美,總體準確率為0.96。其決策邊界較為平滑,并適應復雜的非線性邊界,適用于對精度要求較高的任務。
(2)神經(jīng)網(wǎng)絡模型緊隨支持向量機,整體準確率為0.95,類別1和類別2的Precision和Recall均較高。該模型在分類表現(xiàn)上十分穩(wěn)定,能夠在不同類別中保持較好的平衡。
(3)隨機森林模型表現(xiàn)稍遜于支持向量機和神經(jīng)網(wǎng)絡,準確率為0.92。雖然在類別1上的Recall表現(xiàn)優(yōu)異,但在類別2上略顯不足。隨機森林的決策邊界較穩(wěn)健但靈活性有限,適合對解釋性和穩(wěn)健性有要求的場景。
(4)改進的DEA-DA模型在類別1上表現(xiàn)較好,但在類別2的Precision上稍有不足,整體準確率為0.88。雖然其性能不如神經(jīng)網(wǎng)絡和支持向量機,但DEA-DA模型的可解釋性較強,適用于需要明確解釋的應用場景。
(5)決策樹模型的準確率為0.88略低于其他模型。其決策邊界呈方塊狀,模型規(guī)則簡單,導致在類別2的Recall上表現(xiàn)較差。該模型適用于對決策規(guī)則簡明且解釋性要求較高的任務。
3 結語
本文通過改進DEA-DA模型與多種機器學習算法的比較分析,發(fā)現(xiàn)不同模型在乳腺癌病情診斷中的表現(xiàn)各具優(yōu)勢。支持向量機和神經(jīng)網(wǎng)絡模型以其高精度和優(yōu)秀的分類能力,在判別精度方面具備了一定的優(yōu)勢。隨機森林在保證良好性能的同時,提供了一定的解釋性,適合應用于需要平衡準確性的場景。改進的DEA-DA模型雖然準確率適中,但在解釋性上具有明顯優(yōu)勢,對需要明晰決策依據(jù)的應用場景更為適合。決策樹模型盡管準確率最低,但其結構簡明,適合快速分類任務。綜合來看,不同模型適用于不同的應用需求,實際選擇應依據(jù)任務對精度、穩(wěn)定性和解釋性的具體要求,本文所提出的模型因其一定的判別精度和可解釋性更適合實踐應用。未來可對模型大規(guī)模化推廣及臨床實踐方面展開研究。
參考文獻:
〔1〕Bray F, Laversanne M, Sung H, et al. Global cancer statistics 2022: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA: a cancer journal for clinicians, 2024, 74(03): 229-263.
〔2〕梁鋅,楊劍,高婷,等.全球女性乳腺癌發(fā)病趨勢及年齡變化情況分析[J].中華腫瘤雜志,2023,45(04):313-321.
〔3〕唐鵬,嚴玉釗,胡瀅,等.早發(fā)現(xiàn)早治療,乳腺癌5年生存率可達90%以上[J].中華醫(yī)學信息導報, 2021,36(08):9.
〔4〕Wang L. Early diagnosis of breast cancer[J]. Sensors, 2017, 17(07): 1572.
〔5〕McKinney S M, Sieniek M, Godbole V, et al. International evaluation of an AI system for breast cancer screening[J]. Nature, 2020, 577(7788): 89-94.
〔6〕Yala A, Lehman C, Schuster T, et al. A deep learning mammography-based model for improved breast cancer risk prediction[J]. Radiology, 2019, 292(01): 60-66.
〔7〕Litjens G, Kooi T, Bejnordi B E, et al. A survey on deep learning in medical image analysis[J]. Medical image analysis, 2017,(42): 60-88.
〔8〕Dinc G , Dinc M S, Andronic M L . The efficiency of the healthcare systems in EU countries–A DEA analysis[J]. Acta Oeconomica, 2020, 70(01): 19-36.
〔9〕Liu J S, Lu L Y Y, Lu W M, et al. A survey of DEA applications[J]. Omega, 2013, 41(05): 893-902.
〔10〕Weng S J, Wu T, Blackhurst J, et al. An extended DEA model for hospital performance evaluation and improvement[J]. Health Services and Outcomes Research Methodology, 2009,(09): 39-53.
〔11〕Charnes A, Cooper W W, Rhodes E. Measuring the efficiency of decision making units[J]. European journal of operational research, 1978, 2(06): 429-444.
〔12〕Sueyoshi T. DEA-discriminant analysis in the view of goal programming[J]. European journal of operational Research, 1999, 115(03): 564-582.
〔13〕Sueyoshi T. Extended DEA-discriminant analysis[J]. European Journal of Operational Research, 2001, 131(02): 324-351.
〔14〕Sueyoshi T. Mixed integer programming approach of extended DEA–discriminant analysis[J]. European journal of operational Research, 2004, 152(01): 45-55.
〔15〕Sueyoshi T. DEA-Discriminant Analysis: Methodological comparison among eight discriminant analysis approaches[J]. European journal of operational Research, 2006, 169(01): 247-272.
〔16〕Banker R D, Charnes A, Cooper W W. Some models for estimating technical and scale inefficiencies in data envelopment analysis[J]. Management science, 1984, 30(09): 1078-1092.
〔17〕Seiford L M, Thrall R M. Recent developments in DEA: the mathematical programming approach to frontier analysis[J]. Journal of econometrics, 1990, 46(1-2): 7-38.
〔18〕Fre R, Grosskopf S. A nonparametric cost approach to scale efficiency[J]. The Scandinavian Journal of Economics, 1985: 594-604.
〔19〕Charnes A, Cooper W W, Wei Q L, et al. Cone ratio data envelopment analysis and multi-objective programming[J]. International journal of systems science, 1989, 20(07): 1099-1118.
收稿日期:2024-10-31
基金項目:吉林省自然科學基金項目(20230101184JC);國家自然科學基金項目(72371115);國家社會科學基金項目(23FTJB002)