□ 顏勇卿 YAN Yong-qing 徐軍 XU Jun 魯秀明 LU Xiu-ming
Objective To study the outpatient visit time and its influencing factors by the method of data science, and to explore the ways to improve the efficiency of outpatient visits. Methods All the records of outpatient services in 2019 in a tertiary specialized hospital were analyzed by python under Anaconda 1.9.7. p< 0.05 was considered statistically significant, and scikit-learn 0.22.1 was used for machine learning. Results The volume change among different periods within a day were statistically significant, but not among days within a week or months within a year. The time spent by the patients for outpatient visit did not change significantly in the above three time ranges. The time spent by the patients for outpatient visit was affected by several factors, including age (0.169), outpatient volume of the day (0.140),number of visits in the past year (0.127), and periods of visit (0.124). Conclusion The time spent for outpatient visit is affected by several factors. The efficiency of outpatient visits can be improved by optimizing the procedures of outpatient visits based on data science in the absence of large investment.
就診時(shí)間是影響門診服務(wù)滿意度的重要因素,是醫(yī)療機(jī)構(gòu)整體管理水平、醫(yī)療質(zhì)量及服務(wù)質(zhì)量的重要體現(xiàn)[1],以往針對患者就診時(shí)間的研究多用隨機(jī)抽樣方法,醫(yī)院信息化發(fā)展之后,也有學(xué)者利用醫(yī)院信息平臺數(shù)據(jù)進(jìn)行分析。隨著以大數(shù)據(jù)為代表的數(shù)據(jù)科學(xué)興起,各種方法及分析框架不斷涌現(xiàn),使對門診大數(shù)據(jù)的分析成為可能[2-3]。本研究選取某婦兒三甲醫(yī)院2019年全年的數(shù)據(jù),利用數(shù)據(jù)科學(xué)軟件和方法分析患者就診時(shí)間分布和影響因素,探索門診管理及流程進(jìn)一步優(yōu)化的措施。
1.研究對象。以該院2019年全年門診兒童和成人患者為研究對象,數(shù)據(jù)來源為醫(yī)院信息化平臺數(shù)據(jù)庫,以數(shù)據(jù)庫中記錄的各時(shí)間節(jié)點(diǎn)作為時(shí)間序列(在各時(shí)間節(jié)點(diǎn)的耗時(shí)分析中去除需要預(yù)約且預(yù)約時(shí)間超過1天的特殊化驗(yàn)和檢查,其余分析包括全部可用數(shù)據(jù)),因患者離院時(shí)間難以明確,研究中以患者單次就診的首次時(shí)間節(jié)點(diǎn)和末次時(shí)間節(jié)點(diǎn)差值(文中簡述為“整體時(shí)間”)間接反映單次就診總耗時(shí)。
2.研究方法。數(shù)據(jù)處理在Anaconda1.9.7下進(jìn)行(編譯器python3.76;虛擬環(huán)境conda 4.83;開發(fā)環(huán)境Jupyter Notebook 6.03,數(shù)據(jù)清洗pandas1.02、numpy1.18.1;統(tǒng)計(jì)計(jì)算statsmodels0.11、scipy1.4.1;可視化Seaborn0.1,pyecharts1.71;機(jī)器學(xué)習(xí)scikit—learn0.22.1),以p<0.05作為具有統(tǒng)計(jì)學(xué)意義。
1.數(shù)據(jù)情況。共獲得原始數(shù)據(jù)2645915條,經(jīng)過去重、去空得到有效數(shù)據(jù)2640200條,時(shí)間跨度從2019年1月1日—12月31日,其中小兒急診744865人次,小兒門診892386人次,成人急診75353人次,成人門診927596人次,所有門診記錄中提前預(yù)約的853830人次。
2.年齡分布。如圖1所示,小兒門急診患者在嬰兒期的最多,其次在幼兒期有較低的高峰,而成人門急診主要集中在育齡女性,成人急診在20歲以下有一高峰。

圖1 門診患者年齡分布
3.年齡組與疾病的關(guān)系。小兒按新生兒、嬰兒、幼兒、學(xué)齡前、青春期等分組,成人按年段分組,如圖2桑基圖顯示各年齡段排名前五的疾病譜,各年齡組主要疾病組成各不相同。

圖2 門診不同年齡組患者前五種疾病
4.時(shí)間序列分析
4.1 就診人數(shù)時(shí)間序列分析
4.1.1 一年內(nèi)各月份就診人數(shù)。1月、12月和7月患者人數(shù)最多,整體各月份患者數(shù)量變化不大(圓形分布[4],Rayleigh法,下同,Z=0.313,p=0.151,差異無統(tǒng)計(jì)學(xué)意義)。
4.1.2 一周內(nèi)患者人數(shù)變化。以周日和周一略多于其他時(shí)間,差異無統(tǒng)計(jì)學(xué)意義(Z=0.371,p=0.224)。
4.1.3 一天內(nèi)各時(shí)間段患者就診人數(shù)。如圖3所示,小兒急診明顯多于成人急診,且在9∶00~9∶59和19∶00~19∶59時(shí)間段呈雙峰分布,最低點(diǎn)位于23∶00~23∶59時(shí)間段,成人急診基本在7∶00~19∶59時(shí)間段內(nèi)呈均勻分布。門診患者亦呈雙峰分布,上午就診患者高峰位于8∶00~8∶59和 9∶00~9∶59兩個(gè)時(shí)間段,下午高峰位于13∶00~13∶59和14∶00~14∶59兩個(gè)時(shí)間段,但是明顯低于上午,各時(shí)間段間差異有統(tǒng)計(jì)學(xué)意義(Z=0.271,p=0.048)。

圖3 門診一天內(nèi)不同時(shí)間段就診人數(shù)變化
4.2 患者就診整體耗時(shí)的時(shí)間序列分析。常規(guī)的均值統(tǒng)計(jì)計(jì)算在樣本量大于5000時(shí),輕微差異即能使p值小于0.01[5],本研究不同時(shí)間組間均存在統(tǒng)計(jì)學(xué)差異,且p<0.001。
4.2.1 一天內(nèi)各時(shí)間段患者就診消耗的整體時(shí)間變化。如圖4所示,門診患者11∶00~11∶59時(shí)間段消耗的時(shí)間最長,下午逐漸下降。急診小兒凌晨2∶00~2∶59時(shí)間段是消耗時(shí)間的最高峰,次高峰也在11∶00~11∶59時(shí)間段,成人患者與小兒類似,但在8∶00~8∶59時(shí)間段有一高峰期。

圖4 患者一天內(nèi)不同時(shí)段門診耗時(shí)
4.2.2 一周內(nèi)各日患者就診消耗的整體時(shí)間變化。門診相對于急診變化較小,門急診均為周末消耗的整體時(shí)間較長。
4.2.3 年內(nèi)每月就診整體時(shí)間變化。如圖5,門診就診整體時(shí)間變化較急診明顯平緩,小兒急診變化較為明顯,尤其冬季,整體時(shí)間明顯上升。

圖5 患者不同月份門診就診耗時(shí)
5.門診就診耗時(shí)的影響因素
5.1 從就診耗時(shí)的整體來看(圖6),耗時(shí)最短的是取藥等候時(shí)間,門急診和成人兒科普遍較好,最長的是兒科急診的從取號到繳費(fèi)以及整體就診時(shí)間。

圖6 患者門急診各時(shí)間段耗時(shí)
5.2 不同患者特點(diǎn)的對比。門診與急診、成人與小兒、是否預(yù)約、醫(yī)保與自費(fèi)間各消耗時(shí)間除成人與小兒門診“繳費(fèi)到化驗(yàn)”外,差異均有統(tǒng)計(jì)學(xué)意義。
5.3 患者年齡與消耗時(shí)間的相關(guān)性。成人組和小兒組相關(guān)性均存在,p<0.001,但相關(guān)程度較低(成人組各消耗時(shí)間r在-0.091~-0.020之間,小兒組r在-0.029~-0.009之間,spearman相關(guān)性)。
5.4 患者既往1年內(nèi)就診次數(shù)與消耗時(shí)間的相關(guān)性。成人組和小兒組相關(guān)性均存在,p<0.001,成人組各消耗時(shí)間r在-0.129~-0.001之間,小兒組r在-0.023~0.020之間。
5.5 當(dāng)天就診人數(shù)與消耗時(shí)間的相關(guān)性。成人組和小兒組相關(guān)性均存在,且呈正相關(guān),p<0.001,成人組各消耗時(shí)間r在0.024~0.046之間,小兒組r在0.029~0.147之間。
6.監(jiān)督學(xué)習(xí)。利用機(jī)器學(xué)習(xí)的方法,對所有因素納入回歸的范圍,以“整體時(shí)間”為因變量(采取隨機(jī)森林的方法[6],測試集劃分0.3,隨機(jī)樹數(shù)量200,開啟袋外評估,有放回的采樣,內(nèi)部節(jié)點(diǎn)分裂的最小樣本數(shù)2,葉節(jié)點(diǎn)最小樣本數(shù)1,不確定性計(jì)算采取基尼指數(shù)),模型擬合之后預(yù)測準(zhǔn)確率僅為8.3%,納入模型的患者特點(diǎn)指標(biāo)及其重要性指數(shù)分別為年齡(0.169)、當(dāng)天就診人數(shù)(0.140)、既往一年就診次數(shù)(0.127)和就診時(shí)刻(0.124)。
數(shù)據(jù)科學(xué)是采用各種科學(xué)方法、處理過程、計(jì)算算法、系統(tǒng)體系從各種數(shù)據(jù)中提取和發(fā)現(xiàn)知識的一門交叉學(xué)科,通過研究不同數(shù)據(jù)類型、狀態(tài)和屬性及其變化規(guī)律揭示自然界和人類行為等現(xiàn)象背后的規(guī)律。數(shù)據(jù)科學(xué)采用了數(shù)學(xué)、統(tǒng)計(jì)學(xué)、信息科學(xué)和計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科的技術(shù)和原理,去分析和理解數(shù)據(jù)中的實(shí)際現(xiàn)象[7]。數(shù)據(jù)科學(xué)的發(fā)展給處理大型的臨床數(shù)據(jù)帶來了極大的便利,避免了調(diào)查問卷等方法抽樣過程中產(chǎn)生的誤差[8-9]。國內(nèi)的研究多側(cè)重于管理上的探討[10-12],實(shí)際應(yīng)用的較少,本研究利用python語言對2019年全部數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析。
有學(xué)者通過大樣本的調(diào)研證實(shí),門診患者在不同類型的醫(yī)院中候診時(shí)間與總體滿意度均呈負(fù)相關(guān),候診時(shí)間越長,滿意度越低[13-14]。網(wǎng)絡(luò)化的預(yù)約掛號是近幾年興起的解決候診時(shí)間問題的重要測試,預(yù)約掛號最大限度地節(jié)省了患者時(shí)間[15],而就診過程中的輔助檢查預(yù)約等多種人性化服務(wù),又有效縮短了患者就診間非醫(yī)等候時(shí)間[16]。但是在實(shí)際運(yùn)行中,許多患者仍然把預(yù)約掛號停留在“掛上號”的階段,而并未按照預(yù)約的時(shí)間就診,通過圓形分布法計(jì)算得出一天內(nèi)不同時(shí)間段患者就診人數(shù)仍存在集中的趨勢。
從兒科專業(yè)特點(diǎn)講,患兒語言表達(dá)能力弱,有的甚至沒有表達(dá)能力,病史采集困難,查體化驗(yàn)等不配合[17],均可能造成門診耗時(shí)增加,但是本研究結(jié)果中雖然急診兒科耗時(shí)明顯高于成人,門診甚至低于成人,考慮其原因可能是兒科呼吸道疾病在冬季常聚集性的高發(fā),而這部分患者常在兒科急診就診,而對于門診的兒科患者,常由多名家屬陪同,便于分工合作,反而節(jié)省了時(shí)間,這也從一個(gè)側(cè)面反映除了疾病本身的原因外,門診流程等管理上的提高也能大量節(jié)省就診時(shí)間。
患者在門診消耗的時(shí)間受多種因素的影響,盡管采用了監(jiān)督學(xué)習(xí)建模回歸,但是預(yù)測成功率仍然較低,從研究結(jié)果得到比較重要的影響因素主要有4個(gè):年齡、當(dāng)天就診人數(shù)、既往一年就診次數(shù)、就診時(shí)刻,提示在流程方面改進(jìn)可以從這幾個(gè)方面入手。患者年齡與就診耗時(shí)呈較低程度的負(fù)相關(guān),結(jié)合圖2考慮疾病譜在不同年齡的分布是其可能的原因,老年患者常為腫瘤等慢性疾病復(fù)查,流程熟悉,就診時(shí)間短,而在小兒,越小的小兒越不容易配合,年輕的成人患者耗時(shí)反而高于老年患者,這部分患者對手機(jī)微信等接受能力更強(qiáng),通過手機(jī)等對就診流程作出進(jìn)一步詳細(xì)的指導(dǎo)可能會有助于減少耗時(shí)。既往一年就診次數(shù)提示了患者對就診流程各科室地理位置的熟悉程度,提示在地理位置標(biāo)識上可能仍然存在漏洞,今后可通過向患者進(jìn)行問卷調(diào)查,網(wǎng)絡(luò)收集意見等等方法進(jìn)一步了解哪些醫(yī)院設(shè)施的位置標(biāo)識存在問題。結(jié)合對患者人數(shù)和就診耗時(shí)的時(shí)間序列分析,當(dāng)天就診人數(shù)和就診時(shí)刻反映患者就診時(shí)仍有明顯集中的趨勢,除了加大宣教力度,指導(dǎo)患者按照預(yù)約單約定時(shí)間就診外,適當(dāng)根據(jù)人流量的變化調(diào)整醫(yī)院分診臺、抽血窗口等的人手能減少患者等候時(shí)間,要更準(zhǔn)確的預(yù)測人流變化和人手調(diào)配,TensorFlow等分布式深度學(xué)習(xí)框架可能提供更大的幫助[18-19]。