陳楠
摘要: 在奧密克戎的沖擊下,居民對相關藥品的需求激增,使得醫藥資源在一定時期內較為緊張,但各省市對資源的需求并非在同一時段,使得醫藥企業供應鏈管理的難度加大。基于大數據管理技術,分析了大數據在醫藥行業供應鏈管理中的應用流程,運用實證分析方法,得到以下研究結論:一是根據學術界的研究成果與醫藥企業供應鏈管理實踐,在醫療行業供應鏈管理系統中主要包含分布式流向數據管理、醫藥行業數據管理和醫藥終端智能管理3個主系統,在主系統下包含12個子系統。二是在海量數據管理中,需要對數據進行清洗,保證數據質量,數據質量的高低會對研究結論產生重要的影響。三是對比主系統和子系統的權重值可以判斷,在醫療行業供應鏈管理過程中,終端智能管理和數據清洗十分關鍵。
關鍵詞:大數據技術;醫藥行業;供應鏈管理;數據清洗;智能終端
中圖分類號:F274? ? ? 文獻標志碼:A? ? ? 文章編號:1008-4657(2024)02-0069-07
0? ? ? ? 引言
近年來,隨著計算機技術的快速發展,信息數據的數量和更新速度都超乎想象,這被統稱為大數據,大數據被廣泛應用于科學研究、商業活動等領域[ 1 ]。對于企業而言,大數據能夠為企業優化工作流程,帶來巨大的商業價值。在多年的經濟高速增長之后,經濟發展速度減緩,尤其是在新冠疫情的沖擊下,我國經濟發展有了新的變化和要求。大數據的出現使得信息共享更加透明,創新、智慧化凸顯。企業要想取得持續發展,就需要大膽創新,適應時代的要求。在新的競爭環境下,市場競爭包含多方面的內涵,這其中就有企業間供應鏈的競爭,企業想要有更好的發展保障,就需要有較好的供應鏈管理水平。對于醫藥企業而言,在近期奧密克戎的影響下,加上防控政策的及時調整,市民用藥需求激增,對于醫藥企業的供藥能力提出了挑戰。在現代化的信息技術中,大數據、物聯網有了較大的發展,管理方法也得到不斷創新,應用前景廣泛,使得供應鏈進入到了全新的發展階段——智慧化管理階段。
在市場需求激增的情況下,醫藥企業面臨諸多挑戰:醫藥行業數據共享難、藥物流向匯聚難、醫藥行業數據應用難。藥品的流向難以控制主要是藥物的來源比較廣、變化快、缺乏統一管理,在數據匯總時操作不規范,導致數據分布較為雜亂。數據分享困難主要是由于在醫藥行業內部缺乏統一的數據管理體系,醫藥公司的管理終端五花八門,數據端口不統一,統計的口徑也不一致。
1? ? ? ?文獻綜述
在當今世界的醫藥行業中,美國、瑞士、德國實力較強。根據全球醫藥企業排行榜,美國的醫藥企業遙遙領先,國內醫藥企業和國際頂尖企業還存在不小差距。張樹山等[ 2 ]認為美國的醫藥行業發展較早,在供應鏈管理上已經形成了幾種較為成熟的模式:產品導向管理模式、研發導向管理模式和市場導向管理模式。這些模式的共同特點是有利于企業的降本增效,根據市場的變化及時調整發展方向,積極覆蓋醫藥行業供應鏈的各個環節。在行業規范性管理上,美國食品藥品監督管理局推出了詳細的藥品管理規范,解決了數據不統一導致的管理效率低下的問題,為我國醫藥行業供應鏈管理提供了參考。
目前,大數據技術發展日益成熟,在金融、政府管理等方面得到廣泛應用。祝由等[ 3 ]認為,大數據技術在醫藥企業決策上也有用武之地,借助大數據管理平臺整合醫藥企業的供應鏈信息,將業務訂單、庫存、藥品經銷商等信息綜合運用,可幫助企業進行科學決策。大數據技術在醫藥企業供應鏈體系中的運用需要企業具備必要的數據處理能力,否則數據接入會對公司運作產生不利影響。在供應鏈管理方式上,從線下到線上的管理順應了醫療服務需求升級的新趨勢,對零售終端的管理成為醫藥企業發展的新方向。王昕天等[ 4 ]指出在新的供應鏈中,由于銷售和采購都實現了線上管理,大部分信息一時間難以同步至線上,引發出了信息孤島問題,這是在大數據技術運用中需要注意的問題。夏杰長等[ 5 ]認為醫藥企業可以建立線上線下的雙向管理平臺,實現銷采在系統中的統一管理。在現有的供應鏈管理中,藥品的銷售方向、類型、數量等等,都是醫藥企業競爭的關鍵所在,對其管理要基于豐富的醫藥行業數據,對藥品流向進行快速分析,挖掘數據的潛在價值,避免產生信息滯后的問題。根據中國醫藥健康信息化聯盟所發布的公開信息,在2021年的年度調研報告中,大多數醫藥企業沒有合適的供應鏈管理系統。
目前,大數據技術被廣泛運用于各行各業,但是大部分學者的研究焦點都集中在政府管理、生產制造等熱門領域,對醫藥行業的運用研究較少。從研究方法來看,在以往的研究中大多是定性研究,定量研究較少。本文采用了實證研究方法,既有理論上的推導,也有實證上的理論驗證,將定性和定量研究的方法結合起來,構建了大數據技術在醫藥行業供應鏈管理中的深度應用模型[ 6-7 ],整合流向管理、主數據管理等資源,優化我國醫藥行業的供應鏈管理水平,希望能為醫藥企業的精細化決策提供技術支持。
2? ? ? ? 醫療行業供應鏈管理系統分析
本文主要采用物流系統分析法得到供應鏈管理中的關鍵信息,結合大數據技術,為供應鏈管理系統建設提供借鑒。物流系統分析法通過分析生產流程過程發現企業所面臨的問題,其具體做法是將企業生產工藝的全過程,包括進貨、選料、制造、包裝、存儲、發售、運輸等各階段,按順序得到具體流程,然后再對各階段逐項進行分析,以發現可能遭遇到的各種困難及其潛在的阻礙因素。在供應鏈管理系統中主要包含分布式流向數據管理、醫藥行業數據管理和醫藥終端智能管理。
2.1? ? ? ?分布式流向數據管理
分布式流向數據管理由多個模塊所組成,有文件管理模塊、藥品流向采集模塊、任務管理模塊、元數據管理模塊、藥品流向預處理模塊。從理論角度來看,在上述模塊中,藥品流向采集模塊和藥品流向預處理模塊屬于核心模塊,對分布式流向數據管理有重要影響。在元數據管理模塊中,不斷的和業務數據庫的實時數據進行交互處理,能夠快速對數據進行查詢和修正,對經銷商的數據和藥廠的數據進行協調管理,動態掌握市場信息,實現藥品流向的動態管理,在醫藥行業供應鏈管理中有著重要的意義和價值[ 8 ]。另外,在系統中還設置有任務管理模塊,主要用于統計資源的耗時情況,統計數據流向的到達效率,能夠對數據進行有效的收集與預處理。
2.2? ? ? ? 醫藥行業數據管理
醫藥行業數據是大數據技術在供應鏈管理中的應用基礎,通過對行業數據的收集,建立龐大的數據庫,為數據決策奠定基礎。在醫藥行業數據管理中,主要有聚合計算模塊、數據同步模塊、終端管理模塊、用戶權限管理模塊,各個模塊之間并不是獨立運作,而是相互之間互相關聯,環環相扣。數據清洗模塊主要是對大量的原始數據進行識別、整理、歸類,清洗完成的數據會進入數據庫,在需要時進行自動調取。數據同步則是對原始數據進行動態更新調整,保證數據的有效性,避免“過時”數據造成決策失誤。終端管理模塊主要是對組織機構進行管理,數據的存儲和取用都采用統一的標準,避免了因統計口徑的差異造成的數據偏差[ 9 ]。用戶權限管理模塊則是對數據使用人進行規范管理,在海量數據中會存在部分敏感信息,涉及到企業的商業秘密,分權管理顯得十分有必要。
2.3? ? ? ? 醫藥終端智能管理
在醫藥終端智能分析系統中,設置有數據同步模塊、用戶權限管理模塊、聚合計算模塊、終端管理模塊。雖然在不同的管理系統中設置有相同的模塊,但是功能卻不盡相同,在終端智能分析管理中,各個模塊的功能偏向于結果運用。在數據同步模塊中,將不斷增量的藥品名稱寫入Hive模塊,并且在數據倉庫中進行批量化更新,同時將數據更新設置到ES模塊中,使得產品主數據得到應用。在終端管理模塊和聚合計算模塊中,主要用于構建醫藥終端畫像,指導企業的研發和生產活動[ 10 ]。具體來看,聚合計算模型主要是統計醫藥企業的購買數量、購買金額、產品銷量、產品市場占有率等數據。終端管理模塊則是對數據進行自動計算,將結果呈現給用戶,使得藥企能夠根據市場變化情況調整經營策略,同時也能控制藥品的流向,有效控制藥品的流向,使得需要的人獲得需要的藥品,對于企業和社會而言都有著重要意義。通過上述分析,可以得到大數據在醫藥行業供應鏈管理中的應用模塊,如圖1所示。
3? ? 大數據在醫藥行業供應鏈的深度應用分析
大數據技術在醫藥行業供應鏈系統的應用主要可以分為優化數據清洗和優化輸出結果兩個層次。優化數據清洗是結果輸出的基礎,在缺少大數據技術支持的前提下,醫藥企業的生產與市場需求之間往往存在一定的時間差,導致生產計劃不能及時滿足市場需求。大數據技術的深度應用則會幫助企業通過大數據技術,及時能夠獲得市場信息,并據此做出科學的判斷,調配企業內部的生產資源,滿足市場需求。具體來看,大數據技術在醫藥行業的深度應用如下:
3.1? ? 優化機器數據清洗
在大數據的運用過程中,如何對各類數據進行有效處理是面臨的第一個問題,原始數據會對分析結果產生影響,會影響到企業決策的科學性,造成經營風險。數據清洗的主要對象是市場反饋的臟數據,本文主要采用BM25算法識別相似文本。在對中文分詞進行識別時,進行深度分詞,主要步驟可以分為:
第一,對輸入流進行拆分,利用分詞器讀取緩沖區的數據。
第二,將字符規范化,采用子分詞器處理字符。
第三,將中文外的字符進行過濾,然后對詞段進行重新排列。根據新的隊列匹配新的詞段,形成全新的檢索詞典,即從詞段匹配出分支節點,以此類推向下匹配。數據的匹配規則可以設置為“完全匹配”、“不匹配”和“前綴匹配”三種類型。如果完全匹配則加入數據庫,如果不匹配則從數據庫剔除,如果前綴匹配則作為新詞源的前綴。
第四,循環執行以上三步,對數據集進行重置,記錄分詞的緩沖區,將新的數據錄入分詞區。
在計算數據相關性方面,本文主要采用BM25算法評價法,BM25抑制了詞頻,能夠保證返回值趨于一個固定值。根據詞頻在文檔中所出現的平方根,檢索結果在其中出現的頻率越高,相關性會越來越高。在逆向文檔出現的頻率中,頻率越高,相關度就越低。BM25相關度的計算公式為:
在上述公式中,Q表示為分詞結果集合,qi表示詞元,d表示為數據集的文本。Wi為qi的IDF值,N指的是數據集的總數。為了避免出現分母為0的情況,特設置系數為0.5。顯然,數據集越多,qi的值就越小,Wi的值就越大。dl表示數據集的長度,avgdl表示所有數據集的平均長度,k1表示為b的調節因子。因此,相似度分數score表示為相關系數的累加。
針對大量數據的收集,首先需要進行數據清洗,提升數據質量。根據數據清洗流程,清洗匹配的結果可以分為三類:一是由終端管理器檢索ES所形成的高質量清洗數據集;二是經過相似任務查找所得到的中等質量數據集;三是未找到符合匹配條件的低質量數據集。高質量的數據集可以直接完成清洗,進入數據池,中、低質量數據集則由人工進行再次處理,處理流程如圖2所示。
大數據技術在數據清洗的深度應用,主要解決了企業數據收集難、數據處理難的問題,基于大數據技術的供應鏈管理系統既能儲存企業大量的信息數據,也能在市場上獲取實時的市場信息,建立企業自己的數據庫。同時,通過科學的算法,能夠對海量的數據進行清洗,保證數據質量,為市場需求預測奠定基礎。
3.2? ? 應用結果輸出
根據上述優化流程,以大數據技術為基礎,對醫藥行業的供應鏈全流程進行優化,通過海量的數據信息,能夠指導醫療企業供應鏈管理的方向,使得企業決策更加貼近市場。在三個子系統的輸出結果中,難以對結果進行量化,為了使得輸出結果更加直觀,特對每個子系統進行量化處理,便于對結果進行橫向比較。
為了準確計算各系統指標值的權重值,本文采用熵值法進行計算,其原理如下所示:
第一,對原始數據進行統一處理,達到統一統計口徑,如方程(4)所示:
其中,m = 12,指本文中供應鏈管理的12個指標。X″為各指標的均值,通過加權平移消除負數的影響。
第二,計算出各個指標的變異系數,如方程(5)所示:
Bij表示各個指標的變異系數。
第三,計算各個指標權重值,如方程(6)所示:
計算出各系統對應權重值如表1所示。
由表1可知,根據權重值的大小既能區分各個模塊的重要程度,不僅做到供應鏈管理工作有主有次,而且能夠根據權重值計算輸出結果的重要性,能夠將輸出結果進行量化比較,使得醫藥企業的決策更加量化。通過大數據技術在醫藥行業供應鏈管理中的運用,從醫藥企業的研發、采購、生產、銷售環節融入大數據技術,使得企業的管理始終面向市場和客戶,合理管控醫藥資源。具體來看,在主系統中,醫藥終端智能管理的權重值最大,值為0.419,分布式流向數據管理和醫藥行業數據管理的權重值分別為0.338和0.243。在子系統中,數據清洗處理的權重值為0.136,數據同步管理的權重值為0.132,藥品流向采集模塊的權重值為0.113,其余子系統的權重值均超過0.1。通過比較主系統和子系統的權重值,能夠發現在供應鏈管理流程中需要重點關注的指標,比如數據清洗本文采用較為豐富的方法進行論證,在權重值部分也得到了證實其必要性。
4? ? 結論與建議
4.1? ? 結論
本文基于大數據管理技術,對醫藥行業供應鏈管理進行了分析,首先分析了醫療企業供應鏈管理的流程,對其中的主系統和子系統進行了設置。其次,根據供應鏈管理的流程,分析了其中的關鍵技術難點,運用數據清洗技術解決了這一問題。最后,運用熵值法結果輸出結果進行量化,便于進行量化決策。通過本文的實證分析,得到以下研究結論:一是根據學術界的研究成果與醫藥企業供應鏈管理實踐,在醫療行業供應鏈管理系統中主要包含分布式流向數據管理、醫藥行業數據管理和醫藥終端智能管理3個主系統,在主系統下包含12個子系統。二是在海量數據管理中,需要對數據進行清洗,保證數據質量,數據質量的高低會對研究結論產生重要的影響。三是對比主系統和子系統的權重值可以判斷,在醫療行業供應鏈管理過程中,終端智能管理和數據清洗十分關鍵。
4.2? ? 建議
4.2.1? ? 立足供應鏈管理主系統與子系統,利用大數據技術,分步驟構建供應鏈管理系統
根據本文的研究結論,醫療企業供應鏈系統的構建并非一朝一夕,需要分步驟逐步深入。首先,在供應鏈管理優化上可以大力引進大數據管理技術,建立跨部門的研發團隊,適度引進外部技術,建立可視化的大數據管理平臺,對于供應鏈管理的優化具有重要作用。其次,在公司內部技術力量有限的情況下,可以大膽和第三方專業的技術公司合作,通過合作引進較為全面和豐富的技術,能夠對原始系統進行不斷的調整和優化。專業的技術公司往往在專業能力上更為突出,避免了企業花費大量的時間和精力進行研發,提升了工作效率,在短時間內完成多個數據端口的對接,但是在合作的過程中要注意數據保密。最后,在構建供應鏈系統時應該具有全局思維和發展思維,充分考慮系統的更新和換代,對數據接口的設計應該考慮未來發展的兼容性,從設計上保證系統的及時性。
4.2.2? ? 提升數據質量,注重數據更新,對數據進行動態調整
對醫療企業而言,建立完善的供應鏈管理系統只是第一步,高質量的數據才是系統管理的關鍵。在數據來源方面,不同的企業有著不同的管理口徑,在數據錄入時要建立統一的數據管理標準,統一統計口徑,避免產生統計誤差。因此,在這一過程中要對數據進行及時更新,使得企業能夠掌握前沿的市場信息,保證決策的時效性,避免產生經營風險。此外,對于其中錯誤的信息要及時進行調整,幫助企業合理分配資源,使企業最大限度滿足市場需求。在海量數據的沖擊下,在系統設計上要充分考慮到系統的處理能力,要建立足夠大的數據池,提高數據計算的效率。當數據池容納不了原有數據時,要有備選方案對數據進行備份,避免數據丟失造成損失。
4.2.3? ? 提升數據終端的智能管理能力
根本本文的研究結論可知,在醫療行業供應鏈管理過程中,終端智能管理和數據清洗十分關鍵。在處理海量的數據時,要嚴格按照流程進行數據清洗,對原始數據進行高、中、低分類,對中、低質量的數據要使用人工進行再次分類,采用多種方法提升數據質量。數據清洗是一個反復的過程,不可能在幾天內完成,只有不斷的發現問題,解決問題。對于是否過濾,是否修正一般要求系統進行確認,對于過濾掉的數據,寫入Excel文件或者將過濾數據寫入數據表,在ETL開發的初期可以每天向業務單位發送過濾數據的備份,可以作為將來驗證數據的依據。數據清洗需要注意的是不要將有用的數據過濾掉,對于每個過濾規則認真進行驗證,并要用戶確認。
參考文獻:
[1]卓志毅,何躍,閻洪.構建中間需求模式的制造商最優產品供應策略模型[J].技術經濟,2020,39(12):110-116.
[2]張樹山,胡化廣,孫磊,等.供應鏈數字化與供應鏈安全穩定——一項準自然實驗[J].中國軟科學,2021(12):21-30.
[4]王昕天,荊林波.疫情防控中農產品流通堵塞原因、短期應對與長期設想[J].中國流通經濟,2022,36(12):55-67.
[5]夏杰長,劉慧.以產業融合壯大實體經濟:作用機理與推進策略[J].財經問題研究,2023,(1):3-12.
[6]蔣殿春,魯大宇.供應鏈關系變動、融資約束與企業創新[J].經濟管理,2022,44(10):56-74.
[7]潘琳,徐夏靜,周榮庭.博弈視角下社區生鮮食品供應鏈雙渠道動態定價研究[J/OL].中國管理科學:1-12.(2022-12-07)[2023-01-01].https://doi.org/10.16381/j.cnki.issn1003-207x.2021.1506.
[8]宋曉晨,毛基業.基于區塊鏈的組織間信任構建過程研究——以數字供應鏈金融模式為例[J].中國工業經濟,2022(11):174-192.
[9]馮穎,馮仰超,張景雄,等.考慮產運環節碳排放的生鮮低碳供應鏈運營決策[J].系統管理學報,2024,33(1):1-15.
[10]段彩泉,姚鋒敏,滕春賢.隨機需求下考慮廣告遺忘效應的多周期閉環供應鏈網絡均衡[J].運籌與管理,2023,32(2):29-37.
Plication Evaluation of Big Data in Pharmaceutical
Supply Chain
CHEN? Nan
(School of Economics, Bengbu College, Bengbu 233000, China)
Abstract:Under the impact of Omicron, due to the surge of residents' demand for related drugs, the medical resources are relatively tight in a certain period of time, but the demand for resources in various provinces and cities is not at the same time, which makes the supply chain management of pharmaceutical enterprises more difficult. Based on big data management technology, this paper analyzes the application process of big data in pharmaceutical supply chain management, and uses empirical analysis method to reach the following research conclusions: First, according to the research results of the academic circle and the supply chain management practice of pharmaceutical enterprises, the supply chain management system of the medical industry mainly includes three main systems: distributed flow data management, pharmaceutical industry data management and pharmaceutical terminal intelligent management, and contains 12 subsystems under the main system. Second, in the mass data management, the data need to be cleaned to ensure data quality, which will have an important impact on the research conclusion. Third, by comparing the weight values of the main system and subsystems, it can be judged that terminal intelligent management and data cleaning are very critical in the process of supply chain management in the medical industry.
Key words:big data technology;pharmaceutical industry;supply chain management;data cleaning;intelligent terminal
[責任編輯:許立群]