999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于VSM的海量醫學資源特定信息優化聚類模型

2021-11-17 07:36:10寧鵬飛
計算機仿真 2021年6期
關鍵詞:資源信息方法

劉 鵬,寧鵬飛

(內蒙古醫科大學,內蒙古 呼和浩特 010000)

1 引言

信息技術的發展不但打破了用戶獲得醫學信息的時空限制,并且使可供利用的醫學資源特性信息更加豐富[1]。科學和技術的發展在信息數據全球化的背景下,信息聚類在很多領域都有廣泛的應用,但是,當前方法在去噪過程中無法保存有效信息,細節信息流失現象較為嚴重,導致Jaccard系數與F1系數偏低,即聚類效果并不理想[2-3]。醫學信息用戶需要熟悉網絡學術信息資源的分布特征與價值,并且要掌握這些資源的聚類技巧,才能通過醫學資源特定信息的聚類實現自己的研究工作,因此對海量醫學資源特定信息進行聚類處理具有重要意義[4]。

文獻[5]提出基于信息共識的醫學資源特定信息聚類方法,該方法利用CDIM方法獲得初始聚集,通過參數方法初始化處理初始聚集,在簇標簽信息間關系的基礎上構建信息共識,利用文本分類器將簇標簽分配給構建的共識,通過訓練文本分類器實現醫學資源特性信息的聚類,該方法沒有對醫學資源特定信息進行去噪處理,導致Jaccard系數較低。文獻[6]提出基于需求功能語義的醫學資源特定信息聚類方法,該方法在服務需求中利用自然語言處理技術提取有用功能信息集,根據獲取的信息集對服務功能語義對應的相似度進行計算,在相似度計算結果的基礎上通過k-means算法實現海量醫學資源特定信息的聚類,該方法在去噪過程中無法保留細節信息,導致Jaccard系數較低。文獻[7]提出基于分量屬性近鄰傳播的醫學資源特定信息聚類方法,該方法首先運用動態時間彎曲法計算多變量時間序列的總距離,將獲得多種數據時間的整體距離通過近鄰傳播的方式進行分類,并結合多種序列數據下存在的聯系及初始時間數據的顯示關系實現醫學資源特定信息的聚類,該方法在分類過程中無法保留有效信息,導致F1系數較低。

為了解決存在的問題,提出基于VSM的海量醫學資源特定信息優化聚類模型,通過對醫學資源信息進行信息預處理及特征提取,在VSM的基礎上建立醫學資源特定信息優化聚類模型,以幫助用戶提高對海量醫學資源特定信息的聚類與應用能力。

2 海量醫學資源特定信息預處理

2.1 醫學資源特定信息降維處理

現實生活中每個數據集的結構都較為復雜,降維處理后的低維數據和原高維數據都盡量滿足相同的流形結構時,建立基于VSM的海量醫學資源特定信息降維目標函數。降維目標函數利用半監督醫學資源特定信息與無標記數據中隱含的醫學資源信息來維持全局流形和局部流形[8]。通過CSDDR算法分別定義全局和局部流形,標量Qg主要用于表示醫學資源中全部的樣本全局流形結構,通過正負約束對設定的目標函數進行調整,標量Qg的計算公式如下

(1)

(2)

式中,nc為正約束對的數量。正負約束的貢獻值分別用α與β來調整。在計算投影距離時,為了降低不同醫療資源之間的差距,首先需要降低相同類型醫療資源的距離,增加不同類型醫療資源的距離。結合先驗知識可知,通常情況下,負約束的樣本距離更加接近期望值[9]。因此一般會取α=1與β>1,當α的值過大時,數據樣本距離聚類越來越近,數據樣本特征性質產生負面影響,此時聚類中心存在明顯偏移或者錯誤識別噪聲點的現象等。

利用先驗信息中所包含的全局流形信息與未標記的信息樣本中隱含的局部結構流形信息,來獲得詳細流形信息。因此,刻畫樣本局部結構流形時,用Ql來定義標量。對各個樣本點xi分別求其k-最近鄰點集合(KNi)和k-最遠鄰點集合(KFi),并根據其余樣本點xj∈KNi或xj∈KFi對目標函數進行調整。

(3)

(4)

式中,y與δ的取值主要用于調整醫學資源特定信息的貢獻值,一般δ的取值距離更加接近期望值,因此,定義y=1與δ>1。對于數量k值可通過不同的數據集與不同的先驗約束進行具體調整:k取值偏小時,1/k值變大,增加了Ql在降維目標函數中的影響度;k取值偏大時,醫學資源信息的選取準確度會降低。

未標記醫學信息樣本中除了局部結構流形信息以外,其它隱含的醫學特定信息也可以為目標函數所用[10],將全部未標記樣本用標量Qu來定義

(5)

結合上述數據,具體醫學資源特定信息降維目標函數的表達式如下

J(w)=Qu+AQg+BQi

(6)

式中,通過參數A可以對Qg在整個醫學特定信息目標函數中的貢獻作出調整,Qi在目標函數中的貢獻度可通過參數B進行調整。通過上述分析可知,可以利用普通矩陣特征值求解問題代替降維目標函數的求解問題,上式中,L為一個對稱矩陣,其表達式如下

L=Lu+ALg+BLl

(7)

矩陣L的主要作用是降低信息特征值與對應特征向量出現虛數的幾率。通過矩陣L減少了醫療資源特定低維信息Y中存在的虛數

Y=WTX

(8)

所提方法利用標記醫學資源信息與無標記醫學資源信息樣本中所包含的信息,設置降維目標函數的參數值,建立降維矩陣,利用降維矩陣實現海量醫學資源特定信息的降維處理,獲得原醫療資源特定信息的最佳低維表示。

2.2 醫學資源特定信息去噪處理

基于VSM的海量醫學資源特定信息優化聚類模型通過基于小波變換模極大值與閾值決策相融合的去噪方法對醫學資源特定信息進行去噪處理,具體步驟如下:

使用小波變換或者小波包變換對含醫學信息含噪信號進行離散,獲取不同尺度的系數,即醫學特定信息信號通過小波分解后,獲得不同尺度中的高通分量。

1)在小波變換過程中,計算小波在不同尺度中的模極大值。將各個尺度上的小波變換模極大值進行計算。

2)對各個尺度上小波模極大值系數的功率進行計算。

3)設Pj(x)代表的是小波模極大值系數在不同尺度中對應的功率,其計算公式如下

(9)

式中,j=1,2,…。低尺度下,功率Pj(x)主要由噪聲控制,隨尺度的變大,噪聲變換模極大值逐漸變小,而信號變換模極大值逐漸變大,所以功率會因為噪聲的影響快速降低,將最小時對應的尺度jm作為尺度取舍的一個閾點。基于VSM的海量醫學資源特定信息優化聚類模型為了提高小波系數閾值處理結果,將尺度jm作為分界點處理小波系數。

4)對于最大尺度的細節信號,由于信噪比高,有用信號的能量增加,其占主要部分,為了避免除去過多的有用信號,閾值的選取不能太大。結合以上分析,通過下式確定閾值tJ

(10)

式中,σJ為信號在最大尺度上的方差,N為信號的距離。

5)對于尺度j=jm+1,jm+2,…,J-1,信噪比越高,閾值也應該提高,通過下式確定閾值tj

(11)

式中:σ為信號在最大尺度上的方差。由于尺度j的變大,tj的值逐漸變小,可知噪聲在小波變換的各個尺度上有著相同的傳播特性。

6)對尺度j=1,2,…,jm,噪聲的能量越高,信噪比越低,因此選用Donoho廣義閾值,計算方式如下

(12)

3 海量醫學資源特定信息聚類方法

3.1 特征提取

醫學資源信息中通常含有大量的數據,每個信息對數據分類都有著不同的作用,如果將整體的數據都進行計算,那么計算量會大幅度增加,所以將通過特征提取實現信息聚類。通過選擇對醫學數據區分度大的項作為數據的特征進行分類,可以降低計算量的同時優化聚類效果。基于VSM的海量醫學資源特定信息優化聚類模型采用改進互信息的特征提取方法,選取數據條和類別互信息較大的前部分數據作為醫學資源特定信息的特征。

設RMI(T,Ci)代表的是數據條和類別的互信息,計算方法如下

(13)

式中:P(T|Ci)表示此數據條在Ci類別中出現的概率;P(T)為類別Ci中出現詞條T的概率;R(i)為特征提取修正因子,該值計算方式如下

(14)

式中:N(i)表示Ci類別中出現的總數據條數,R(i)表示Ci類別的數據量在全部數據集中所占的比值。

3.2 聚類模型

在醫學資源信息分類中,向量空間模型(VSM)是常用的信息表示形式,每種醫學資源信息都屬于一個特定領域,該領域可以通過該類別的醫學資源信息進行描述,上述領域通常由一些核心概念構成,在該類醫學資源信息中上述核心概念中存在的詞將會反復出現。所有的核心概念與分類的影響都是相輔相成的,如果一項數據中出現一種數據類別的多種核心概念,那么這些數據之間將出現相互證明的情況,從而該數據屬于該類別的可能性會增加。

用CoreWord(Ci)來表示類別Ci的核心概念,即CoreWord(Ci)由兩部分組成:

1)訓練樣本中段落首尾句和標題中存在的名詞,計算名詞對應的權值Rt。

2)當名詞在訓練樣本中出現的頻率大于設定的閾值時,該詞即為權值。

海量醫學資源特定信息的標題和段落的首尾句相比于資源的其它部分更能體現資源的主題,對于這些部分出現的概念在信息處理中應賦予更高的權重。對信息Ti進行分類,首先對醫學資源信息標題和文本中的段首和段尾句進行分詞得到一組詞WORDSn=[w1,w2,…wm],同類的文檔是通過一組概念來體現的,此部分詞是互相交叉的并不是相對獨立的,如果一個類A的核心概念詞是由詞a來體現的,那么a∈CoreWord(A);如果詞a、詞b都是屬于A的核心概念詞,并出現在信息Ti中,則在信息Ti中a∈Ti,b∈Ti,此時屬于信息A的得分分別為Sa,Sb;如果在信息Ti中詞a、詞b同時出現,則該信息屬于A的得分Sab>Sa+Sb,此時a、b的激勵效應可以用Sab-Sa-Sb對應的部分進行表示。

通常情況下數據條的權值偏小,多于兩種數據之間的激勵效應可以忽略。

所提方法運用文本向量與類特征向量在VSM的基礎上構建醫學資源特定信息優化聚類模型

Score(TiCj)=s×V(Ti,Cj)+k×Cos(Ti,Ci)

(15)

式中:s,k代表權重,s+k=1。共有m種醫學信息類別。通過上述聚類模型實現海量醫學資源特定信息的聚類。

4 實驗結果與分析

為了驗證基于VSM的海量醫學資源特定信息優化聚類模型的整體有效性,需要對基于VSM的海量醫學資源特定信息優化聚類模型進行相關實驗。本次測試的實驗環境為:開發環境:VS2010;開發語言:C#(.NETFramework3.5);分詞系統:NLPIR/ICTCLAS2014;數據庫:SQL Server2005。

將分類實驗中的已知分類與聚類算法運行后的結果相似度進行比較,通過參數計算兩者之間的相似程度,本次實驗通過Jaccard系數與F1系數進行測試。當Jaccard系數與F1系數的值越大時,表明聚類結果越接近數據集合原有的類別系統,即聚類結果的質量越好。Jaccard系數與F1系數公式分別如下

(16)

(17)

采用基于VSM的海量醫學資源特定信息優化聚類模型(方法1)、基于需求功能語義的醫學資源特定信息聚類方法(方法2)和基于分量屬性近鄰傳播的醫學資源特定信息聚類方法(方法3)進行測試,Jaccard系數測試結果如圖1所示。

圖1 Jaccard系數測試結果

由圖1可知,在多次實驗中方法1的Jaccard系數較大,證明此方法的聚類運行結果更接近數據集合原有的類別系統,即聚類結果的質量更好。方法2與方法3的Jaccard系數偏小,即聚類結果的質量較低。因為方法1融合小波變換模極大值與閾值決策方法對醫學資源特定信息進行去噪處理,經過去噪處理的優化獲得干凈與真實的數據,提高了Jaccard系數。

分別采用方法1、方法2、方法3通過F1系數進行測試,測試結果如2所示。

分析圖2中數據可知,在多次測試中方法1的F1值均高于方法2與方法3的數據,因為方法1在去噪過程中通過選取合適的閾值,保留醫學資源特定信息的有效信息和細節信息,根據保留的信息提取海量資源特定信息的特征,提高F1系數,進而實現資源的高質量聚類。

圖2 F1系數測試結果

5 結束語

網絡醫學資源特定信息分類組織的無序性和信息聚類的差異性,對醫學信息用戶的聚類能力和技術提出了更新的要求。對此問題提出了基于VSM的海量醫學資源特定信息優化聚類模型方法,對海量醫學資源特定信息進行預處理,提取信息特征,根據信息特征構建信息聚類模型,完成醫學資源特定信息的聚類,該方法有效地解決了當前方法中存在的問題,為海量醫學資源特定信息處理工作提供了相關依據。在未來的研究中,可以對海量醫學資源特定信息優化聚類模型做更加深入的研究。

猜你喜歡
資源信息方法
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 日本欧美视频在线观看| 国产精品久久精品| 欧美午夜网站| 欧美视频在线观看第一页| 国产成人亚洲综合A∨在线播放 | 玖玖精品在线| 婷婷综合缴情亚洲五月伊| 中文字幕日韩久久综合影院| 亚洲日韩第九十九页| 欧亚日韩Av| 波多野结衣一区二区三视频| 亚洲精品福利视频| 亚洲精品你懂的| 国产成人亚洲无吗淙合青草| av一区二区无码在线| 中文字幕在线日本| 青青操国产| 免费大黄网站在线观看| 伊人色婷婷| 在线看片中文字幕| 精品国产成人高清在线| 老熟妇喷水一区二区三区| 国产精品漂亮美女在线观看| 国产高清自拍视频| 亚洲va在线观看| 亚洲另类第一页| 国产精品yjizz视频网一二区| 在线va视频| 国产在线91在线电影| 免费一级毛片在线观看| 亚洲欧美成人在线视频| 亚洲人成网站在线观看播放不卡| 午夜激情婷婷| 国产粉嫩粉嫩的18在线播放91 | 一本久道久综合久久鬼色 | 久久精品国产免费观看频道| 欧美a在线| 亚洲天堂日韩在线| 亚洲第一成网站| 免费人成黄页在线观看国产| 日韩国产黄色网站| 国产美女丝袜高潮| 欧美国产日韩在线观看| 欧美日本在线播放| 日本成人精品视频| 欧美日本在线观看| 免费国产无遮挡又黄又爽| 中文天堂在线视频| 欧美日本二区| 国产精品99r8在线观看| 精品91自产拍在线| 亚洲精品成人片在线观看| 中文无码精品A∨在线观看不卡| a级毛片毛片免费观看久潮| 国产亚洲精| 国产91高跟丝袜| 久久青草精品一区二区三区| 国产精品久久久免费视频| 欧美日本在线一区二区三区| 国产精品免费入口视频| 国产女人在线视频| 九月婷婷亚洲综合在线| 视频一区亚洲| 亚洲AV无码乱码在线观看裸奔 | 国产成年女人特黄特色毛片免 | julia中文字幕久久亚洲| 91麻豆久久久| 欧美亚洲国产精品第一页| 中国精品自拍| 亚洲综合色区在线播放2019| 热99精品视频| 538国产在线| 国产区免费精品视频| 亚洲免费福利视频| 亚欧乱色视频网站大全| 91精品日韩人妻无码久久| 青青热久免费精品视频6| 黄色一及毛片| 免费看av在线网站网址| 亚洲一级无毛片无码在线免费视频| 久久午夜夜伦鲁鲁片不卡| 亚洲乱亚洲乱妇24p|