摘要:信息熵是信息論中的最重要的概念,各類教材都給出了詳細的定義和數學推導,但是由于概念較為抽象,致使許多學生都無法準確理解和應用該部分的教學內容。以“核酸混合檢測”從消除新冠病毒攜帶者的不確定性出發,貫穿課程理論知識的疫情防控案例和典型例題的構建,引導學生利用信息熵的理論知識,指導探究解決問題的方法與技術。理論知識與生活實踐的結合,既讓學生充分理解信息熵的概念,又可以體會信息論對實踐的指導意義。
關鍵詞:信息熵;核酸混合檢測;信息論;課程思政
中圖分類號:TB文獻標識碼:Adoi:10.19311/j.cnki.16723198.2024.20.090
0引言
習近平總書記指出:要用好課堂教學這個主渠道,思想政治理論課要堅持在改進中加強,提升思想政治教育親和力和針對性,滿足學生成長發展需求和期待,其他各門課程都要守好一段渠、種好責任田,使各類課程與思想政治理論課同向同行,形成協同效應。2020年5月,教育部印發《高等學校課程思政建設綱要》指出,全面推進高校課程思政建設,發揮好每門課程的育人作用。
信息論與編碼是以概率論和隨機過程等數學方法研究信息在通信系統中的存儲、傳輸、處理和控制的學科,是信息與計算科學專業的專業核心課程,是數學理論在信息科學中的典型應用,結合信息論與編碼的課程內容,以講好中國故事為主線,將科學探索精神、嚴于律己精神、愛國精神、科技報國的家國情懷與擔當等如鹽化水般融入課堂教學,使學生獲得專業知識的同時,不斷提高思想道德素養,提高服務國家服務人民的社會責任感。最大限度地激發學生自主學習的內在動力。“信息熵”是信息度量的重要概念,是后續內容學習的基礎。
從“核酸混合檢測”要消除新冠病毒攜帶者的不確定性,需要獲取的信息量出發,設立問題,引出本節內容——信息熵,在解決問題的過程中學習知識,提高學生的參與度和興趣,培養學生獨立思考的能力。利用理論工具指導編碼實踐。既讓學生深刻理解信息的本質,又讓學生體會到信息論的使用價值。在教學過程中適當嵌入課程思政要素,在信息論基礎專業課程中潛移默化地影響和教育學生。
1課程設計
圍繞“疫情防控”這一社會熱點,構造案例和典型例題,貫穿本節課程的理論教學。通過回答核酸混合檢測的數學原理,展開信息熵的講解,在理論指導下引導學生探索具體實現方法。既讓學生深刻理解信息的本質,又能讓學生體會到信息論的使用價值。在專業課程的教學過程中潛移默化地影響和教育學生。
1.1問題提出
根據統計資料,我國的陽性人群的感染率低于01%,通常采用10合1的混合檢測技術。
問題1:10合1的核酸檢測技術的原理?為什么美國不能使用這種混合檢測技術?
問題2:在陽性人群的概率是01%的地區,檢測出1名病毒攜帶者,該事件攜帶信息量?
問題3:設A地,陽性人群的概率是50%;B地陽性人群的概率是1%。何地的核酸檢測(單檢)提供的信息量更大?
問題1設立問題,引發學生思考,提示學生可以利用本節學習的知識,得到核酸混檢技術的原理,并能夠計算出最少的檢測次數;問題2,3用于回顧前面的內容-自信息量;并可以得到
pA(陽)=pA(陰)=1bit,pB(陽)=-log001=664bit,pB(陰)=-log099=001bit.
有
pB(陽)>pA(陽),pB(陰)<pA(陰)
可以看出平均一IIjpt8uILSg0V8Yd4vgi6Myk+icm7zUVDoghdx9i0q0=次核酸檢測結果能夠提供的信息量無法用自信息量刻畫,引出本節的內容——信息熵.
1.2熵的定義
定義1:信源空間X為
XP(X)=x1,x2,…,xi,…,xnp(x1),p(x2),…,p(xi),…p(xn)
各離散消息自信息量的數學期望定義為平均自信息量(信息熵)
H(X)=E[I(xi)]=-∑ni=1p(xi)logp(xi)(2.1)
其物理意義為:信息熵H(X)表示信源發出符號之前,確定信源X中每個符號平均需要的信息量;信息熵H(X)表示信源發出符號之后,平均每個符號所攜帶的信息量;
定義2.信源符號集X和信宿符號集Y中,每對元素xiyj聯合自信息量的數學期望定義為聯合熵H(XY)
H(XY)=EX,Y[I(xiyj)]=∑ni=1∑mj=1p(xiyj)I(xiyj)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)(2.2)
定義3.信源符號集X,和信宿符號集Y中,條件自信息量I(yj|xi)的數學期望定義為條件熵H(Y|X)
H(Y|X)=EX,Y[I(yj|xi)]=∑ni=1∑mj=1p(xiyj)I(yj|xi)=-∑ni=1∑mj=1p(xiyj)logp(yj|xi)(2.3)
類似地有X相對Y的條件熵H(X|Y)定義為
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)
1.3核酸混合檢測的原理
為了加強學生對信息熵概念的理解和應用信息熵理論分析解決實際問題,結合核酸檢測問題,詳細講解例題。
例1.某地感染陽性的概率0.1%,即1000人中有且只有1人為病毒攜帶者,假設感染病毒是等概率的,求需要多少支試劑能鎖定病毒攜帶者?
問題分析:設等概率分布的1000人建立信源空間X
XP(X)=x1x2…x10001100011000…11000
利用試劑檢測1次,檢測結果為陰性或陽性也是等概率的,建立核酸檢測結果的信源空間Y
YP(Y)=y0(陽)y1(陰)1212
因此要鎖定病毒攜帶者,需要利用核酸檢測獲取的信息量要大于等于信源空間X的不確定性即可。
解答:信源X的不確定性
H(X)=-∑ni=1p(xi)logp(xi)=-11000log11000×1000=9.97bit
1支試劑完成檢測能夠獲得的信息量為
H(Y)=-∑1i=0p(yi)logp(yi)=-12log12+12log12=1bit
假設需要k只試劑確定病毒攜帶者,
k·H(Y)H(X)=9.97
因此至少需要做10支試劑才能夠確定病毒攜帶者,任何想低于這個檢測次數的努力都是徒勞的。
問題擴展:利用信息論知識確定了核酸檢測次數,如何檢測?
方法一:分半混合檢測
第一步:每組500人混合,檢測其中1組,利用1份試劑可以排除1半陰性人員;
第二步:將陽性組的液體再對半分成兩組,利用第2支試劑檢測1組,又可以排除1半陰性人員,
反復進行下去,只需要10步,即需要10支試劑。可以解決問題。但是這種檢測方法共需要10輪檢測,每輪都需要數小時,時間耗費過長。
思考2.1:有沒有更好的方法利用10支試劑,1輪即可得到檢測結果?
第一步:二進制編碼,對待檢測人員按0~999進行編號,將數字轉化為二進制序列。如表1。
第二步:檢測,根據二進制編碼的數字進行檢測,編碼的第幾位是數字“1”,就用第幾號試劑進行檢測,第一號試劑只檢測第一位是1的人員。例如第153號檢測人員,二進制編碼為0001011001,體液分別放入第4,6,7,10號試劑進行檢測。
第三步:確認,最后根據試劑的值,鎖定陽性人員,例如:試劑顯示0010110110(0代表陰性,1代表陽性),則該二進制對應的第182號為病毒攜帶者。
該方法是最節省試劑,檢測最快的方法,但是由于人員組織過于繁瑣,通常沒有在實際中采用,實際生活中通常采用易于操作的10混1的混合檢測方法,只需要110支試劑,即可鎖定病毒攜帶者。
思考2.2:當感染陽性的概率p取什么值時,不能使用10混1的檢測方法?
答案為p=0.206可以作為課后思考題,讓同學們思考推導。這說明,感染率高的西方國家不能采用這樣的混合檢測技術。
例3.將A地的核酸檢測結果通過有干擾的信道傳送到B地,“0”表示陰性,“1”表示陽性,已知A地的檢測結果p(0)=14,已知p(0|0)=34,p(0|1)=14,
(1)求由B地陽性結果獲得A地陽性結果的信息量?
(2)求A、B兩地檢測結果不確定性?
(3)根據B地收到的檢測結果,求A地檢測結果仍然剩余的不確定性?
問題分析:
a)首先讓學生分析待求解問題的數學描述,分別計算的是
I(x1;y1),H(XY),H(X|Y)
b)這是典型的信息傳輸問題,信道輸入為A地值,輸出為B地收到的結果,如圖1所示。
解:經過分析,已知A地的先驗概率p(0)=14,p(1)=34,計算條件熵與聯合熵,需要先確定聯合概率和后驗概率。已知的條件概率矩陣
PY|X=p(yj|xi)2×2=3/41/41/43/4
由p(xy)=p(x)p(y|x),可以得到聯合概率矩陣
PXY=p(xiyj)2×2=34×1414×1414×3434×34=316116316916
后驗概率矩陣
PX|Y=p(xiyj)p(yj)2×2=1211012910
(1)計算的是由Y=y1獲得關于X=x1的互信息量,即
I(x1;y1)=logp(x1|y1)p(x1)=log9/103/4=0.263bit
(2)計算XY的聯合熵為
H(XY)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)=-316log316×2+116log116+916log916=1.6626bit
(3)計算Y已知時,X的條件熵
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)=-316log12×2+116log110+916log910=0.6681bit
或者先計算H(Y),然后利用熵的性質,計算條件熵
H(Y)=-∑1j=0p(yj)logp(yj)=
-38log38+58log58=0.9544bit
H(X|Y)=H(XY)-H(Y)=1.6626-0.9544=0.6681bit
1.4課程思政的設計
在信息熵的理論教學過程中,利用信息熵給出了核酸混合檢測技術的理論基礎,并且給出了最少檢測次數的理論極限值,利用二進制編碼(信源編碼)方法給出了具體實現的途徑,從該案例可以看出,信息論知識對生活實踐中的實際問題的解決具有非常重要的指導意義,進而激發學生對信息論強烈的學習興趣。
傳輸核酸檢測結果的典型例題可以作為一個簡單的含干擾的通信系統,準確說明了各種熵的計算依賴于信息傳輸過程中概率的分布。傳輸錯誤的后果(隔離、封城),使學生更好地體會通信系統的本質,信源編碼能夠提高系統傳輸的效率,僅僅提高系統的效率,并不能提高通信的效率。還需要利用信道編碼能提升通信系統的可靠性,降低信息傳輸的錯誤率。培養學生的系統思維和“大局意識”。
2結論
貫穿課程理論知識的疫情防控案例和典型例題的構建,從“核酸混合檢測”,要消除新冠病毒攜帶者的不確定性(即確定病毒攜帶者),需要獲取的信息量出發,引出主要理論內的講授。
(a)有機融合疫情防控課程思政點的理論教學,將抽象的理論問題學習具象化、生動化,將脫離實際的熵的計算,融入國情、民情,使學生由單純的知識學習變為問題的解決者,將跟隨式學習變為主動式學習,降低了理論學習的枯燥性,提升了學習專業的興趣。
(b)案例及例題的設計,充分體現了理論對實踐的指導意義;樹立認真學習的信心。
參考文獻
[1]高德毅,宗愛東.從思政課程到課程思政:從戰略高度構建高校思想政治教育課程體系[J].中國高等教育,2017,(1):4346.
[2]周蔭清.信息論基礎(第5版)[M].北京航空航天大學出版社,2020.
[3]朱春華.信息論編碼技術(MATLAB實現),清華大學出版社,2020.
[4]董宏杰,張俊梅等.新型冠狀病毒混合樣品監測研究[J].山東大學學報(醫學版),2021,59(4):15.
[5]孫兵,李建楠等.平均互信息量的案例是教學方法研究[J].電氣電子教學學報,2022,44(4):7881.
[6]新冠病毒核酸10合1混采檢測技術規范[J].中國病毒病雜志,2020,10(5):330332.