朱鶴年
(清華大學 物理系,北京 100084)
來稿作者在教學任務較繁重的情況下堅持開展教學研究,同時學習現代應用統計學和人工智能領域的新方法,并力圖引入基礎物理實驗教學中,這種努力和做法值得鼓勵. 但是文章存在較多問題,有些問題是數據處理類文章的共性,現在指出如下.
1)回歸直線殘差vi=(yie-yi)不是誤差.
2)不能找各點到直線的距離最小解,只能使各點到直線距離在因變量方向投影之和為最小,即令因變量殘差絕對值和最小.
3)殘差絕對值Σ|vi|和與斜率無關,而距離絕對值之和與斜率有關,與單位(包括十進制)選擇有關,是沒有物理意義的量. 自變量單位確定之后,距離之和極小解不一定是最小二乘解.
4)在滿足最小二乘前提條件(高斯-馬爾科夫假定)時,在有解析解的多種回歸方法或經典數值計算方法已被普遍應用的現狀下,變換為人工智能等復雜問題中用的新方法,在絕大多數物理教實驗學中可能是蛇足.
5)最小二乘判據的殘差平方和、斜率相對標準差(或相對不確定度)、最小一乘判據的殘差絕對值和、線性度指標這4個定量指標都是大學基礎物理實驗教學中可選擇其一用于判斷的指標. 至于與約定真值之差最小判據,從科學性原則看是最不應當采用的指標,該指標不是引導學生理性(有條件)質疑以分析討論如何改進實驗,而是引導學生尋找“歪打正著”式的好結果,易導致湊數,忽視科學理性精神的培養與熏陶. 科學追求包括數學嚴密性在內的邏輯自洽性,尋求主要源于實驗的可重復或可比對的經驗證據支持.
國際計量局在《A concise summary of the International System of Units (8thedition, 2006)》的頁首寫道:“Metrology is the science of measurements, made at a known level of uncertainty, in any field of human activity.” 這說明了測量的普遍性和重要性,也說明了在測量結果中評定不確定度的必要性. 物理實驗中,定性和半定量觀測固然重要,但基于對物理量科學測量的定量研究通常更為重要. 大多數應用領域廣泛遵循的ISO9000族標準中的本世紀的新體系《測量管理體系(MMS)》明文要求“MMS覆蓋的每個測量過程都應評定不確定度. ”
對于物理實驗教學研究中專門討論數據處理方法的論文,不應回避不確定度評定問題. 應符合實驗物理學、儀器儀表學和絕大多數工程技術測量對結果可信程度的表述. 而最小二乘法、最小一乘法(計量經濟學中也較常見)等經典方法能夠給出處理對象的不確定度.
在光電效應案例中,假如模型方程正確,來稿的新結果斜率“m=0.417 89”與以遏止電壓為因變量方程最小二乘解的斜率0.421 48僅僅相差0.85%,差值小于P=95%時相對擴展不確定度Um/m≈19%的1/20,因此來稿結果是沒有實質改變的.
包含計量學的儀器儀表學和實驗物理學,定量測量結果常常用于預測(報)或反預測(報). 不應當用相關系數作為直線回歸的擬合優度判據,早就有陳希孺院士、統計學家方開泰教授、多位國內外專家、NIST及其前身NBS的手冊《實驗統計學》,都明文反對用相關系數評定擬合結果. 用兩變量之間的相關系數曾經是國內物理教材的普遍性錯誤. 至于可決系數,雖然比相關系數有所改進,但仍然不能作為線性規律基本已知時擬合結果線性程度評價的獨立參量,因為可決系數與回歸的(或稱擬合的)相關系數相近,它們只有與自由度一道才能反映擬合質量,因變量和自變量一定時它們的量值隨回歸模型(如是否過原點)、擬合方法(如最小二乘、最小一乘或其他穩健回歸方法等)的不同而不同. 回歸的(或稱擬合的)相關系數,其定義不是兩變量之間的相關系數,而是因變量與回歸估值之間的相關系數.
IEC與中國國家標準已經有了一系列評價傳感器建模線性程度的“線性度”的標準. 雖然在近代物理實驗教學中全面推廣線性度有困難,適當簡化之后,用反映非線性相對誤差限的“線性度”Uy/(ymax-ymin),是不難引入近代物理實驗的基礎教學的,這里Uy是因變量的擴展不確定度. 另外,當測量目標只關注斜率時,用斜率的相對擴展不確定度(或簡化要求時用相對標準差與自由度),是教學中實用的簡便方法.
建立新模型和已有模型回歸(擬合)分析,是2個截然不同的研究問題. 計量經濟學與社會、醫學等方面的統計中,主要目的是建模;儀器儀表學、實驗物理教學中,主要目的是基本已有模型再研究測量過程的方法設計改進或結果分析. 高校物理實驗教學中涉及新建模型或者模型改進的很少. 建模問題可用測定系數等概念(包括與之近似的回歸的相關系數),因為建模問題一般不涉及應用該模型時的預報或者反預報的不確定度評定要求.
求出有限組實驗數據的兩變量之間的樣本相關系數之后,兩變量的總體相關系數的置信區間往往很大,特別是當樣本數n較小時. 對于來稿光電效應案例,回歸的(因變量電壓與其回歸估值之間的)相關系數為R=0.994 93,這與從可決系數所得結果相同. 審稿人根據統計學專著的表述規律中的曲線和尚欠完整的數表作近似計算,可以得出置信概率為0.95時,因變量電壓與其回歸估值之間總體相關系數的上下限分別為Rmax>0.999 59和Rmin<0.962 36,斜率相對不確定度為18.6% .

個別廠家為獲得更接近普朗克常量約定真值的實驗結果,刻意修改濾光片出廠時的中心波長值. 對于儀器設計缺陷,面上教學可改定量實驗為半定量(或定性)實驗,補充其他實驗觀察、觀測與研討的內容,探討實驗實際與理想條件間的不同或差距,更能激發學生的探索熱情與質疑精神.
2)關于馬呂斯定律的實驗教學. 表述透射率和cos2θ成正比的馬呂斯定律,只是垂軸透射比T2=0(消光比e為0)的近似. 普通薄膜偏振片和偏振棱鏡的消光比一般在10-4~10-5量級. 當偏振器用在θ接近π/2的情形或用作消光調節時,宜采用完整式Tθ=(T1-T2)cos2θ+T2. 觀察到實驗物理與物理理論命題的不一致,正是物理實驗教學的特點之一,在王之江主編的2版《光學技術手冊》中,一開始就引入消光比非0的完整公式,而不是先講馬呂斯定律再修正之,這是更適合現代實驗物理教學的思路. 如果只用馬呂斯定律的公式建模,因為測量的實際始終是透射比,將出現因變量嚴重不等精密度的情形,原則上不能套用等精密度前提下的直線擬合公式與等權最小二乘法. 另外,通過實驗學習新理論命題或者修正大學物理學的理論命題,在許多發達國家大學教育中也作為基礎實驗課程的內容(或任務)之一.