☉河北省衡水一中 莊釗棟 陳鐵亂
正交變換的性質及其應用
☉河北省衡水一中 莊釗棟 陳鐵亂
解析幾何與高等代數是數學專業的兩門基礎課,它們分屬幾何與代數兩大學科,各有獨立的教學體系,彼此之間又有著密切的聯系,而變換又是幾何學與代數學中的分支,在經過多年的發展之后,變換已經積累了大量的理論和結果,其應用領域也在不斷擴大.最初,變換主要用來討論圖形之間轉變的問題,后來由于變換的應用越來越多,又將變換具體化,由此產生了線性變換,而正交變換是其中的一種變換.當時正交變換已經用來研究代數和幾何中的很多問題,又由于應用的不同,將正交變換又具體分為平移變換、旋轉變換、反射變換、滑移反射變換等.如今,正交變換本身及其在數學、物理學、計算機科學系、光學等領域中的應用越來越受到人們的重視.本文在前人研究的基礎之上,試圖研究正交變換的一些性質及其應用,使正交變換的一些性質能夠反映到幾何與代數上,通過代數與幾何中共同的知識解決數學中的一些其他問題.
定義1.1正交變換在代數中的定義:歐氏空間V的一個線性變換σ稱為正交變換,如果它保持向量的內積不變,即對任意的α,β∈V,都有(σ(α),σ(β))=(α,β).
設η1,η2,…,ηn是歐氏空間V的一組標準正交基,在正交變換σ下,σ(η1),σ(η2),…,σ(ηn)也是V的一組標準正交基,設

A=(aij)為正交矩陣,則有限維向量空間V的正交變換σ可表示為σ:α→Aα,即σ(α)=Aα,其中A為正交矩陣.
定義1.2正交變換在幾何中的定義:如果歐氏空間的點變換,把任意線段的兩個端點變成等長線段的兩個端點,則稱其為正交變換(亦稱全等變換,又稱等距變換),平移、旋轉、反射、滑移反射等是正交變換的幾種特殊形式.
在標準正交基下,把點P(x1,x2,…,xn)變成點P′(x1′,x2′,…,xn′)的正交變換τ的公式表示是

其中A=(aij)為正交矩陣.
定義1.3取定平面π上向量υ.把平面π上的每一點P沿向量υ的方向平移到P′,使,這樣得到的變換叫做平面π的一個平移變換,簡稱平移,記為tυ.
定義1.4把平面π上的每一點P繞一定點O旋轉一定角θ變到另一點P′,這樣得到的變換叫做π的旋轉變換,簡稱旋轉記為r(O,θ).定點O叫做旋轉心,定角θ叫做旋轉角.
定義1.5取定平面π上的一條直線l.把任意一點P映到它關于直線l的對稱點P′,這樣得到的π的變換稱為平面π對于直線l的軸反射變換,簡稱反射,記為sl,稱l為反射軸.
定義1.6設υ是一個平行于直線l的向量,把每個點P變到它關于l的對稱點Q以后再沿向量υ平移到P′,使,這樣將P映到P′的變換稱為沿直線l的滑移反射,滑移向量為υ.這也就是一個平行直線l的向量υ確定的平移tυ和對于直線l的反射sl的乘積tυsl.
性質2.1設σ是n維歐氏空間V的一個線性變換,于是下面四個命題是等價的:
(1)σ是正交變換;
(2)σ保持向量的長度不變,即對于α∈V,|σ(α)|=|α|;
(3)如果ε1,ε2,…,εn是標準正交基,那么σ(ε1),σ(ε2),…,σ(εn)也是標準正交基;
(4)σ在任意一組標準正交基下的矩陣是正交矩陣.
證明:首先證明(1)與(2)等價.如果σ是正交變換,那么(σ(α),σ(α))=(α,α),兩邊開方即得|σ(α)|=|α|.
反過來,如果σ保持向量的長度不變,那么(σ(α),σ(α))=(α,α),(σ(β),σ(β))=(β,β),(σ(α+β),σ(α+β))=(α+β,α+β),
把最后的等式展開即得(σ(α),σ(α))+2(σ(α),σ(β))+(σ(β),σ(β))=(α,α)+2(α,β)+(β,β),
再利用前面的兩個等式,就有(σ(α),σ(β))=(α,β),也就是說σ是正交變換.
再來證(1)與(3)等價.
設ε1,ε2,…,εn是一組標準正交基,即(εi,εj)=(i,j=1,2,…,n).如果σ是正交變換,那么(σ(εi),σ(εj))= .這就是說σ(ε1),σ(ε2),…,σ(εn)是標準正交基.
反過來,如果σ(ε1),σ(ε2),…,σ(εn)是標準正交基,那么由α=x1ε1+x2ε2+…+xnεn,β=y1ε1+y2ε2+…+ynεn,
與σ(α)=x1σ(ε1)+x2σ(ε2)+…+xnσ(εn),
σ(β)=y1σ(ε1)+y2σ(ε2)+…+ynσ(εn),
即得(α,β)=x1y1+x2y2+…+xnyn=(σ(α),σ(β)),
因此σ是正交變換.
最后來證(3)與(4)等價.
設σ在標準正交基ε1,ε2,…,εn下的矩陣為A,即(σ(ε1),σ(ε2),…,σ(εn))=(ε1,ε2,…,εn)A,如果σ(ε1),σ(ε2),…,σ(εn)是標準正交基,那么A可以看做由標準正交基ε1,ε2,…,εn到σ(ε1),σ(ε2),…,σ(εn)的過渡矩陣,因而是正交矩陣.
反過來,如果A是正交矩陣,那么σ(ε1),σ(ε2),…,σ(εn)就是標準正交基.
這樣,我們就證明了(1)(2),(3),(4)的等價性.
性質2.2設σ為歐氏空間V的可逆變換,則σ為V的正交變換的充要條件是:對任意的ξ,η∈V,有(σ(ξ),η)=(ξ,σ-1(η)).
證明:必要性:因為可逆變換σ為V的正交變換,所以對任意的ξ,η∈V,有(σ(ξ),η)=(σ(ξ),Eη)=(σ(ξ),σ(σ-1(η)))=(ξ,σ-1(η)).
充分性:由條件知,對任意的ξ,η∈V,
有(σ(ξ),σ(η))=(ξ,σ-1(σ(η)))=(ξ,Eη)=(ξ,η).
所以由性質2.1可知,σ為V的正交變換.
對任意的ξ,η∈V,a∈R,

所以σ是V到V的線性變換.
對任意的ξ∈V,

這說明|σ(ξ)|=|ξ|,根據性質2.1可知,σ是V的正交變換.
性質2.4設α1,α2,…,αm和β1,β2,…,βm是n維歐幾里得空間的兩個向量組,試證明存在一個正交變換σ,使得σ(αi)=βi,i=1,2,…,m的充要條件是(αi,αj)=(βi,βj),i,j= 1,2,…,m.
證明:必要性:設σ是正交變換,滿足σ(αi)=βi,i= 1,2,…,m,由正交變換的定義,有(βi,βj)=(σ(αi),σ(αj))=(αi,αj),i,j=1,2,…,m.
充分性:已知(αi,αj)=(βi,βj),i,j=1,2,…,m.
若α1,α2,…,αm線性無關,將其單位正交化,得到ε1,ε2,…,εm,它們兩兩正交,且都是單位向量.
設ε1=a11α1,
ε2=a12α1+a22α2,
…
εm=a1mα1+a2mα2+…+ammαm,
寫成矩陣形式(ε1,ε2,…,εm)=(α1,α2,…,αm)A,
構造向量組η1=a11β1,
η2=a12β1+a22β2,
…
ηm=a1mβ1+a2mβ2+…+ammβm,
其矩陣形式為(η1,η2,…,ηm)=(β1,β2,…,βm)A,
下面證明η1,η2,…,ηm線性無關.
對k1η1+k2η2+…+kmηm=0,兩邊用ηi(i=1,2,…,m)作內積,得齊次線性方程組
k1(η1,ηi)+k2(η2,ηi)+…+km(ηm,ηi)=0,i=1,2,…,m.
方程組的系數矩陣的行列式

由于ε1,ε2,…,εm線性無關,所以ε1,ε2,…,εm的格拉姆行列式不等于0,所以η1,η2,…,ηm線性無關.
分別將ε1,ε2,…,εm與η1,η2,…,ηm擴充成標準正交基:ε1,ε2,…,εn和η1,η2,…,ηn,則存在線性變換σ,使σ(εi)=ηi,i=1,2,…,n.
由于ε1,ε2,…,εn與η1,η2,…,ηn都是標準正交基,所以σ是正交變換.
又(β1,β2,…,βm)A=(η1,η2,…,ηm)
=(σ(ε1),σ(ε2),…,σ(εm))
=σ(ε1,ε2,…,εm)
=σ(α1,α2,…,αm)A.
由于A是可逆矩陣,于是有σ(αi)=βi,i=1,2,…,m.
當α1,α2,…,αm線性無關時,不妨設α1,α2,…,αr是一個極大線性無關組.由上面證明知道,β1,β2,…,βr線性無關,對于?j,

所以β1,β2,…,βr是β1,β2,…,βm的一個極大線性無關組.
對α1,α2,…,αr與β1,β2,…,βr用前述方法可得到正交變換σ,使得σ(αi)=βi,i=1,2,…,r.而r+1≤s≤m,

性質3.1設σ為歐氏空間V中的等距變換,x,y為V中的任意兩點,則有
(1)x·y=[σx)-σ(0)]·[σ(y)-σ(0)],
(2)σ(x+y)=σ(x)+σ(y)-σ(0),
(3)σ(kx)-σ(0)=k[σ(x)-σ(0)](k∈R).
證明:(1)因為σ為等距變換,所以d(0,x)=d(σ(0),σ(x)),d(0,y)=d(σ(0),σ(y)),d(x,y)=d(σ(x),σ(y)).
又因為d2(x,y)=|y-x|2=d2(0,x)+d2(0,y)-2x·y,
d2(σ(x),σ(y))=|σ(y)-σ(x)|2
=d2(σ(0),σ(x))+d2(σ(0),σ(y))-2[σ(x)-σ(0)]·[σ(y)-σ(0)].
比較以上兩式,立即得出(1)的結論是成立的.
展開后利用(1)的結論得

=(x+y)2+x2+y2-2(x+y)·x-2(x+y)·y+2x·y=0.
所以,σ(x+y)-σ(x)-σ(y)+σ(0)=0,因此(2)的結論是正確的.
(3)的證明與(2)的證明類似,在此省略.
性質3.2n維歐氏空間V中一個變換σ為等距變換的充分必要條件是σ(x)=xA+x0,(1)其中x為V中任意一點,x0為V中一定點,A為正交矩陣.
證明:必要性:取V中n+1個點,原點O,V1(1,0,0,…,0),V2(0,1,0,…,0),…,Vn(0,0,…,0,1),Vi的向徑記為ei.設x=(x1,…,xn)為V中任意一點,那么

應用性質3.1得

充分性:將(1)改寫成σ(x)=xA+x0,顯然x0=σ(0),設x,y為V中任意兩點,有
d2(σ(x),σ(y))=|σ(y)-σ(x)|2=|(y-x)A|2
=(y-x)AA′(y-x)′|y-x|2=d2(x,y),
即d(x,y)=d(σ(x),σ(y)).充分性得證.
性質3.3一個平移和一個反射的乘積是一個滑行反射.
證明:設l是π上一條直線,υ是π上一個向量.考慮對于l的反射sl和υ確定的平移tυ.取l為x軸建立直角坐標系,設υ(x0,y0).令u(x0,0),方程為的直線記為l′.考慮沿直線l′且滑移向量為u的滑移反射f=tusl′.設f將點P(x,y)映到點P′(x′,y′),則但sl將P(x,y)映到Q(x,-y),tυ將Q(x,-y)映到P′(x+x0,-y+y0).于是tυsl也是將P映到P′.因此,tυsl=tusl′,即證明了一個平移和一個反射的乘積是一個滑移反射.
定義1.1和定義1.2雖則都稱為正交變換,但是僅僅從定義上看,它們是有明顯區別的:
定義1.1中的σ是歐氏空間V的線性變換,而定義1.2中的τ是歐氏空間中的一個變換,但并沒有強調它必須是線性變換.
事實上,從變換公式中我們可以很容易地看到,對于σ有,對?α,β∈V,k,m∈F(F是數域)有σ(kα+mβ)= A(kα+mβ)=k(Aα)+m(Aβ)=kσ(α)+mσ(β).
另一方面,只有當(a1,…,an)T=0時,τ才是線性變換,一般情況下τ不是線性變換.因此,一般而言,這兩個概念是有差異的.
除上述差異外,這兩個概念之間其實還存在許多相同之處:
(1)變換σ,τ的公式表示中,矩陣都是正交矩陣;
(2)σ保持向量的長度不變,τ保持兩點間線段的長度不變,二者都具有保距性;
(3)σ把V中的標準正交基變成標準正交基(這也是之所以稱其為正交變換的原因),而易于證明,τ也是把歐氏空間的標準正交基變成標準正交基.
由此看來,定義1.1和定義1.2在本質上又是一樣的.
平面上的平移變換(又稱點變換)是一個等距變換,而在此變換下,標準正交基仍變成標準正交基.同時,該平移誘導了一個正交向量變換,其表達形式為τ(α)=Aα,這和定義1.1中的表達形式是一致的,即平移變換是等距變換,本質上也是正交變換.因此,我們可以說正交變換、等距變換是一個概念,這也是將正交變換又稱為等距變換的原因.
但一般而言,平面的正交變換和仿射變換不是線性變換.
因此,既充分考慮到代數中和幾何中正交變換兩個概念在本質上的一致(保距,保正交,都可以寫成正交向量變換的形式),又考慮到兩個概念在形式上的區別,可將代數中的正交變換稱為正交向量變換,將幾何中的正交變換稱為正交點變換,二者都是等距變換.
1.正交變換在重積分中的應用
證明:設(a,b,c)為三維空間的一個向量,單位向量化得
再將其擴充為三維空間的一個標準正交基,設為(a1,
作正交變換

則A為正交矩陣,即AAT=E,所以

兩邊轉置得(x,y,z)=(u,v,w)A.于是

又因為AAT=E,而,由(1)式知,ax+by+cz=ku.
解:令f(x,y,z)=5x2+6y2+4z2-4xy-4xz,
容易判斷它是一個正定矩陣,設其特征值為λ1,λ2,λ3,則λ1>0,λ2>0,λ3>0,|λ1λ2λ3|=|A|=80>0,
使f(x,y,z)=λ1u2+λ2v2+λ3w2.
由正交變換的性質可得

2.正交變換在曲面方程中的應用
二次曲面的方程
a11x2+a22y2+a33z2+2a12xy+2a13xz+2a23yz+2a14x+2a24y+ 2a34z+a44=0,(4)
X=(xyz1)T,A=(aij)3×3,(4)式可寫成XTA~X=0,A~和A都是實對稱矩陣.設T=(tij)3×3為三維空間正交變換的矩陣,將x,y,z的二次式(4)化成x′,y′,z′的二次式,但x′,y′,z′的二次式所對應的對稱矩陣為B~和B,有|A~|=|B~|,| A|=|B|,秩(A~)=秩(B~),秩(A)=秩(B).
適當地選取正交矩陣T=(tij)(i,j=1,2,3),|T|=1,可有
T′AT=diag(λ1,λ2,λ3),(xyz)T=T(x′y′z′)T,
則方程(4)可化成
λ1x′2+λ2y′2+λ3z′2+2b14x′+2b24y′+2b34z′+b44=0,
對此再進行坐標系的平移與旋轉可得其標準型.
例3用正交變換法化二次型f=2x1x2-2x3x4為標準型.
λ3=λ4=1,解特征方程得到ξ3=
則P是正交矩陣,且有PTAP=
例4求證曲面∑1:x3-y+z-1=0和∑2:x3-6x2+12x-y+ z-5=0關于點M(1,1,0)對稱.
證明:設點P(x1,y1,z1)是∑1上任意一點,則z1-1=0.
若σ(P)=P′(x1′,y1′,z1′),則可以得知

代入得(2-x1′)3-(2-y1′)+(-z1′)-1=0,
整理得x1′3-6x1′2+12x1′-y1′+z1′-5=0,
即(x1′,y1′,z1′)在∑2上.
反之,可以證明對∑2上任意一點Q(x1,y1,z1),σ(Q)=Q′也都在∑1上,即∑1,∑2關于點M(1,1,0)對稱.
例5求與橢球面∑10,1)對稱的橢球面∑2的方程.
解:將∑1的方程中的下x,y,z分別用-2-x,-y,2-z代替,得即∑2的方程為
3.正交變換在條件極值中的應用
例6求F(x,y)=x2+y2在條件3x2+4xy+3y2=1下F的最大值和最小值.
解:3x2+4xy+3y2=1和F(x,y)=x2+y2表示為的特征根為1和5,取T=
因此求在條件X2+5Y2=1下,F=X2+Y2的最大值和最小值就可以了.
4.旋轉變換在多元函數積分中的應用
例7設曲面∑為球面:x2+y2+z2=a2.試計算第一型曲面積分

解:直接計算將非常困難,但如果將被積函數化為一元函數,則有可能積出,加之被積函數中的x-2y-2z是x,y,z的線性函數,因此可考慮坐標系的旋轉,例如,作旋轉變換

注意(5)式中的變換矩陣是一個行列式為1的正交矩陣,因此它可以表示一個將空間右手直角坐標系Oxyz變成右手直角坐標系Ox′y′z′的旋轉變換,在此變換下(空間的點未動,只是點的坐標變了),∑的方程變為∑′:x′2+y′2+z′2=a2,所求積分化成為

利用球面的參數方程
r=(x′,y′,z′)=(asinφcosθ,asinφsinθ,acosφ),0≤φ≤π,0≤θ≤2π,
本文重點討論了正交變換在重積分中的應用,化二次型為標準型中正交變換的應用,正交變換在曲面方程中的應用,正交變換在條件極值中的應用以及正交變換的一些性質及其證明.當然,本文僅討論了正交變換在有限的數學范圍內的應用,還有許多正交變換在其他數學領域內的應用并未討論.
1.梅向明,黃敬之.微分幾何[M].高等教育出版社,2005年4月.
2.余正光,何堅勇,王飛燕.線性代數與空間解析幾何學習指導[M].科學出版社,2003年5月.
3.馬忠林編著.幾何學[M].吉林人民出版社,1984年4月.
4.方德植,陳奕培.射影幾何[M].高等教育出版社,1983年8月.
5.H.S.M.考克賽特,S.L.格雷策.幾何學的新探索[M].北京大學出版社,1986年1月.
6.張禾瑞,郝鈵新.高等代數[M].高等教育出版社,2005年12月.
7.蕭樹鐵,居余馬,李海中.代數與幾何[M].高等教育出版社,2005年12月.
8.吳有為.歐式空間正交變換判別法討論[J].數學通報,1993,(1).
9.胡國權編著.幾何與代數引論[M].科學出版社,2006年9月.
10.楊子胥.內積關系與正交變換、對稱變換、反對稱變換[J].數學通報,1993,(1).
11.呂林根,許子道.解析幾何[M].高等教育出版社,2001年6月.