王 洪
(福州君道空間信息技術有限公司,福建 福州 350001)
對數字地球這一概念進行延伸,我國提出了數字中國的概念,也就是以我國整體為對象對數字地球系統進行實踐。在這個十分浩大的工程中,數字城市作為應用示范和試驗田應運而生,是信息化、數字化建設工作的實際切入點[1]。該項目對多種技術進行了綜合應用,能夠對城市的復雜系統實施虛擬仿真與網絡數字化管理[2]。說得更概括一些,就是通過數字城市能夠實現城市可視化和優化決策支持功能,使政府作出更加科學的決策,提升城市建設時效[3]。
隨著三維可視化相關技術的不斷發展,城市不動產三維影像成為數字城市中的重要研究方向。對不動產邊界進行測量對于建筑物三維模型建造以及規劃城市三維空間等都有很大意義,因此要重視對不動產邊界三維的精確測量問題研究。
對于不動產邊界三維測量問題的研究,國內外研究的方向和側重點不同,都取得了多樣化的研究成果。國外主要針對可視化、場景交互等方向進行研究。有學者通過場景交互技術進行不動產邊界的三維測量與建模。還有學者通過不動產圖像集合及其深度映射對不動產三維場景模型進行表示,從而實現其邊界三維測量。而國內則主要針對硬件方向進行研究。有學者設計了一種不動產激光掃描儀,通過該激光掃描儀對不動產邊界進行三維數據測量。還有學者通過Range scanner、結構光等硬件進行不動產邊界的三維測量。由于以上方法存在應用場合受限、操作復雜、成本比較高昂等問題,所以在對不動產邊界三維測量問題進行研究的過程中,應用關聯規則算法進行不動產邊界圖像三維數據的挖掘,基于挖掘的三維數據可以實現對不動產邊界的精確三維測量。
通過近景三維測量系統對不動產邊界圖像進行捕捉,并生成不動產圖像交易數據庫,用于進行三維數據挖掘[4]。使用的近景三維測量系統是多種先進設備的集成體,具體包括移動計算機、CCD數碼相機、激光掃描儀以及全球定位系統。該系統主要將機動車輛或無人機作為掃描平臺,是一種用于建筑物測量的測量系統,能夠實時、迅速、動態地對不動產地理圖像進行獲取[5]。其中CCD數碼相機負責對不動產影像圖片進行拍攝,在不動產為高層建筑時,還可以對激光掃描儀的數據獲取起到輔助作用。
在使用近景三維測量系統時,為構建不動產圖像交易數據庫,需要對掃描數據進行處理以及實施坐標轉換,為實現該功能對系統的配套數據處理系統進行開發。開發的配套數據處理系統的工作模式(如圖1所示):

圖1 開發的配套數據處理系統的工作模式
基于關聯規則算法進行不動產圖像邊界三維數據的挖掘,具體包括兩個步驟:(1)是頻繁項集的產生;(2)是關聯規則的產生。
1.2.1 頻繁項集的產生
在對不動產邊界圖像三維數據頻繁項集進行生成的過程中,需要多次掃描不動產邊界圖像交易數據庫[6]。首先對不動產邊界圖像交易數據庫進行遍歷,尋找三維數據候選1-項集,通過C1為該三維數據項集。對單個項的對應支持度進行計算,對于那些閾值大于最小支持度的項,將其記為L1,定義為三維數據頻繁項集。接著把三維數據頻繁項集當作算法中的種子項集,通過種子項集的自連接實現三維數據候選2-項集的生成,記為C2。再對不動產邊界圖像交易數據庫進行掃描,對三維數據頻繁2-項集進行生成,記為L2。利用三維數據頻繁2-項集對三維數據頻繁3-項集進行生成,記為L3。不斷重復該過程,直至無法生成新的三維數據頻繁項集。
以上迭代過程具體分為兩個子步驟:連接步、剪枝步。
(1)連接步。Lk-1和其自身相連接,對Ck進行生成。將Lk-1內的元素用si來表示,其中si元素的第k項用si[]k來表示。通過字典序對三維數據項集內的項進行排列,執行Lk-1的自連接。對于si來說,其可連接的條件具體如下:前(k-2)項相同,而第(k-1)項則不同。
也就是s1、s2在滿足式(1)時:

則s1與s2稱為可連接關系,連接時的對應結果項集如下:

(2)剪枝步。通過關聯規則對三維數據候選k-項集進行性質壓縮,接著計算壓縮以后Ck的支持度,從而對三維數據頻繁k-項集進行確定。
在迭代時,每次生成三維數據頻繁項集時都要對不動產邊界圖像交易數據庫進行掃描,以便對三維數據候選項集的對應支持度進行計算,從而發現全部三維數據頻繁項目集[7]。然而每次都對支持度進行計算需要極大工作量才能完成,因此需要對三維數據候選項集的實際數量進行縮減處理,也就是對搜索空間進行壓縮。
1.2.2 關聯規則的產生
這一步驟是在三維數據頻繁項集中對與最小置信度閾值相符合的規則進行尋找。其實現步驟具體如下:
(1)用FI表示各三維數據頻繁項集,對其全部非空子集進行生成,用SFI來表示。
(2)對于SFI來說,當滿足式(2):

式(2)中,Support_count代表出現事務數;minConf代表最小置信度閾值。
則會產生以下的規則,如式(3)所示:

式(3)中,規則即為所生的關聯規則。
對最小支持度閾值進行設定后,開始運行關聯規則算法,首次對不動產邊界圖像交易數據庫進行掃描時,僅對各項目實際值的具體數量進行計算,從而對三維數據大型1-項集進行確定[8]。之后對不動產邊界圖像交易數據庫進行遍歷的時候,需要實施連接和剪枝,一直到所產生的Lk是空集,則停止算法,實現不動產圖像三維數據的挖掘。
在挖掘的三維數據中對掃描點進行提取,接著對掃描線進行提取,實現不動產邊界的三維測量。在對掃描點進行提取的過程中,首先對粗差點進行剔除,將剩下的點用[Hi,Hi+1...Hj](1≤i≤j≤n)來表示,并對對應最高點進行尋找,用[Ti,Ti+1...Tj](1≤i≤j≤n)來表示。對于Ti和Hi間的點,以掃描點的角度值和距離為依據,對是否有突變存在進行判斷[9]。在某時刻有Dm這一掃描點和該點的相鄰點Dm-1,當成立式(4):

式(4)中,Am、Am-1為Dm和Dm-1間的隨機點;ε為突變閾值。
此時認為Dm和Dm-1是可疑特征點。
對實際特征點進行選擇時,需要參照下式,如式(5)所示:

式(5)中,Lm、Lm-1為Am和Am-1間的隨機點。
在Am和Am-1間對較小的點進行選擇,將其作為特征點,也就是選擇不動產上比較突出的、距離掃描儀有著較短中心水平距離的點,將其當作特征點。其中ε需要以不動產的具體表面情況為依據進行取值,具體取值范圍為0.3~0.6。用H表示提取出的掃描點。
接著對不動產邊界的掃描線進行提取。對于H來說,用T表示該點對應的掃描線頂部點,對全部掃描線的對應水平點,通過拉依特準則實施粗差處理,實現掃描線的提取[10]。其中粗差處理具體步驟如下:
等精度對某量實施N次觀測,獲得x1,x2,...,xn。當其中某數據xk所對應的vk能夠滿足下式,如式(6)所示:

式(6)中,x為觀測值算術平均值;σ?為測量標準差的對應估計量。
此時認為xk內含有粗差,需要將其剔除。
在實景中對設計的基于關聯規則算法的不動產邊界三維測量方法進行應用與測試。首先使用近景三維測量系統對不動產邊界圖像進行捕捉。對近景三維測量系統進行設置與安裝,其具體構成(如圖2所示):

圖2 近景三維測量系統具體構成
在實驗中,將移動計算機、CCD數碼相機、激光掃描儀安裝于無人機上,由于該無人機自帶全球定位系統,因此不再額外對該系統進行設置。完成近景三維測量系統的布設以后,設置一些飛行掃描站點并對其測量路徑進行選擇。
生成實驗地區的不動產圖像交易數據庫,在數據庫中選擇某區域圖像作為實驗數據集。
首先對數據集中某中層不動產建筑側面的邊界進行三維測量,調用的側面數據集圖像(如圖3所示):

圖3 調用的側面數據集圖像
對于單一邊界的測量,對掃描不動產邊界圖像交易數據庫中相關圖片的次數和產生的頻繁項集個數進行調整,對實驗方法的單一邊界測量誤差進行測試。在圖像邊界三維數據挖掘中,當掃描不動產邊界圖像交易數據庫中相關圖片的次數為30次時,分別在產生頻繁項集的個數為18、20、22、24、26、28個時對實驗建筑側面的上邊長、下邊長以及高度進行測量,也就是分別對a、b、c的值進行測量。
此時測量結果具體如下:
產生的頻繁項集的個數為18個時,a、b、c的測量值為15.203m、16.901m、11.801m;
產生的頻繁項集的個數為20個時,a、b、c的測量值為15.202m、16.903m、11.802m;
產生的頻繁項集的個數為22個時,a、b、c的測量值為15.203m、16.904m、11.804m;
產生的頻繁項集的個數為24個時,a、b、c的測量值為15.206m、16.906m、11.805m;
產生的頻繁項集的個數為26個時,a、b、c的測量值為15.205m、16.907m、11.806m;
產生的頻繁項集的個數為28個時,a、b、c的測量值為15.206m、16.908m、11.807m。
a、b、c的實測數據為15.2m、16.9m、11.8m,根據實驗方法測量數據和實測數據對每種測量距離的平均測量誤差進行計算,具體誤差計算結果如下:
產生的頻繁項集的個數為18個時平均測量誤差為

產生的頻繁項集的個數為20個時平均測量誤差為

產生的頻繁項集的個數為22個時平均測量誤差為

產生的頻繁項集的個數為24個時平均測量誤差為

產生的頻繁項集的個數為26個時平均測量誤差為

產生的頻繁項集的個數為28個時平均測量誤差為

接著將掃描不動產邊界圖像交易數據庫中相關圖片的次數調整為50次,同樣在產生頻繁項集的個數為18、20、22、24、26、28個時對a、b、c的值進行測量。
此時測量結果具體如下:
產生頻繁項集的個數為18、20、22、24、26、28個時,a、b、c的測量值分別為15.202m、16.902m、11.801m;15.202m、16.903m、11.802m;15.203m、16.903m、11.804m;15.204m、16.905m、11.804m;15.205m、16.905m、11.804m;15.205m、16.906m、11.805m。
計算的平均測量誤差(如表1所示):

表1 焦距為19mm時的平均測量誤差
綜合以上實驗結果,掃描不動產邊界圖像交易數據庫中相關圖片的次數是50次時,其平均測量誤差整體低于掃描30次,證明多次掃描不動產邊界圖像交易數據庫中相關圖片能夠提升測量精確度。
同時,在產生頻繁項集的個數較少的時候,測量結果更接近真實值,而在產生頻繁項集的個數變多后,實驗中的平均測量誤差越來越大。這說明設計方法在產生頻繁項集較少時可以進行更加精準地測量。
接著針對低矮不動產房屋頂部實施邊界三維測量。在實驗數據集中選擇一片較為低矮的房屋,調用的頂部數據集圖像具體(如圖4所示):

圖4 調用的頂部數據集圖像
對其中五個比較低矮的房屋的屋脊實施邊界三維測量,如圖4中的標記所示。對五個房屋屋脊的平均測量誤差進行計算,具體如式(7)所示:

由式(7)計算結果表明:對低矮不動產房屋頂部實施邊界三維測量的平均測量誤差較低。此次測量誤差的計算結果表明,設計的基于關聯規則算法的不動產邊界三維測量方法適用于多種場景下的不動產邊界三維測量,滿足了設計需求。
近年來,數字地球和信息化技術的發展,為不動產邊界三維測量問題帶來了更加廣闊的發展空間,該技術對于不動產的修復重建和三維建模均有重大意義。應用關聯規則算法對該問題進行研究,主要是利用關聯規則算法進行不動產圖像邊界三維數據的挖掘,實例驗證了該算法的應用能夠達到較低的測量誤差,也證明設計方法可以實現近距離的不動產邊界三維測量。今后將針對較遠距離的測量精度提升問題進行研究。