馬輝



摘要:為提高評估數據庫軟件可靠性的準確率,提出基于信息檢索的數據庫軟件可靠性評估技術研究。引入信息檢索技術,確定數據庫軟件可靠性評估過程,建立數據庫軟件測試模型,計算可靠性評估估計值,評估數據庫軟件可靠性。實驗結果表明:此次研究的數據庫軟件可靠性評估技術,評估數據庫軟件可靠性所需時間短,具有較小的評估誤差,較高的可靠性評估準確率、召回率。
關鍵詞:信息檢索;數據庫;軟件;可靠性;評估技術
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)26-0018-02
開放科學(資源服務)標識碼(OSID):
數據庫在使用的過程中,難免會受到硬件的影響,如磨損、失效率、振動和沖擊影響等問題,導致軟件不能在硬件上繼續運行,此外,還會受到軟件本身的失效率、設計缺陷等問題影響,出現數據庫軟件提前崩潰、失效等現象[1-2]。因此,對數據庫進行可靠性評估具有很大的重要性。為此,研究數據庫軟件可靠性評估技術,實時評估數據庫軟件可靠性,檢測數據庫軟件的運行情況。
1 研究基于信息檢索的數據庫軟件可靠性評估技術
1.1 基于信息檢索的數據庫軟件可靠性評估過程
評估數據庫軟件可靠性,需要設計數據庫軟件測試模型,在測試的過程中,評估數據庫軟件可靠性。所以,此次設計的數據庫軟件可靠性評估過程如下:
1)確定可靠性評估目標——數據庫軟件;
2)引入數據庫軟件測試工具;分別測試數據庫軟件負載、功能和缺陷;
3)測試數據庫軟件;
4)收集該數據庫軟件運行時間、存儲時間、錯誤數據、存儲錯誤等失效數據;
5)建立數據庫軟件可靠性模型;
6)在數據庫軟件可靠性評估模型中,引入信息檢索技術,在數據庫軟件測試工具作用下,測試數據庫軟件,其測試過程如下:
a.在數據庫軟件界面,輸入檢索詞,檢索數據庫中,存儲的數據;
b.通過數據庫軟件中的用戶交互界面,連接系統數據庫,檢索數據庫中的數據,并將用戶輸入的檢索詞,與數據標簽進行對比,篩選相適應的數據;
c.計算用戶輸入的檢索詞,與從數據庫中,搜索出的數據信息匹配程度;
d.輸出最終檢索結果,通過用戶交互界面,將檢索到的數據,傳輸給用戶。
7)評估數據庫軟件可靠性;
8)判斷數據庫軟件,是否達到可靠性估計值;
9)當數據庫軟件沒有達到可靠性估計值時,進行連續測試;重復步驟4;
10)當數據庫軟件達到可靠性估計值時,即完成數據庫軟件可靠性評估,輸出評估結果。
此時,即可根據上述步驟,確定的數據庫軟件可靠性評估過程,評估數據庫軟件可靠性。
1.2 建立數據庫軟件測試模型
依據此次研究,確定的數據庫軟件可靠性評估步驟,做出如下假設:
1)數據庫軟件的程序中,存在的固有錯誤個數為[N0],表示未知常數;
2)數據庫軟件中的運行程序,錯誤的發生屬于相互獨立狀態,其引發數據庫軟件,產生失效的可能性大致相同,但是,由此引起的數據庫軟件,失效時間間隔,也處于相互獨立狀態;
3)此次建立的數據庫,所使用的數據庫軟件測試工具,在每一次的測試的過程中,都會排除一個數據庫軟件中存在的錯誤,且在錯誤排除的過程中,不會引入新的錯誤;
4)數據庫軟件中,程序運行時的錯誤發生率相同,且每種錯誤出現的可能性相互獨立,采用測試軟件,檢測出的數據庫軟件錯誤率,與數據庫軟件運行過程中,存在的錯誤呈正比;
5)數據庫軟件所存在的失效率,在每個時間間隔內,都屬于常數[3],與數據庫軟件中,殘留的錯誤數呈正比;此時,假設時間變量為[p],第[i]次失效間隔中以第[i-1]失效為起點的時間變量為[pi],則軟件失效率函數[Z]為:
[Zpi=φN0-i+1]? ? ? ? ? ? ? ? ? ? ? (1)
式中,[φ]表示數據庫軟件的失效率與軟件中殘留的錯誤數的比例常數。
6)數據庫軟件的運行方式,為其正常運行狀態,不存在運行問題。所以,此次建立的數據庫軟件可靠性評估模型,所要求的數據,為完全失效數據。為此,假設軟件失效時間間隔集合為[X=x1,x2,…,xn],[n]表示時間間隔次數。實際失效時間為[T=t1,t2,…,tn],其中,[xi=ti-ti-1],[i=1,2,…,n],[t0=0]。
依據上述內容,確定的6條假設,建立的數據庫軟件評估模型如下:
[fxi=φN0-i+1exp-φN0-i+1xiFxi=1-exp-φN0-i+1xiRxi=exp-φN0-i+1xi]? ? (2)
式中,[fxi]表示數據庫軟件密度;[Fxi]表示數據庫軟件分布;[Rxi]表示數據庫軟件可靠性[4]。此時,即可確定數據庫軟件評估模型,評估特征值,作為數據庫軟件評估估計值。
1.3 計算可靠性評估估計值
此次研究,建立如(2)式所示的數據庫軟件可靠性評估模型,存在[φ]和[N0]兩個未知值,需要針對[φ]和[N0]兩個未知值求解,得到[φ]和[N0]兩個未知值的估計值,賦予(2)式實際價值。為此,引入統計學中的最大似然估計法,求取[φ]和[N0]兩個未知值的估計值。
為此,假設數據庫軟件在測試過程中,其程序總共出現了[n]次失效,且[n]次失效的失效間隔時間為[x1,x2,…,xn],則[φ]和[N0]兩個未知值的似然函數[Lφ,N0]為: