基于Bert 的測(cè)試用例復(fù)用方法研究

2022-01-07 01:23:14萬(wàn)進(jìn)勇史涯晴羅浩榕

軟件導(dǎo)刊 2021年12期

萬(wàn)進(jìn)勇，史涯晴，黃松，羅浩榕

（陸軍工程大學(xué)指揮控制工程學(xué)院，江蘇南京 210001）

0 引言

隨著軍隊(duì)現(xiàn)代化建設(shè)進(jìn)程加快推進(jìn)，越來(lái)越多的軍事軟件應(yīng)用到軍事活動(dòng)中，因而對(duì)這些軍事軟件的質(zhì)量要求越來(lái)越高。軟件測(cè)試作為裝備試驗(yàn)鑒定中的重要一環(huán)，對(duì)裝備質(zhì)量起到保駕護(hù)航的作用，同時(shí)也對(duì)測(cè)試效率要求越來(lái)越高。軟件測(cè)試是程序的一種執(zhí)行過(guò)程，是在軟件生命周期中一項(xiàng)十分重要且復(fù)雜的工作，是軟件可靠性保證的有效方法。研究表明，軟件測(cè)試占用軟件開(kāi)發(fā)過(guò)程的大量時(shí)間，提高軟件測(cè)試效率、縮短軟件研制周期是軟件工程領(lǐng)域亟待解決的問(wèn)題［1］。近年來(lái)，圍繞提高軟件測(cè)試效率，研究者提出大量自動(dòng)化測(cè)試框架與測(cè)試方法，提高了軟件測(cè)試執(zhí)行階段的效率。

在測(cè)試設(shè)計(jì)階段，如何提高測(cè)試用例設(shè)計(jì)是軟件測(cè)試過(guò)程中的關(guān)鍵一步，測(cè)試用例復(fù)用的思想由此產(chǎn)生。測(cè)試用例設(shè)計(jì)是軟件測(cè)試過(guò)程中的重要環(huán)節(jié)，利用歷史項(xiàng)目的測(cè)試用例，指導(dǎo)新項(xiàng)目測(cè)試用例的設(shè)計(jì)與執(zhí)行，實(shí)現(xiàn)測(cè)試過(guò)程中的資產(chǎn)復(fù)用是提高軟件測(cè)試效率的重要方式。軟件測(cè)試作為一項(xiàng)知識(shí)密集型活動(dòng)，在歷史測(cè)試的各階段都會(huì)產(chǎn)生大量測(cè)試文本數(shù)據(jù)，通過(guò)整理提取歷史測(cè)試資產(chǎn)庫(kù)中的測(cè)試用例相關(guān)測(cè)試數(shù)據(jù)建立軟件測(cè)試用例庫(kù)。在此基礎(chǔ)上通過(guò)Bert 語(yǔ)言模型［2］對(duì)測(cè)試用例庫(kù)的數(shù)據(jù)進(jìn)行處理，結(jié)合文本相似度計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用，以此提高測(cè)試人員測(cè)試用例設(shè)計(jì)效率。

目前，有關(guān)測(cè)試用例的復(fù)用研究可分為以下幾種類型：基于形式化建模的復(fù)用方法，使用XML、Z 語(yǔ)言等［3-4］方式對(duì)測(cè)試資產(chǎn)從不同層面建立統(tǒng)一規(guī)范的表述從而形成測(cè)試資產(chǎn)庫(kù)，在此基礎(chǔ)上使用基于關(guān)鍵字的檢索或相似性度量的方式實(shí)現(xiàn)測(cè)試資產(chǎn)復(fù)用；基于主題詞檢索復(fù)用方法［5］需要構(gòu)建軟件測(cè)試用例的檢索模型，通過(guò)模型匹配與檢索算法獲取測(cè)試資產(chǎn)庫(kù)中的測(cè)試用例信息；基于需求匹配模型，通過(guò)建立測(cè)試用例與軟件測(cè)試需求之間的關(guān)聯(lián)性，包括建立軟件需求—測(cè)試樹(shù)、獲取需求的向量表示并進(jìn)行需求分類［6］、利用TF-IDF 詞頻統(tǒng)計(jì)方法與向量模型［7］挖掘文檔標(biāo)簽信息進(jìn)而復(fù)用測(cè)試用例文檔。

通過(guò)相關(guān)文獻(xiàn)研讀，測(cè)試用例復(fù)用研究中還存在一些問(wèn)題：歷史測(cè)試資產(chǎn)包含繁雜的測(cè)試信息且存在形式各異，對(duì)測(cè)試用例采集造成挑戰(zhàn)；測(cè)試文本數(shù)據(jù)具有很強(qiáng)的文本語(yǔ)義信息，以往通過(guò)檢索的復(fù)用方式難以挖掘測(cè)試文本數(shù)據(jù)更深層的語(yǔ)義信息從而實(shí)現(xiàn)更小粒度的復(fù)用。

參考GJB/Z141 軍用軟件測(cè)試指南、GJB 438B 軍用軟件開(kāi)發(fā)文檔中測(cè)試用例涉及的文本信息，本文分析測(cè)試用例復(fù)用所需的測(cè)試信息，通過(guò)SQL 語(yǔ)言等技術(shù)對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化的測(cè)試用例、測(cè)試需求進(jìn)行采集，形成比較標(biāo)準(zhǔn)的測(cè)試用例資產(chǎn)庫(kù)。為了獲取測(cè)試文本語(yǔ)義向量表示，引入自然語(yǔ)言處理領(lǐng)域中預(yù)訓(xùn)練語(yǔ)言模型，將構(gòu)建的測(cè)試數(shù)據(jù)訓(xùn)練集輸入到Bert 預(yù)訓(xùn)練語(yǔ)言模型，進(jìn)行微調(diào)以更新模型參數(shù)。通過(guò)微調(diào)的模型能夠獲取到測(cè)試文本數(shù)據(jù)更好的語(yǔ)義向量表示，結(jié)合文本相似度計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用。最后通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法的有效性，提升了測(cè)試用例設(shè)計(jì)效率與質(zhì)量。

1 軟件測(cè)試用例資產(chǎn)庫(kù)

軟件測(cè)試用例復(fù)用的一個(gè)重要前提是構(gòu)建一個(gè)完備且規(guī)范的測(cè)試用例庫(kù)，測(cè)試用例、測(cè)試需求是軟件測(cè)試資產(chǎn)庫(kù)中的核心資產(chǎn)。測(cè)試團(tuán)隊(duì)?wèi)?yīng)具備全面、協(xié)調(diào)和可持續(xù)發(fā)展的特點(diǎn)，構(gòu)建標(biāo)準(zhǔn)化、規(guī)范化的測(cè)試資產(chǎn)庫(kù)，用于指導(dǎo)今后測(cè)試設(shè)計(jì)與測(cè)試人員培訓(xùn)等工作。軟件測(cè)試貫穿于軟件開(kāi)發(fā)生命周期，每個(gè)測(cè)試階段都會(huì)輸出相應(yīng)文檔，這就是基礎(chǔ)的測(cè)試資產(chǎn)，不同測(cè)試階段，測(cè)試的輸入輸出如表1 所示。軟件測(cè)試資產(chǎn)不僅包括測(cè)試的全生命周期中輸出的各種文檔數(shù)據(jù)，同時(shí)也包括測(cè)試團(tuán)隊(duì)積累的測(cè)試經(jīng)驗(yàn)、技能和思維，比如某類項(xiàng)目中的一些共性功能、同類缺陷、測(cè)試策略等。

Table 1 Assets output during testing表1 測(cè)試過(guò)程中輸出的資產(chǎn)

本文主要通過(guò)研究測(cè)試資產(chǎn)實(shí)現(xiàn)測(cè)試用例復(fù)用，測(cè)試用例復(fù)用是軟件復(fù)用中的一種類型，軟件復(fù)用是為避免重復(fù)勞動(dòng)、提高軟件質(zhì)量和生產(chǎn)效率的解決方案［8］。根據(jù)軟件復(fù)用對(duì)象可分為兩類：產(chǎn)品復(fù)用和流程復(fù)用，產(chǎn)品復(fù)用指軟件開(kāi)發(fā)過(guò)程中的需求規(guī)范、軟件設(shè)計(jì)、測(cè)試計(jì)劃、測(cè)試數(shù)據(jù)等，流程復(fù)用是使用可復(fù)用的應(yīng)用生成器自動(dòng)或者半自動(dòng)復(fù)用開(kāi)發(fā)過(guò)程并自動(dòng)生成所需系統(tǒng)［9］。

測(cè)試用例設(shè)計(jì)是軟件測(cè)試過(guò)程中的重要環(huán)節(jié)，如何利用歷史項(xiàng)目的測(cè)試用例，指導(dǎo)新項(xiàng)目測(cè)試用例設(shè)計(jì)與執(zhí)行，實(shí)現(xiàn)軟件測(cè)試用例復(fù)用是軟件測(cè)試復(fù)用的主要研究方向。在已有的一些測(cè)試資產(chǎn)中，測(cè)試大綱能夠體現(xiàn)出軟件需求與測(cè)試需求的關(guān)系，由于特征相似的需求具有相似的測(cè)試項(xiàng)，需提取測(cè)試大綱中測(cè)試需求建立測(cè)試用例資產(chǎn)庫(kù)。由于相似測(cè)試項(xiàng)對(duì)應(yīng)的測(cè)試用例也具有一定的相似性，通過(guò)測(cè)試需求與測(cè)試用例之間的關(guān)系完成測(cè)試用例資產(chǎn)庫(kù)建設(shè)，作為測(cè)試用例復(fù)用的基礎(chǔ)。

測(cè)試需求與測(cè)試用例關(guān)聯(lián)最緊密，測(cè)試用例設(shè)計(jì)都是根據(jù)軟件軟件測(cè)試需求進(jìn)行精心設(shè)計(jì)。軟件測(cè)試需求明確了測(cè)試過(guò)程中待解決的問(wèn)題，在建立的測(cè)試用例資產(chǎn)庫(kù)中，測(cè)試需求應(yīng)包含以下5 個(gè)屬性信息：需求項(xiàng)名稱表示為Name、所屬領(lǐng)域信息表示為Filed Information、需求描述表示為Description、需求類型Type、測(cè)試方法Method。因此，將測(cè)試需求（TR）表示為一個(gè)五元組：TR=。

測(cè)試用例是指對(duì)一項(xiàng)特定的軟件產(chǎn)品進(jìn)行測(cè)試任務(wù)描述，為某個(gè)特殊目標(biāo)而編制的一組測(cè)試輸入、執(zhí)行條件以及預(yù)期結(jié)果，用于核實(shí)是否滿足某個(gè)特定軟件需求。測(cè)試用例資產(chǎn)庫(kù)中，測(cè)試用例包括7 個(gè)屬性信息，測(cè)試用例名稱表示為Name、測(cè)試說(shuō)明表示為Description、測(cè)試類型表示為Type、測(cè)試步驟表示為Process、前置條件表示為Precondition、預(yù)期結(jié)果表示為Excepted，測(cè)試需求追蹤表示為Requirement Link，因此測(cè)試用例（TC）可表示為一個(gè)七元組：TC=。測(cè)試用例資產(chǎn)庫(kù)中，測(cè)試用例示例如圖1 所示。

Fig.1 Test case example圖1 測(cè)試用例示例

測(cè)試用例是檢驗(yàn)測(cè)試過(guò)程是否有效的重要因素，設(shè)計(jì)良好的測(cè)試用例是測(cè)試工作的關(guān)鍵。同時(shí)，測(cè)試用例的編寫要求測(cè)試人員對(duì)產(chǎn)品設(shè)計(jì)及軟件需求相關(guān)知識(shí)有比較清晰的認(rèn)知。歷史經(jīng)驗(yàn)表明，同一領(lǐng)域的測(cè)試項(xiàng)目往往遵循相同的行業(yè)規(guī)范、標(biāo)準(zhǔn)等，而同一類型軟件的使用場(chǎng)景、功能結(jié)構(gòu)、性能要求等方面的需求存在很大相似性，因此具備了知識(shí)復(fù)用的基礎(chǔ)，進(jìn)而可以根據(jù)項(xiàng)目之間的軟件特征信息、測(cè)試需求相似性計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用。

2 測(cè)試用例復(fù)用研究

2.1 測(cè)試用例復(fù)用方法

研究表明，當(dāng)兩個(gè)項(xiàng)目存在某種相似性時(shí)，其測(cè)試需求、測(cè)試用例、潛在問(wèn)題等也應(yīng)存在較大相似性，因此從軟件相似性角度研究測(cè)試用例復(fù)用。為了實(shí)現(xiàn)軟件測(cè)試用例復(fù)用，首先需要設(shè)計(jì)一個(gè)結(jié)構(gòu)完整并具有一定規(guī)模的測(cè)試用例資產(chǎn)庫(kù)，并且建立測(cè)試用例與測(cè)試需求的關(guān)聯(lián)關(guān)系。在設(shè)計(jì)好的測(cè)試資產(chǎn)庫(kù)基礎(chǔ)上，按照一定的準(zhǔn)則采取相應(yīng)的技術(shù)對(duì)軟件特征、軟件測(cè)試需求、軟件測(cè)試用例進(jìn)行處理，最終實(shí)現(xiàn)軟件測(cè)試用例的復(fù)用。本文設(shè)計(jì)軟件測(cè)試用例復(fù)用方法如圖2 所示。

首先，基于原有的軟件測(cè)試資產(chǎn)數(shù)據(jù)庫(kù)抽取測(cè)試用例、測(cè)試需求相關(guān)數(shù)據(jù)，形成測(cè)試用例資產(chǎn)庫(kù)。根據(jù)測(cè)試資產(chǎn)庫(kù)中表單數(shù)據(jù)結(jié)構(gòu)，通過(guò)SQL 語(yǔ)言對(duì)歷史項(xiàng)目數(shù)據(jù)庫(kù)進(jìn)行操作，提取軟件特征信息、測(cè)試需求、測(cè)試用例信息，并且根據(jù)需求追蹤表建立測(cè)試需求與測(cè)試用例之間的關(guān)聯(lián)關(guān)系，進(jìn)行合理的分類、管理、維護(hù)，形成最初的測(cè)試資產(chǎn)庫(kù)。

其次，根據(jù)軟件特征信息檢索篩選候選集，根據(jù)軟件測(cè)試需求及測(cè)試人員輸入信息計(jì)算軟件信息之間的相似度，以相似度計(jì)算值作為測(cè)試用例推薦復(fù)用的參考指標(biāo)。信息檢索采用從上至下的策略輸入軟件所屬領(lǐng)域、軟件類型、測(cè)試類型、測(cè)試方法，層層遞進(jìn)獲取測(cè)試用例復(fù)用的候選集。相似度計(jì)算功能借助于Bert 詞向量模型，獲取測(cè)試相關(guān)數(shù)據(jù)向量表示，并通過(guò)計(jì)算兩個(gè)向量之間的距離評(píng)估它們的語(yǔ)義相似度。該步驟在測(cè)試資產(chǎn)庫(kù)的基礎(chǔ)上，利用檢索與相似度計(jì)算技術(shù)，選擇出了測(cè)試推薦復(fù)用的候選集。

最后，通過(guò)對(duì)測(cè)試人員輸入與測(cè)試需求等數(shù)據(jù)之間的相似度值進(jìn)行綜合排序，選擇Top-K 進(jìn)行推薦，實(shí)現(xiàn)對(duì)測(cè)試用例復(fù)用，測(cè)試人員根據(jù)實(shí)際需求對(duì)推薦的測(cè)試數(shù)據(jù)進(jìn)行修改復(fù)用，并將新的測(cè)試用例入庫(kù)以便于后續(xù)模型的進(jìn)一步完善。

2.2 測(cè)試文本相似度計(jì)算

2.2.1 詞向量模型

本文使用Bert 系列語(yǔ)言模型獲取軟件測(cè)試數(shù)據(jù)的詞向量表示作為相似度計(jì)算的基礎(chǔ)，語(yǔ)言模型的發(fā)展經(jīng)歷了從統(tǒng)計(jì)語(yǔ)言模型到神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的階段。早期的語(yǔ)言模型是預(yù)測(cè)某個(gè)文本序列在語(yǔ)言中出現(xiàn)的概率，并以此概率分布表示該文本序列。其中，在統(tǒng)計(jì)語(yǔ)言模型中最具代表性的就是N-gram 模型，它是一種典型的基于稀疏表示的語(yǔ)言模型。

2003 年，Bengio 等［10］提出了神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型，在得到語(yǔ)言模型的同時(shí)也產(chǎn)生了副產(chǎn)品詞向量。神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型將詞表中的單詞i映射為向量函數(shù)C(i)∈Rm，以此表示單詞的分布式向量表示（Distributed Feature Vectors），再通過(guò)一個(gè)函數(shù)將詞向量作為輸入序列(C(wt-n+1),…,C(wt-1))映射成下一個(gè)詞的概率分布。隨著神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型與詞向量的提出，后繼研究者提出了Word2Vec、Glove、Elmo、GPT、Bert 系列等語(yǔ)言模型。

Word2Vec 有兩種訓(xùn)練方法：CBOW、Skip-gram［11］，通過(guò)此方法將單詞表示為上下文無(wú)關(guān)的Static 詞向量，因此無(wú)法解決一詞多義的現(xiàn)象。Elmo 使用兩個(gè)獨(dú)立的單向Lstm實(shí)現(xiàn)根據(jù)上下文不同而獲取不斷變化的Dynamic 詞向量［12］。GPT 是一個(gè)生成式的預(yù)訓(xùn)練模型［13］，采用遠(yuǎn)遠(yuǎn)優(yōu)于Lstm 的特征提取器Transformer。Bert 語(yǔ)言模型的文本特征抽取采用雙向的Transformer 結(jié)構(gòu)，可以進(jìn)一步增加詞向量模型泛化能力，充分描述字符級(jí)、詞級(jí)、句子級(jí)之間的關(guān)系特征。

Fig.2 Test case reuse method圖2 測(cè)試用例復(fù)用方法

2.2.2 相似度計(jì)算方法

本文實(shí)驗(yàn)采用Bert 預(yù)訓(xùn)練語(yǔ)言模型，Bert 語(yǔ)言模型訓(xùn)練可分為預(yù)訓(xùn)練與微調(diào)兩個(gè)過(guò)程。其中，Bert 的預(yù)訓(xùn)練過(guò)程有兩個(gè)任務(wù)，分別是：MaskedLanguageModel（MLM）、Next Sequence Prediction（NSP）。MLM 過(guò)程中使用上下文預(yù)測(cè)中心詞信息獲取詞向量表示，NSP 通過(guò)數(shù)據(jù)學(xué)習(xí)上下句子是否是噪聲以增強(qiáng)句子之間的關(guān)系判斷能力。Bert 語(yǔ)言模型中適用于計(jì)算句子相似度的句子對(duì)任務(wù)結(jié)構(gòu)如圖3 所示。

Fig.3 Bert sentence pair task structure圖3 Bert 句子對(duì)任務(wù)結(jié)構(gòu)

本文針對(duì)相似度計(jì)算任務(wù)，構(gòu)建了針對(duì)Bert 模型進(jìn)行微調(diào)的訓(xùn)練數(shù)據(jù)，訓(xùn)練集數(shù)據(jù)格式為：｛Sentence1、Sentence2、Label｝。Label 標(biāo)簽為0 和1，0 表示句子對(duì)不相關(guān)、1表示句子對(duì)相關(guān)或相似。通過(guò)收集一定數(shù)據(jù)量句子對(duì)，構(gòu)造訓(xùn)練數(shù)據(jù)的數(shù)據(jù)處理類，針對(duì)模型進(jìn)行微調(diào)操作，強(qiáng)化模型在測(cè)試領(lǐng)域的適用性。

通過(guò)Bert 微調(diào)后的語(yǔ)言模型可以獲取到測(cè)試文本數(shù)據(jù)的向量表示，然后通過(guò)計(jì)算測(cè)試數(shù)據(jù)之間語(yǔ)義相似度衡量測(cè)試數(shù)據(jù)的相似程度。Bert 模型中可以將其分類任務(wù)改造成相似度計(jì)算問(wèn)題，然后將CLS 對(duì)應(yīng)的embedding 輸入到一個(gè)sigmoid 函數(shù)表示文本向量。但此種方式學(xué)到的向量并沒(méi)有多少的語(yǔ)義信息，不足以用作測(cè)試文本語(yǔ)句的向量表示，因此在獲取文本向量表示后使用相似度計(jì)算的方式計(jì)算語(yǔ)義相似性。常用的語(yǔ)義相似度計(jì)算方法有歐式距離、余弦距離、杰卡德相似度、海明距離，其中選擇余弦距離是最為常見(jiàn)的文本向量語(yǔ)義相似度算法。因此，本文選擇余弦距離計(jì)算兩個(gè)文本向量之間的夾角余弦值，其計(jì)算公式如式（1）所示。

其中，Dis表示文本之間相似度計(jì)算結(jié)果，取值范圍為[0,1]，值越大表示相似性越高。

根據(jù)測(cè)試資產(chǎn)庫(kù)中測(cè)試需求、測(cè)試用例與測(cè)試輸入數(shù)據(jù)，本文設(shè)計(jì)測(cè)試文本數(shù)據(jù)相似度計(jì)算方法主要過(guò)程如下：

（1）根據(jù)新的測(cè)試項(xiàng)目輸入的特征信息，利用檢索技術(shù)獲取歷史庫(kù)中符合特征的軟件項(xiàng)目得到候選集1。

（2）在候選集1 中根據(jù)測(cè)試人員要求的測(cè)試階段、測(cè)試需求類型、測(cè)試方法等進(jìn)一步選擇出候選集2。

（3）在候選集2 中，計(jì)算測(cè)試人員輸入的需求名稱、需求描述與候選集2 中測(cè)試數(shù)據(jù)之間的相似性，通過(guò)式（1）分別計(jì)算需求名稱之間的相似性SimNa、需求描述之間的相似性SimDe、需求描述與測(cè)試說(shuō)明之間的相似性SimDe-De、需求描述與預(yù)期結(jié)果之間的相似性SimDe-Pre，然后通過(guò)加權(quán)求和得到最終的相似度如式（2）所示。

其中，參數(shù)c1、c2、c3、c44 種屬性相似度所占權(quán)重，根據(jù)測(cè)試人員的經(jīng)驗(yàn)可分別取值為0.3、0.3、0.2、0.2。

（4）利用式（2）計(jì)算并獲取測(cè)試人員輸入與歷史數(shù)據(jù)之間的相似性，根據(jù)相似性值的大小進(jìn)行排序，選擇其中相似性值最高的6 條推薦給測(cè)試人員作為測(cè)試參考信息。

測(cè)試文本相似度計(jì)算過(guò)程偽代碼如下：

其中，item 表示歷史測(cè)試項(xiàng)目庫(kù)，λ 表示文本屬性相似度分配權(quán)值，f 表示新項(xiàng)目輸入的軟件特征，info 表示新測(cè)試輸入文本數(shù)據(jù)。

3 實(shí)驗(yàn)結(jié)果

本次實(shí)驗(yàn)使用實(shí)驗(yàn)室積累的測(cè)試項(xiàng)目數(shù)據(jù)，包括幾種不同類型項(xiàng)目包括功能測(cè)試、接口測(cè)試、性能測(cè)試在內(nèi)的數(shù)千條測(cè)試用例數(shù)集。為了評(píng)價(jià)測(cè)試用例復(fù)用效果，對(duì)某信息管理系統(tǒng)和指揮系統(tǒng)兩個(gè)不同類型的軟件系統(tǒng)進(jìn)行測(cè)試。測(cè)試實(shí)驗(yàn)過(guò)程中測(cè)試用例部分推薦信息如圖4 所示。

挑選4 位新手測(cè)試人員隨機(jī)分成AB 兩組，A 組人員不采用測(cè)試用例復(fù)用方法、B 組人員使用測(cè)試用例復(fù)用方法，統(tǒng)計(jì)用例設(shè)計(jì)效率即單位時(shí)間AB 兩組人員設(shè)計(jì)測(cè)試用例數(shù)以及評(píng)估測(cè)試用例質(zhì)量。實(shí)驗(yàn)中測(cè)試用例設(shè)計(jì)效率如表2 所示，通過(guò)統(tǒng)計(jì)發(fā)現(xiàn)，相比于傳統(tǒng)的測(cè)試用例設(shè)計(jì)，此方法測(cè)試用例設(shè)計(jì)效率提高近70%。

Fig.4 Recommended test case information圖4 推薦的測(cè)試用例信息

Table 2 Test case design efficiency statistics表2 測(cè)試用例設(shè)計(jì)效率統(tǒng)計(jì)

在測(cè)試用例復(fù)用過(guò)程中，B 組人員統(tǒng)計(jì)測(cè)試復(fù)用方法推薦6 條測(cè)試用例中有參考價(jià)值的用例數(shù)稱之為正確推薦用例數(shù)，計(jì)算推薦復(fù)用的準(zhǔn)確率。實(shí)驗(yàn)中測(cè)試用例推薦準(zhǔn)確率如表3 所示，其中準(zhǔn)確率計(jì)算公式如式（3）所示。

其中，N 表示測(cè)試項(xiàng)目需求的個(gè)數(shù)，ni表示根據(jù)每個(gè)需求推薦出的正確測(cè)試用例個(gè)數(shù)。實(shí)驗(yàn)結(jié)果表明，此方法的用例推薦準(zhǔn)確率均在60%以上。

Table 3 Test case recommendation accuracy rate statistics表3 測(cè)試用例推薦準(zhǔn)確率統(tǒng)計(jì)

通過(guò)兩個(gè)不同類型項(xiàng)目對(duì)測(cè)試用例復(fù)用方法進(jìn)行驗(yàn)證，結(jié)果表明，基于Bert 的測(cè)試用例復(fù)用方法可以提高軟件測(cè)試用例設(shè)計(jì)效率。此外，通過(guò)專業(yè)測(cè)試人員對(duì)AB 兩組的測(cè)試用例評(píng)估發(fā)現(xiàn)，B 組設(shè)計(jì)的測(cè)試用例具有更好的可理解性與可維護(hù)性，提升了測(cè)試用例質(zhì)量。同時(shí)，通過(guò)B 組人員統(tǒng)計(jì)出的結(jié)果表明，測(cè)試用例推薦的準(zhǔn)確率能夠滿足測(cè)試人員要求。

4 結(jié)語(yǔ)

本文將歷史測(cè)試項(xiàng)目的測(cè)試需求、測(cè)試用例等數(shù)據(jù)進(jìn)行有效組織與利用，使用測(cè)試文本數(shù)據(jù)對(duì)Bert 語(yǔ)言模型進(jìn)行微調(diào)，獲取到測(cè)試數(shù)據(jù)語(yǔ)義向量表示，以此計(jì)算測(cè)試文本語(yǔ)義相似性從而實(shí)現(xiàn)測(cè)試用例復(fù)用，提高了測(cè)試用例設(shè)計(jì)效率與測(cè)試用例質(zhì)量。后續(xù)工作中，將采用一種孿生網(wǎng)絡(luò)結(jié)構(gòu)［14］，結(jié)合Bert 系列語(yǔ)言模型研究相似度計(jì)算參數(shù)的最優(yōu)取值以提升測(cè)試用例復(fù)用效果。同時(shí)，通過(guò)提取關(guān)鍵詞［15］用于測(cè)試推薦，進(jìn)一步提升測(cè)試用例推薦復(fù)用準(zhǔn)確性。