需求模板一致性智能化檢查

2023-10-09 01:47:06張龍陽楊衛(wèi)東

計(jì)算機(jī)應(yīng)用與軟件 2023年9期

張龍陽楊衛(wèi)東

(復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系上海 201203)

0 引言

自然語言是定義需求[1]最為普遍的方式,它只需要對(duì)從業(yè)人員進(jìn)行很少的訓(xùn)練。然而自然語言普遍存在歧義,且很難自動(dòng)化分析,為此研究人員提出了使用需求模板來對(duì)需求進(jìn)行限制。需求模板由若干個(gè)預(yù)定義的槽組成,將需求語句轉(zhuǎn)化為可分析的組件,減少歧義且易于自動(dòng)化分析。

對(duì)于應(yīng)用了需求模板的需求文檔,一個(gè)重要的工作就是驗(yàn)證需求語句是否符合模板。由于需求文檔可能包含大量的需求語句,人工審核需求語句是否符合模板是一項(xiàng)繁重的工作,因此自動(dòng)化分析需求語句關(guān)于模板的一致性就變得至關(guān)重要。

目前,對(duì)于需求模板一致性檢查的研究較少,RQA工具[2]提供了對(duì)于模板一致性的驗(yàn)證方法,然而其方法在術(shù)語表未定義時(shí)效果一般;Reta工具[3-4]基于文本分塊和模式匹配,在術(shù)語表未定義的情況下,取得了不錯(cuò)的效果,但是當(dāng)需求語句含有復(fù)雜的詞組時(shí),需要調(diào)用解析器來對(duì)需求語句進(jìn)行解析,時(shí)間復(fù)雜度由O(n)變?yōu)镺(n3)。

針對(duì)上述問題,本文提出了基于依存分析[5]的模板一致性檢查方法,該方法通過分析需求模板得到通用的依存結(jié)構(gòu),對(duì)需求語句進(jìn)行依存結(jié)構(gòu)分析并與通用依存結(jié)構(gòu)匹配,得出需求語句的一致性信息。

1 需求模板

本節(jié)描述了兩個(gè)常用的需求模板,以及兩個(gè)模板的詞性和依存結(jié)構(gòu)信息。

1.1 模板定義

1.1.1Rupp模板

圖1所示為Rupp模板[6],Rupp模板由六個(gè)槽組成,分別為:(1) 可選條件;(2) 系統(tǒng)名稱;(3) 情態(tài)動(dòng)詞(shall/should/will)(決定需求的重要性);(4) 所需的處理功能(分為三種不同的形式);(5) 處理功能的對(duì)象;(6) 關(guān)于對(duì)象的額外信息。

根據(jù)所需處理功能的不同,Rupp模板分為三種類型:(1) 自主需求,使用格式,表明該功能是獨(dú)立于用戶的,如圖2中的R1;(2) 用戶交互需求,使用PROVIDE WITH THE ABILITY TO 格式,表明該功能是提供給特定用戶的,如圖2中的R2;(3) 接口需求,使用BE ABLE TO 格式,表明該功能由其他系統(tǒng)的事件觸發(fā),如圖2中的R3。

圖2 Rupp模板需求語句示例

1.1.2EARS模板

圖3所示為EARS模板[7-8],EARS模板由4個(gè)槽組成:(1) 可選條件;(2) 系統(tǒng)名稱;(3) 情態(tài)動(dòng)詞shall;(4) 系統(tǒng)響應(yīng)。

根據(jù)可選條件的不同,EARS模板可分為六種類型:(1) 普遍需求,沒有可選條件,表明功能總是活躍的;(2) 事件驅(qū)動(dòng)需求,以WHEN開頭,由事件觸發(fā);(3) 不必要的行為需求,以IF開頭,Then在之前,表明不期望發(fā)生的事件;(4) 狀態(tài)驅(qū)動(dòng)需求,以WHILE開頭,功能在滿足特定狀態(tài)時(shí)活躍;(5) 可選功能需求,以WHERE開頭,當(dāng)某些可選功能存在時(shí)活躍;(6) 復(fù)雜需求,由以上多個(gè)條件混合而成的需求。圖4所示為6種需求示例。

圖4 EARS模板需求語句示例

比較Rupp模板和EARS模板,EARS模板在可選條件上提供了更多的功能,而Rupp模板在非可選條件上加了更多的限制。

1.2 依存結(jié)構(gòu)

依存信息是句子里單詞上的一個(gè)有向圖,表示單詞之間的依賴關(guān)系,如圖5所示。

圖5 依存結(jié)構(gòu)示例

單詞之間的依賴關(guān)系由帶標(biāo)記的有向弧表示,如root作為一個(gè)依賴關(guān)系,指向prefer,表明prefer為該句的根;prefer有一個(gè)指向I的有向弧,依賴關(guān)系為nsubj,表明prefer的名詞性主語為I;prefer有一個(gè)指向flight的依賴關(guān)系dobj,表明flight為prefer的直接賓語。

1.2.1Rupp模板依存結(jié)構(gòu)

Rupp模板的三種類型由第4個(gè)槽所區(qū)分,可通過預(yù)處理的方式,將第4個(gè)槽預(yù)處理成為只含有的形式,這樣,就可以將所有的基于Rupp模板的需求轉(zhuǎn)化為自主需求。圖6所示為自主需求的依存結(jié)構(gòu)。

圖6 Rupp模板自主需求依存結(jié)構(gòu)

需求語句的根為一個(gè)動(dòng)詞root verb,該動(dòng)詞為中的表示功能的動(dòng)詞,root verb有4個(gè)必備的依賴關(guān)系,圖中用實(shí)線表示:(1) 系統(tǒng)名稱,依賴關(guān)系為nsubj(主語);(2) 情態(tài)動(dòng)詞,依賴關(guān)系為aux(助動(dòng)詞);(3) 對(duì)象,依賴關(guān)系為obj(賓語);(4) 句點(diǎn),依賴關(guān)系為punct(標(biāo)點(diǎn)符號(hào))。同時(shí)存在兩個(gè)可選的依賴關(guān)系,圖中用虛線表示:(1) 可選條件,依賴關(guān)系為advcl(狀語從句)或者advmod(副詞修飾);(2) obl,依賴關(guān)系為obl(副詞參數(shù))。

1.2.2EARS模板依存結(jié)構(gòu)

EARS模板分為6種類型,6種類型通過可選條件的引導(dǎo)詞來區(qū)分,在依賴關(guān)系中,將可選條件從句都視為主句的狀語從句,這樣可以將6種需求視為同種需求來進(jìn)行依存分析,如圖7所示。

圖7 EARS模板依存結(jié)構(gòu)

需求語句的根為一個(gè)動(dòng)詞root verb,該動(dòng)詞為中表示系統(tǒng)響應(yīng)的動(dòng)詞,root verb存在3個(gè)必備的依賴關(guān)系:(1) 系統(tǒng)名稱,依賴關(guān)系為nsubj(主語);(2) 情態(tài)動(dòng)詞shall,依賴關(guān)系為aux(助動(dòng)詞);(3) 句點(diǎn),依賴關(guān)系為punct(標(biāo)點(diǎn)符號(hào));(4) 1個(gè)或多個(gè)可選的依賴關(guān)系:可選條件,依賴關(guān)系為advcl(狀語從句)。

2 模板一致性檢查方法

本節(jié)將提出具體的需求模板的一致性檢查方法。基于自然語言處理,將需求語句進(jìn)行tokenization、句子分割、詞性標(biāo)注和依存分析。對(duì)部分出現(xiàn)詞性標(biāo)注或依存分析錯(cuò)誤的需求語句進(jìn)行適當(dāng)?shù)男拚?/p>

2.1 整體流程

模板一致性檢查方案的整體流程如圖8所示。

圖8 模板一致性檢查整體流程

需求文檔是包含有多條需求語句的一份文件,首先通過Tokenization和句子分割將需求文檔分割為單條的需求語句;然后對(duì)每條需求語句進(jìn)行初步判斷,如不含有情態(tài)動(dòng)詞即為不一致;接下來對(duì)需求語句進(jìn)行詞性標(biāo)注和依存分析,得出句子的依存結(jié)構(gòu)信息,判斷句子依存結(jié)構(gòu)是否符合模板依存結(jié)構(gòu),符合則與模板一致,不符合則不一致。

圖9所示為一個(gè)需求文檔中的四條需求語句,該需求文檔應(yīng)用Rupp模板。其中,R1符合Rupp模板,R2、R3、R4不符合Rupp模板。該需求文檔經(jīng)過句子分割后,可分離出需求文檔中的所有需求語句。對(duì)R1-R4進(jìn)行情態(tài)動(dòng)詞的驗(yàn)證,可知R2不含模板情態(tài)動(dòng)詞,因此R2與模板不一致;接著對(duì)R1、R3、R4進(jìn)行詞性標(biāo)注和依存分析,可得出圖10所示的依存結(jié)構(gòu),與圖6所示Rupp模板依存結(jié)構(gòu)進(jìn)行匹配,可知R4缺少

需求模板一致性智能化檢查

0 引言