文/陳敏剛
隨著人工智能系統(tǒng)在各領(lǐng)域的廣泛應(yīng)用,人工智能系統(tǒng)的質(zhì)量保證問題成為其實(shí)際應(yīng)用中的關(guān)鍵因素。考慮到人工智能技術(shù)目前仍被認(rèn)為在一定程度上存在“不確定性”,基于人工智能系統(tǒng)的質(zhì)量保證領(lǐng)域尚存在諸多挑戰(zhàn)。
人工智能是我國重點(diǎn)發(fā)展的產(chǎn)業(yè)之一。2017年,國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》,提出了面向2 0 3 0 年我國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施,構(gòu)筑我國人工智能發(fā)展的先發(fā)態(tài)勢,加快建設(shè)創(chuàng)新型國家和世界科技強(qiáng)國。2018年后,我國又先后出臺了《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計(jì)劃(2018—2020年)》《關(guān)于促進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合的指導(dǎo)意見》等政策性文件,提出要加快行業(yè)布局和規(guī)劃,在國際競爭中搶占先機(jī)。
上海將人工智能作為本市重點(diǎn)發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一,推動人工智能產(chǎn)業(yè)健康發(fā)展。2017年,上海發(fā)布《關(guān)于本市推動新一代人工智能發(fā)展的實(shí)施意見》,要求全面實(shí)施AI@SH行動。截至2020年,上海人工智能重點(diǎn)企業(yè)1 149家,全年產(chǎn)業(yè)規(guī)模達(dá)到2 246億元;已形成了較為完備的人工智能產(chǎn)業(yè)鏈,重大創(chuàng)新成果接連涌現(xiàn),應(yīng)用賦能價值不斷凸顯,“4+X”特色載體格局基本形成,產(chǎn)業(yè)生態(tài)進(jìn)一步完善;人工智能“上海方案”獲批實(shí)施,國家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)、創(chuàng)新應(yīng)用先導(dǎo)區(qū)建設(shè)穩(wěn)步推進(jìn),3屆世界人工智能大會成功舉辦,這些舉措使品牌知名度進(jìn)一步打響,為“十四五”期間建成人工智能“上海高地”、打造世界級產(chǎn)業(yè)集群奠定了良好基礎(chǔ)。
行業(yè)的健康發(fā)展,離不開質(zhì)量保證,新的產(chǎn)業(yè)發(fā)展目標(biāo)同樣也對質(zhì)量保證工作提出了更高的要求。
人工智能是一種軟件系統(tǒng),它所包含的需求分析、數(shù)據(jù)采集、設(shè)計(jì)與開發(fā)、測試和部署運(yùn)維等環(huán)節(jié)都有必要進(jìn)行適當(dāng)?shù)馁|(zhì)量保證活動。據(jù)《上海市人工智能行業(yè)質(zhì)量狀況調(diào)查報告》顯示,47.32%的企業(yè)對“人工智能系統(tǒng)的故障導(dǎo)致對人類生命、健康、財(cái)產(chǎn)或自然環(huán)境的威脅”進(jìn)行評估,58.03%的企業(yè)對“人類或其他系統(tǒng)對人工智能系統(tǒng)攻擊帶來的安全隱患”進(jìn)行評估,77.67%的企業(yè)對“人工智能系統(tǒng)對個人隱私數(shù)據(jù)帶來的侵犯和泄露的風(fēng)險”進(jìn)行評估,這些風(fēng)險評估都屬于質(zhì)量保證活動的一環(huán)。

舉個簡單的例子,新冠肺炎疫情期間,社會對智能測溫儀器存在大量需求。測溫儀器準(zhǔn)不準(zhǔn)、靈敏不靈敏、對工作環(huán)境要求高不高等,都將對防疫工作有重要影響。通過制定智能人體溫度檢測與識別系統(tǒng)的標(biāo)準(zhǔn)——《智能人體溫度檢測與識別系統(tǒng)技術(shù)要求和測試評價方法》(T/CESA 1008-2020),可解決這個問題。T/CESA 1008-2020主要包括功能指標(biāo)和性能指標(biāo)。功能指標(biāo)要求人體智能測溫不僅要檢測出人臉,還要檢測出額頭(因?yàn)槿梭w不同部位的溫度不一致,所以統(tǒng)一以額頭區(qū)域的溫度作為基準(zhǔn)),準(zhǔn)確地檢出體溫異常的人員;性能指標(biāo)則關(guān)注人體溫度的測量精度和速度等,標(biāo)準(zhǔn)規(guī)定的溫度誤差不超過±0.4℃,測溫時間則不大于1 s。
人工智能系統(tǒng)的質(zhì)量保證是個新的研究領(lǐng)域,目前缺少基于人工智能系統(tǒng)質(zhì)量保證的標(biāo)準(zhǔn)化方法。鑒于自身的特性,人工智能系統(tǒng)在質(zhì)量保證方面存在諸多挑戰(zhàn)。
因斯布魯克大學(xué)的Michael Felderer和奧地利哈根貝里軟件中心的Rudolf Ramler在《基于人工智能系統(tǒng)的質(zhì)量保證:概述和挑戰(zhàn)》中闡述:軟件應(yīng)具有準(zhǔn)確性和正確性,而基于人工智能的系統(tǒng)由于其內(nèi)在的不確定性被認(rèn)為是存在固有“缺陷”的,它通常在一個精度范圍內(nèi)運(yùn)行。這與常規(guī)測試和質(zhì)量保證原則及方法的假設(shè)是相悖的,即系統(tǒng)被默認(rèn)應(yīng)該是正確的。同時,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)訓(xùn)練的模型被認(rèn)為是不透明、不直觀、難以理解的。開發(fā)人員和測試人員習(xí)慣于對傳統(tǒng)軟件系統(tǒng)進(jìn)行規(guī)范和定義,這些規(guī)范和定義提供了理解、構(gòu)建和測試系統(tǒng)所需的知識。但是,當(dāng)人工智能模型確認(rèn)存在缺陷時,模型的“黑盒子”特性會影響模型的測試。
因此,常規(guī)的測試標(biāo)準(zhǔn)和質(zhì)量度量方法不能完全適用于基于人工智能的系統(tǒng),而且目前,人工智能更迭速度非常快,其更新時間已經(jīng)以天為單位。這就導(dǎo)致了行業(yè)標(biāo)準(zhǔn)水平遠(yuǎn)遠(yuǎn)落后于產(chǎn)業(yè)發(fā)展水平,一些系統(tǒng)在應(yīng)用時無標(biāo)準(zhǔn)可以依據(jù),質(zhì)量保證工作也缺少對應(yīng)的參照物。
人工智能行業(yè)對更高質(zhì)量和更大范圍標(biāo)準(zhǔn)的應(yīng)用需求很大,需要全社會投入更多的資源去實(shí)踐和探索人工智能的技術(shù)應(yīng)用與測試評估規(guī)范,逐步建設(shè)一套完整的標(biāo)準(zhǔn)體系,為產(chǎn)業(yè)健康發(fā)展保駕護(hù)航。