999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的聊天機器人自動化平臺設計

2023-09-25 17:13:22肖俊輝冉國翔朱榮清陳鏡宇張天乙
現代計算機 2023年14期
關鍵詞:模型系統

肖俊輝,孫 麗,冉國翔,朱榮清,陳鏡宇,張天乙

(東南大學成賢學院電子與計算機工程學院,南京 210000)

0 引言

本項目的靈感來源于QQ群中的群聊機器人小冰,其功能包含入群歡迎、提醒打卡、簡單的游戲交互等,那么我們能否創造一個功能更加完善、更加類似人類、更加貼合特定群聊特色的(個性化的)機器人加入群聊之中呢?一個對計算機編程了解甚少的人又如何能夠在群聊中擁有自己所需要的機器人呢?于是我們便計劃開發一個平臺,使得更多的人能夠通過低代碼甚至無代碼的簡單方式獲取和培養個性化的聊天機器人,旨在將本技術簡單化、日常化,帶入人們的日常生活。

經過多方渠道考察,從1950 年開始,隨著聊天機器人相關研究的不斷發展,已有眾多聊天機器人產品相繼面世,目前的熱點便是2022年11 月30 日由美國OpenAI 公司發布的聊天機器人程序ChatGPT,其為人工智能技術驅動的自然語言處理工具,能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流。這一里程碑式的技術革命便是深度學習應用越來越廣泛,技術越來越成熟的體現,其核心通過機器來模仿人類的對話內容和習慣,對聊天輸入的內容做出決策和判斷,給予相應的回應。

現如今國內外雖已出現眾多的聊天機器人產品,但都在個性化和簡便性方面有所不足,導致目前大部分聊天機器人還是需投入到客服環境中使用,因此如果實現了聊天機器人個性化和簡便性的突破,便可走進普通人的日常生活,小到供人消遣娛樂、排憂解難,大到協助公司部門進行人事管理、甚至能夠做到24 小時不間斷提供高質量人性化服務等,以其個性化程度進軍各行各業,將擁有巨大的市場潛力。

本項目計劃開發一個基于深度學習的聊天機器人自動化搭建平臺的軟件產品,試圖在上述技術方面有所突破,彌補現階段QQ小冰在群聊趣味性、個性化上的不足,以低代碼甚至無代碼形式對機器人進行操作。本項目產品與QQ小冰的功能對比見表1。

表1 本項目與QQ小冰功能對比

1 總體設計

軟件總共分為三個系統,如圖1所示,包括聊天數據收集系統、聊天回復系統和自動化訓練系統。

圖1 總體架構

2 詳細設計

2.1 軟件設計

2.1.1 聊天數據收集系統

通過Mirai框架,運用Http技術[1],使得QQ能與軟件連接,可以自動將聊天記錄生成一個“問—答”的詞庫,其中對數據集過濾方式包括:用戶自定義策略、常用的無用語句、敏感隱晦字眼分析。最后根據詞庫鏈生成訓練用語料集。

2.1.2 聊天回復系統

同樣通過Mirai 框架,讓QQ 群或者私聊作為一個聊天室的載體,可以收集數據的同時,使用訓練的模型給出特定的回答,并回復在群聊中,系統功能架構如圖2所示。

圖2 收集/回復系統功能架構

2.2 模型訓練設計

2.2.1 數據預處理

因為群聊內的聊天有時候會出現上文不接下文的情況,此時如果直接將聊天內容原封不動地生成對話場景模型,將會使得模型上下文邏輯混亂。我們設計詞庫鏈的初衷就是為了能更好地生成對話場景。

每個回答均是上一個“問題”的“答案”和下一個回答的“問題”,“問題”和“答案”均有一個“出現頻率”的屬性,據此可以較好地模擬聊天的對話場景,生成對話模型。

2.2.2 進行tokenize(標記化)

在文本分割的步驟上,我們從傳統的詞向量[2]轉而使用了同為Transformer的BERT框架[3-4]的tokenize,能很好地應對一詞多義的問題,從而提高模型對語言的理解能力,如圖3所示。

圖3 tokenize示意圖

2.3 模型訓練

2.3.1 切分訓練集和測試集

讀取上一個步驟生成的預處理數據,將它們按照一定比例劃分為訓練集和測試集。

2.3.2 讀取預訓練模型

群聊語料集對于訓練一個模型來說還不夠龐大,所以本文使用GPT-2 預訓練模型[5-6]來訓練我們的模型。

2.3.3 自回歸訓練

在強大的GPT-2 模型基礎上,我們采用自回歸訓練方式,讓模型輸出能更加符合語料集的聊天場景,加強連續聊天能力,如圖4所示。

圖4 自回歸概念圖

2.4 訓練結束指標

2.4.1 模型訓練指標(loss)計算

在每一批次的訓練中,通過前向傳播計算出模型的預測輸出和實際輸出,使用反向傳播算法計算出損失函數值(loss)以及對應訓練模型參數的梯度,同時進行梯度裁剪[7],防止發生梯度爆炸,進行一定次數的梯度積累后,根據梯度下降算法,更新模型的參數,完成一輪訓練。

2.4.2 生成困惑度最低模型(Perplexity)

困惑度可以被看作是一個語言模型中預測的不確定性大小的加權平均。在相同的測試數據集上,一般來說,困惑度越低,模型的性能就越好。

在一次訓練中,通過對每個批次的loss值進行加權平均就可以得到一次訓練的loss值,在測試集上使用同樣的算法得出測試loss值后,與最佳測試loss 值進行比較,低于最佳測試loss 值的將保存,在每輪訓練中不斷更新與迭代困惑度最低模型,如圖5所示。

圖5 生成困惑度最低模型邏輯

在本文的多次測試中,有時候困惑度低,模型的生成效果不一定會越好,所以最后采用loss 收斂來判斷訓練結束,loss 值穩定且不再下降則訓練完成,如圖6和圖7所示。

圖6 訓練初期loss值變化

圖7 訓練后期loss值變化

3 軟件測試

3.1 軟件操作說明

軟件操作流程如圖8所示。

圖8 軟件操作流程

圖9 功能列表

3.2 軟件流程測試

首先進行收集系統測試,添加群聊“add learning”,開始記錄“learning”,如圖10 所示,收集一段時間后得足量數據,進行數據預處理,如圖11所示。

圖10 收集系統測試

圖11 數據預處理測試

將生成的語料集置于訓練環境進行模型訓練,如圖12 所示,注意關注loss 值浮動幅度,等待訓練結束,如圖13 所示。訓練完成后將模型重新加載至機器人內部,如圖14所示。

圖12 模型訓練測試

圖13 訓練Loss可視化測試

圖14 訓練模型加載測試

4 結語

本文詳細介紹了一個基于深度學習的聊天機器人自動化平臺,該平臺旨在為普通用戶提供一個親民簡單的方式來構建個性化的聊天機器人,從而將這項技術更廣泛地應用于日常生活。所設計的平臺分為“收集系統”“回復系統”“訓練系統”三個模塊,三個模塊相互分離,方便用戶根據需求靈活地選擇和使用。

“收集系統”負責連接群聊,自動收集聊天記錄并生成相應的問答詞庫。經過過濾無用信息和敏感內容后,將收集到的聊天數據用于訓練語料集。而“回復系統”則負責在群聊中使用訓練好的模型或收集的詞庫進行智能回復。“訓練系統”模塊則包括數據預處理、模型訓練和模型優化等環節。

通過這一設計,本文為普通用戶提供了一個易于操作、個性化的聊天機器人搭建平臺。這不僅有利于推動人工智能技術在日常生活中的應用,還能滿足各種不同場景的需求。在未來的研究中,我們將不斷改進和優化本平臺的功能和性能,以滿足用戶不斷增長的需求,推動聊天機器人領域的發展。

猜你喜歡
模型系統
一半模型
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久精品这里只有国产中文精品| 国模在线视频一区二区三区| 欧美第一页在线| 国禁国产you女视频网站| 欧美一区二区人人喊爽| 自拍偷拍一区| 色综合天天操| 日韩午夜伦| 婷婷综合缴情亚洲五月伊| 国产欧美综合在线观看第七页| 亚洲欧美日韩另类在线一| 国产农村精品一级毛片视频| 伊人大杳蕉中文无码| 91青青草视频| 精品国产电影久久九九| 少妇高潮惨叫久久久久久| 免费在线色| 国产尤物jk自慰制服喷水| 亚洲视频色图| 久久99蜜桃精品久久久久小说| 99人妻碰碰碰久久久久禁片| 青青青国产在线播放| 亚洲日韩精品无码专区97| 呦系列视频一区二区三区| 国产日韩av在线播放| 97在线碰| 亚洲无码高清一区| 日日拍夜夜嗷嗷叫国产| 特级做a爰片毛片免费69| 在线欧美a| 国产精品露脸视频| 国产精品久久久久鬼色| 亚洲国产日韩在线成人蜜芽| 国产h视频在线观看视频| 久久国产乱子伦视频无卡顿| 亚洲欧洲国产成人综合不卡| 久久99蜜桃精品久久久久小说| 国产精品视频3p| 91精选国产大片| 国产成人AV综合久久| 国产爽爽视频| 午夜日韩久久影院| 国产视频自拍一区| 久久a毛片| 久青草国产高清在线视频| 久久精品国产精品国产一区| 精品小视频在线观看| 国产人在线成免费视频| 国产网站黄| 久久午夜夜伦鲁鲁片无码免费| 怡红院美国分院一区二区| 精品人妻一区二区三区蜜桃AⅤ| 天天操精品| 亚洲国产中文欧美在线人成大黄瓜| 国产91线观看| 欧美97欧美综合色伦图| 日韩在线2020专区| 国产精品国产三级国产专业不| vvvv98国产成人综合青青| 日韩123欧美字幕| 有专无码视频| 久久免费视频播放| 国产成人8x视频一区二区| 国产欧美日韩另类| 91精品小视频| 国产麻豆aⅴ精品无码| 久久成人免费| 中文成人在线视频| 性色一区| 精品久久久久久中文字幕女| 中文字幕亚洲另类天堂| 毛片大全免费观看| 综合久久久久久久综合网| 久久久久久久久亚洲精品| 欧美第一页在线| 国产精品免费福利久久播放| 丁香六月激情综合| 国产亚洲欧美日韩在线一区二区三区| 71pao成人国产永久免费视频| 无码福利日韩神码福利片| 亚洲天堂精品视频| 国产成人综合网|