999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Bi-LSTM 和Attention 的智能合約分類

2021-03-12 07:00:42燦,王
軟件導刊 2021年2期
關鍵詞:分類機制特征

王 燦,王 冬

(1.山東科技大學 計算機科學與工程學院,山東 青島 266590;2.山東省滕東生建煤礦,山東 滕州 277522)

0 引言

區塊鏈技術不斷突破,應用也越來越廣泛,尤其是布置在區塊鏈上的智能合約分類呈指數級增長[1]。智能合約白皮書的出現,預示其在數據共享、物聯網供應鏈、金融貿易等方面運用十分廣泛,是走在前沿的技術。目前存有最多智能合約應用的平臺是Ethereum,該平臺每月都會發布智能合約,其數量已經達到10 萬個[2]。雖然區塊鏈用戶數目還不是很多,分布也不廣,但未來區塊鏈用戶會像現在擁有數據流量用戶一樣涌來,其帶來的各種復雜疑難問題需要及時解決。因此,設計出滿足智能合約的自動分類模型非常必要。

針對智能合約的自動分類模型研究很多。智能合約分類首先要建立一個模型,這個模型要以文本分類為中心。目前研究智能合約分類著作較少,尤其是源代碼與用戶信息方面的研究內容很少。

在研究文獻中發現,分類算法模型[3]用到文本分類中,如支持向量機SVM[4-5]、決策樹[6]、樸素貝葉斯算法[7]等可提高文本分類的實用價值。在文本分類算法中,傳統機器學習在進行文本分類時需要進行特征工程[8]。黃步添等[9]首次將智能合約源代碼與交易信息結合,在詞嵌入模型中提取出文本特征。長短期記憶(Long Short-Term Memory,LSTM)[10]網絡生成全局向量。為將向量輸入到前饋神經網絡中,需要通過Softmax 層輸出分類結果,但這并沒有解決RNN[11]的梯度問題,同時計算量大,耗費時間。Kim[12]提出卷積神經網絡(Convolutional Neural Network,CNN)模型,這種模型基于一種雙通道輸入原理,將超參調節和靜態向量作為輸入通道,由此提取出不同特征,最后將不同長度的句子通過向量表示。CNN 模型具備捕獲時間和空間的局部相關性,以及通過匯聚提取更高層次關聯的能力,有助于實現從連續的上下文窗口句子進行建模。但是模型完成工作量及占用內存大,效率較低。文獻[13]提出W2V-SVM 模型,基于Word2Vec 方法訓練詞集合,再通過高斯核支持向量機結合One vs All 算法實現特征分類。這種模型內存占用不大,但準確率不高。文獻[14]提出將CNN 和LSTM 相結合的算法模型。該模型通過CNN 實現高層特征提取,采用LSTM 按照依存關系進行分類,可在短時間內快速捕獲到集合特征,但前期的特征提取工作效率還有待改進。

LSTM[15-16]模型優點在于能捕獲較長距離的依賴關系,并在訓練過程中就能篩選出不重要的信息將其遺忘,缺陷是不能捕獲從后到前的語義信息,影響智能合約分類的準確性。因此,可利用LSTM 捕獲有選擇性的記憶或遺忘部分不重要的信息,進而實現穩定性與高效率。本文提出的結合注意力的Bi-LSTM 模型能有效解決以上模型存在的不足。該模型主要通過Bi-LSTM 人工智能算法結合注意力機制,快速對智能合約進行有效信息[17]的捕獲和提取,智能捕獲關鍵特征,從而提高智能合約分類的效率和準確度。

1 智能合約自動分類模型

模型Bi-LSTM 框架如圖1 所示,包括詞嵌入層、Bi-LSTM 層、層級注意力機制、Softmax 層、句表示層、連接層。智能合約特征信息需要最大程度地提取,這樣有助于提高智能合約分類功能,優化效果。本文基于源代碼和用戶信息建模。由于源代碼涉及到代碼語義特征,而用戶信息涉及到賬戶特征,因此需要學習兩大特征,關注其之間的聯系,還要在詞層面和句層面引入注意力機制,捕獲到有重要意義的句子和單詞。最后通過Softmax 層完成分類任務,將兩大特征生成智能合約。智能合約自動分類模型需要運用詞嵌入層、Bi-LSTM、層級注意力機制、Softmax 層結構進行仿真模擬。

1.1 詞嵌入層

在詞嵌入層中,源代碼特征和賬戶信息特征要以單詞為單位分割,分割之后還要轉化為向量表示。給定一個智能合約D,包含源代碼C 和賬戶信息A,利用模型Word2Vec 將單詞S 中的W1反映到二維向量空間,通過下式生成詞向量表示:

得到的詞向量結果直接包含了語義特征,在詞嵌入層中完成。

Fig.1 Intelligent contract automatic classification model圖1 智能合約自動分類模型

1.2 Bi-LSTM 層

Bi-LSTM 在處理單詞排序問題時,會運用一個轉換函數實現排序長度,以遞歸方式將一個轉換函數f 應用到內部隱藏狀態向量ht,隱藏ht在t 時刻與當前輸入向量et以及前一隱藏狀態ht-1之間的關系。

Bi-LSTM 層由各種各樣的LSTM 單元組成,每個單元都包含一個記憶單元ct和3 個門控制器,分別是輸入門it、輸出門t0和遺忘門ft。對給定的輸入向量et,可計算上一單元的隱藏狀態ht-1、上一單元的記憶狀態ct-1以及當前單元的隱藏狀態輸出th。

1.3 層級注意力機制

在測試源代碼和賬戶信息的智能合約分類中發現,如果引入層級注意力機制會大大提高捕獲關鍵信息的準確性,這樣有助于智能合約分類的準確性,加強其穩定性。不同單詞對智能合約的貢獻程度不同,比如說一個取名為“Maker's”的變量和函數中,其分類預測作用要比其它變量和函數更大,因此需要引入層級注意力機制以提高智能合約分類的正確性。引入了注意力機制的模型在訓練完成后的測試時間會更短,原因在于注意力機制能更快速地提取文本中的關鍵特征,加速合約分類,有效把握關鍵特征,提高分類準確性。

1.4 Softmax 層

在得到智能合約全局特征表示后,將d 作為最終輸入到Softmax 分類器的分類特征。首先將d 反饋到線性層中,將其投影到目標分類Q 中。

2 實驗設置

2.1 數據集

本文從3 個不同的區塊鏈平臺收集總共35 101 個經過驗證的智能合約,并利用網站提供的API 獲取相關智能合約賬戶信息。根據文獻[14]可知智能合約在7 個領域運用廣泛,分別是娛樂(音樂、視頻、游戲、社交)、工具、信息管理、金融(保險、融資、投資、貨幣等)、彩票、物聯網、其它。為驗證Bi-LSTM 的有效性,通過這7 個方面依次進行模型測試,從而得到速度數據,以此判斷模型是否全面有效,對比實驗數量按金融、娛樂、工具、彩票、信息管理、其它、物聯網從大到小排列。

2.2 評價指標

與分類問題常用指標類似,本文使用正確率(Preci?sion)、召回率(Recall)和F 值(F-score)3 個度量指標評價模型性能。

3 實驗結果與分析

基于Dataset-E、Dataset-N 和Dataset-EO 數據集,給出不同模型的實驗結果。為更有說服力地體現本文算法效果,在仿真中分別引入W2V-SVM、CNN[12]、C-LSTM[18]、W2V-LSTM[9]、ATT-CNN[19]、AT-LSTM[20]、ATT-BiLSTM[21]這7 種不同算法模型。對這些模型進行仿真,采用正確率(Precision)、召回率(Recall)和F(F-score)評估各模型的分類效果。

基于Dataset-E 的實驗結果如表1 所示。

Table 1 The experimental results based on the Dataset-E表1 基于Dataset-E 的實驗結果

基于Dataset-EO 的模型實驗結果如表2 所示。

Table 2 The experimental results based on the Dataset-EO表2 基于Dataset-EO 的實驗結果

基于Dataset-N 的模型實驗結果如表3 所示。

其中效果最明顯的是Dataset-E,其次是Dataset-EO,最后是Dataset-N。CNN 和LSTM 模型在Dataset-E 數據集上分別達到83.4% 和87.8% 的正確率,而加入注意力機制的ATT-CNN 和AT-LSTM 模型正確率分別達到88.6%和89.6%,分別提高了5.2% 和2.2%。加入注意力機制的Bi-LSTM 模型正確率在Dataset-E、Dataset-N 和Dataset-EO 數據集上分別達到89.8%、87.9% 和85.0%,比同樣條件下傳統的CNN 模型提高了6.4%、5.5% 和3.7%,此結果源于注意力機制引用。智能合約分類中引入注意力機制,使智能合約捕獲到最關鍵特征,因而效率迅速提高。

Table 3 The experimental results based on Dataset-N表3 基于Dataset-N 的實驗結果

將Bi-LSTM 模型在3 個數據集上進行對比實驗,結果如圖2、圖3 所示。

Fig.2 Precision_Recall curves of four models圖2 四種模型的Precision_Recall 曲線

Fig.3 Precision_Recall curve of three models圖3 三種模型的Precision_Recall 曲線

分析模型的Precision_Recall 曲線可更直觀地看出,加入注意力機制的長短期記憶網絡模型分類效果更好,更加合理。實驗結果表明本文提出的智能合約分類更智能地捕獲到了最關鍵特征,提高了效率和準確度。

4 結語

針對區塊鏈技術的智能合約自動分類問題,本文研究了注意力和雙向長短期記憶神經網絡,運用Bi-LSTM 神經網絡從源代碼和賬戶信息兩個角度進行分類,通過其特征表示,對智能合約語義特征進行更大程度的捕獲,最終將特征整合表示,以利于智能合約運用。在3 個數據集進行實驗,結果顯示文本模型具有更高的穩定性和完整性,收斂速度也大幅加快。同時,智能合約分類問題還需進一步研究,以實現更優的智能合約分類,達到更高效率。

猜你喜歡
分類機制特征
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
破除舊機制要分步推進
中國衛生(2015年9期)2015-11-10 03:11:12
注重機制的相互配合
中國衛生(2014年3期)2014-11-12 13:18:12
主站蜘蛛池模板: 丁香五月亚洲综合在线| 国产色婷婷| 色综合综合网| 中国一级特黄视频| 伊人久久影视| 亚洲黄网在线| 伊人久久青草青青综合| 91福利片| 国产精品欧美日本韩免费一区二区三区不卡 | 毛片网站观看| 国产欧美日韩va| 欧美日韩资源| 日韩欧美中文| 亚洲开心婷婷中文字幕| www精品久久| 999精品视频在线| 国产青青操| 日韩在线2020专区| 免费激情网站| 亚洲欧美一区二区三区图片| 尤物特级无码毛片免费| 免费在线色| 日韩精品欧美国产在线| 亚洲无码A视频在线| 国产高清又黄又嫩的免费视频网站| 在线观看av永久| 亚洲欧洲日韩综合| 欧美日韩免费| 色哟哟国产成人精品| 国产三级毛片| 一级毛片在线播放免费观看| 国产成人av一区二区三区| 亚洲VA中文字幕| 国产成人超碰无码| 国产网友愉拍精品| 55夜色66夜色国产精品视频| 国产日韩av在线播放| 国产精品所毛片视频| 日本一本在线视频| 伊人成人在线| 久久久精品国产亚洲AV日韩| 思思热精品在线8| 欧美va亚洲va香蕉在线| 幺女国产一级毛片| 久草热视频在线| 日韩精品欧美国产在线| 久久久国产精品无码专区| 精品色综合| 一边摸一边做爽的视频17国产| 熟女日韩精品2区| 自慰高潮喷白浆在线观看| 在线国产毛片| 伊人久久大香线蕉aⅴ色| 国产精品久久自在自线观看| 亚洲v日韩v欧美在线观看| 亚洲天堂网站在线| 欧美区一区| 国产伦片中文免费观看| 亚洲免费福利视频| 97人妻精品专区久久久久| 欧美人人干| 亚洲精品综合一二三区在线| 人妻少妇乱子伦精品无码专区毛片| 国产精彩视频在线观看| 波多野结衣AV无码久久一区| 亚洲国产精品VA在线看黑人| 免费A∨中文乱码专区| 高清无码手机在线观看| 国产SUV精品一区二区6| 国产在线视频福利资源站| 国产麻豆精品久久一二三| 久久国产V一级毛多内射| 九色视频线上播放| 日韩精品毛片| 日韩经典精品无码一区二区| 国产日韩精品一区在线不卡| 制服无码网站| 狠狠躁天天躁夜夜躁婷婷| 亚洲另类第一页| 国产一区在线观看无码| 亚洲另类色| 毛片a级毛片免费观看免下载|