999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BERT文本分類模型的APP隱私政策完整性評價研究

2023-03-01 01:33:06吳子帥韋秉東
現代情報 2023年3期
關鍵詞:分類文本內容

朱 侯 吳子帥 韋秉東

(中山大學信息管理學院,廣東 廣州 510006)

信息技術在人們的生活中逐漸滲透,與人們日常生活緊密融為難以分割的整體。然而,大多數用戶并不太關心工具、設備背后的技術細節,尤其是當前日漸普遍的大數據技術與個性化服務,使得人們在互聯網上留下的每一步足跡都為個人信息的泄露埋下隱患。生活的便利可能同時伴隨著個人隱私的犧牲。在第44次《中國互聯網絡發展狀況統計報告》[1]對2019年上半年網絡安全問題的統計中,有24%是個人信息泄露問題?;ヂ摼W時代隱私泄露事件多發的一大原因在于,APP平臺方常以個性化推薦或提供服務為由,過度收集和利用用戶的隱私信息,大大增加了其被泄露的可能;更有甚者直接非法倒賣用戶隱私信息以謀利。隱私政策的出現則是對平臺保護用戶隱私的一個規則限制,是平臺對用戶信息合法收集和利用等處理行為的宣告。用戶隱私政策既是政府對互聯網企業發展的限制與規范,更是互聯網企業與用戶之間關于信息使用的契約。

隱私政策是用戶隱私保護的一道防線。但是,由于隱私政策篇幅較長,用戶常常不會仔細查看隱私政策,對其是否符合法律法規要求不夠在意。一些企業可能利用這點,使用冗長的隱私政策提高用戶的閱讀成本。這樣用戶在可能出現的法律糾紛中就會落于下風。因此,平臺對用戶個人隱私的保護,首先就體現在對平臺制定的隱私政策是否合乎法規,是否囊括應說明的內容,以及是否予以落實。

APP隱私政策是平臺方對用戶隱私信息處理舉措的明細直觀體現,判斷隱私政策文本內容是否闡明完整則是評判APP隱私政策是否合法的方向之一。通過對隱私政策的自動分類對隱私政策進行評價,能夠為用戶選擇對隱私保護更具力度的平臺提供輔助,也可以讓監管人員和機構更快速地了解該隱私政策是否囊括了法律規定應在隱私政策中包含的內容,減輕工作人員負擔。當前并沒有通用的APP隱私政策完整性評判標準,但我國《信息安全技術 個人信息安全規范》[50]和歐盟《通用數據保護條例》[49](General Data Protection Regulation,GDPR)等法律條例都對隱私政策中應包含的內容給出了相關規定,可以認為更完整和廣泛地覆蓋這些法律條例要求的隱私政策有著更高的完整性[48]。因此,本文引入融合上下文語義的文本分類方法,以相關法規中要求的隱私使用或保護措施為標簽,對隱私政策文本進行自動分類檢測,并根據分類結果利用L2歸一化[54]的方法計算得到隱私政策的完整性得分,對不同APP隱私政策進行量化比較分析,以期規避傳統隱私政策評價方法的主觀性和局限性,推動隱私政策評價研究向自動化和智能化方向發展。

1 相關研究

1.1 隱私保護總體研究現狀

隱私泄露是近幾年社會關注的熱點問題,不少學者都針對提升國內用戶隱私保護水平的方向進行探索研究。陸雪梅等[2]在通過典型案例、統計分析和系統分析等手段分析用戶隱私信息泄露的成因后,提出若要保護用戶隱私,則需要政府方對隱私保護進行立法,且企業方需從技術層面上加強前沿信息技術的應用,建立行業自律規范等。徐藝心[3]詳細分析了互聯網生態環境的特點以及可能會對用戶隱私保護造成的影響,提出了用戶隱私保護的制度模式,除了政府需要監管平臺外,也需要明確平臺方在保護用戶隱私信息上的義務與責任。謝珍等[4]提出,用戶畫像的建設必定需要用戶數據,但平臺方必須要從安全性、匿名性、用戶同意、服務內容與數據提供對等四大原則來平衡數據應用與隱私保護之間的平衡方案,確保用戶的信息安全。以往研究中提出的優化隱私保護建議常與推動完善隱私保護政策內容和措施相關,用戶隱私信息的安全性離不開法律規范和平臺方對隱私的保護。

1.2 隱私政策與隱私條款相關研究

用戶隱私信息的安全性離不開法律規范和平臺方對隱私的保護,而隱私政策是運營商和用戶就隱私收集和保護問題達成一致的重要契約。李卓卓等[5]利用內容分析法調研我國APP隱私政策中保護用戶隱私信息的實際表現,發現APP運營平臺方在數據利用相關內容上的說明存在漏洞,如部分APP未告知平臺方將如何進行隱私數據處理,對信息的使用是否存在風險,未聲明具體權限等。陸康等[6]建議圖書館應以法律規范為標準,構建符合圖書館發展方向的隱私條款,制定具有行業特色的隱私保護制度。徐磊等[7]以圖書類APP隱私政策為研究對象,認為當前隱私政策存在重點不明、規定模糊等問題,認為可以通過提升用戶在修訂隱私政策過程中的參與度,夯實隱私政策法律基礎等方法,提高隱私政策質量。郭清玥等[8]采用文獻調研法、內容分析法和LDA主題建模法,收集約200款APP隱私政策文本進行分析,獲得國內常用APP隱私政策的通用內容框架,在經過與國內外法律政策文件的對比后,認為國內APP隱私政策在個人信息主體權利和個人信息安全保護體系等方面內容的介紹還有所欠缺,提出對我國APP隱私政策內容框架的優化方向。當前APP隱私政策的內容可能存在一定安全隱患,而隱私政策需要做到合理、合規、合法才能實質性保護用戶隱私信息。

當前部分隱私政策研究聚焦在不同隱私政策的對比方面,比如:不同國家(地區)隱私政策的對比、不同網站隱私政策的對比和不同APP隱私政策的對比。有的學者選擇的是分類型收集不同平臺的隱私政策進行對比[9-11];有的學者則會專注某一領域的平臺,如圖書館與檔案[12-14]、電商[15-17]、政府平臺[18-21]和健康領域。不同領域內又有不同功能平臺主題的具體細分,比如在健康類APP方向,馬騁宇等選擇的主題是不細分功能的多種健康類APP[22],O’Loughlin K等則專注于心理抑郁類的健康APP[23],而Benjumea J等選擇了健康APP中的癌癥類APP作為研究對象,從歐盟的GDPR法規(通用數據保護條例)出發,改進了隱私政策評價量表[24]。

1.3 隱私政策完整合法性相關研究

優化隱私政策是提升用戶隱私保護力度的重要建議方向,國內外學者常將隱私政策的完整性作為評估隱私政策是否符合法律規范的一大落腳點。國內外對隱私政策完整性的評價研究常使用內容分析、層次分析、文本編碼[25]等方法來觀察平臺的隱私政策有沒有涉及法律條款規定應當涉及的方面,并根據隱私政策中提到的對法律法規的遵守情況給出分數評價。常見的完整性評價體系包含個人信息收集、個人信息使用、Cookie技術、信息披露條件、數據保護、用戶權利、未成年人隱私保護等幾個方面[26]。朱穎還對APP是否有專門隱私政策、隱私保護政策名稱規范性、獲取隱私政策的便捷性、用戶接受政策的權利性、更新時間的標注和企業是否提供聯系方式6種表現進行了分析[27]。徐雷等使用內容分析法,評價國內熱門APP隱私條款的獲取途徑、可讀性和文本內容,既統計了APP在不同內容類別表述上的整體表現,也從70余款APP中選取了表現突出的幾款進行具體說明[28]。

除了通過完整性來對隱私政策的合法性進行評價的常規分析,一些學者另辟蹊徑,使用其他方法來評估隱私政策。Mamakou X J等[29]關注的是如何評估網站遵守法律和道德準則的情況,提出了基于模糊數理論和模糊德爾菲法的法律合規指數FLECI,對100個網站的合規程度進行了評分。Reidenberg J R等[30]專注于評價隱私政策的語義模糊性,他以隱私政策文本中的“May”“Will”“Generally”等詞作為模糊語義的標志,對網站隱私政策的模糊性進行打分。邵國松等[31]除了從隱私政策的發布、個人信息收集的目的、信息保密性與安全保障、刪除權與更正權以及隱私政策的可見性5個角度對隱私政策進行完整性審核以外,還用技術手段監測敏感信息類網站使用的追蹤Cookies、數據安全漏洞和侵入數據庫的可能性,來檢測這些網站是否兌現了隱私政策中所做的規定。姚勝譯等[32]從用戶視角來考慮對隱私政策的評價,認為隱私政策的友好度能夠提高用戶的閱讀意愿,從內容可讀性和交互友好性來構建APP隱私政策用戶友好度評價指標,在選取樣本后,運用問卷調查法和層次分析法進行評價分析,并對我國APP隱私政策的編寫提出優化建議。

1.4 使用自然語言技術的隱私政策研究

為實現對隱私政策自動分析和評估,一些學者借助自然語言處理技術對隱私政策進行研究,例如隱私政策自動摘要提取[33]、建立隱私政策本體[34]、針對隱私政策的語義框架[35]、隱私政策的自動生成36]等。其中,基于文本分類技術是實現隱私政策完整性評價的重要方向。Liu F等[37]使用隱馬爾可夫模型,試圖對解決相同隱私問題的段落進行識別與分類。Boldt M等[38]選用15種分類算法,對合法公司與違法公司的隱私政策進行分類,其中樸素貝葉斯算法的表現最好,研究發現,違法公司的隱私政策覆蓋面比合法公司要低很多。Wilson S等[39]基于網站隱私政策的OPP115語料庫,應用邏輯回歸的文本分類方法,實驗首先將注釋進行粗分類,再對每個粗粒度類別訓練二元邏輯回歸分類器,實現了粗粒度與細粒度結合的文本分類方法。Zimmeck S等[40]基于GDPR框架構建了移動APP的隱私政策語料庫App-350,并在此基礎上訓練模型對大量Google應用商店的APP進行了測評。

已有研究表明,隱私政策作為平臺使用和保護用戶個人信息的重要契約,其完整性、合法性及其評價問題已經受到學界的廣泛關注。但已有研究大多基于內容分析、質性分析、調查研究等方法對其完整性、模糊性和合法性等進行評價。為推動隱私政策自動化評價,國外部分學者通過自然語言處理技術對隱私政策進行挖掘分析,但主要基于GDPR等法律框架和OPP115等國外隱私政策語料庫進行研究,缺乏對國內隱私保護法律框架的研究和中文隱私政策文本的自動評價。

2 實驗設計

隱私政策完整合規的前提是其符合且滿足相關法規的要求。目前,歐盟GDRR、美國《聯邦貿易委員會法》[51](FTC Act)和日本《個人信息保護法》[52]等各國(地區)法律法規均對個人信息的保護和使用方式給出了相應規定。我國信息安全標準化技術委員會制定的《信息安全技術 個人信息安全規范》(GB/T 35273-2020)(以下簡稱《規范》)也規定了個人信息的收集、存儲和使用等活動應遵循的原則和安全要求,并規定了互聯網制定和應用隱私政策的方式,即隱私政策應清晰完整地羅列出互聯網企業平臺方將如何處理用戶個人信息,并給出了隱私政策編寫范本與要求,是目前我國針對維護互聯網個人信息安全最權威的規定。

針對APP隱私政策的完整性,本研究首先根據《規范》的隱私政策要求,考慮信息的流轉生命周期[53],結合隱私政策主要內容,提煉出信息收集、信息保存、信息使用和用戶權利4個大類和12個隱私文本分類類別,作為隱私政策文本數據集標注的標簽,如圖1所示。隨后利用神經網絡構造APP隱私政策分類模型對其進行分類實驗,實現隱私政策條款的自動分類識別,并在對分類結果進行評估后,利用L2歸一化對待測試APP的完整性得分進行量化計算。

圖1 隱私政策完整性內容框架

2.1 文本分類實驗設計

分類實驗流程分為3個步驟:首先,收集并標注APP隱私政策,作為實驗輸入數據集;其次,分別構建一次性多分類法和雙層級聯分類法,用多個模型對隱私文本數據集進行訓練與預測分類;最后,比對分類結果,選出效果最佳的分類模型,作為隱私政策自動分類評價的實證工具。

在模型選擇上,一次性多分類法和雙層級聯分類法都采用了word2vec[42]和Bert[41]兩種融合了語義的文本表示模型,并組合CNN[43]、LSTM[44]和BiLSTM[45]3種深度神經網絡分類模型,進行隱私政策分類。Word2vec模型是谷歌開源的詞向量工具,是一種淺層神經網絡模型,其利用詞語的上下文使得向量表示的語義含義更加豐富。其基本原理如圖2所示。

圖2 Word2vec算法原理

Bert是谷歌在大量文本資料上訓練起來的預訓練模型,其核心編碼器層是由多層Transformers編碼器組成的,如圖3所示。由于在直接用于下游任務前已經獲得了對大量自然語言的了解,Bert模型進行訓練時僅需要對其參數進行微調,再添加上輸出層,就已經可以獲得比以往傳統模型更好的結果。使用Bert模型可以直接獲得文本分類結果,也可以作為詞嵌入層獲取高維詞向量。

圖3 Bert模型結構

CNN文本分類模型包含輸入層、卷積層、池化層、全連接層和Softmax輸出層。

長短時神經記憶網絡(LSTM)和雙向長短記憶網絡(BiLSTM)可以將上一時刻的輸出信息和當前數據的輸入作為當前時刻的輸入信息,經過處理,將當前時刻的輸出信息再作為下一時刻的輸入信息,達成選擇性地記憶或遺忘信息的目的。

如圖4所示,一次性分類法分別使用Word2vec和Bert對隱私政策文本進行向量化表示,并后接3種分類模型進行隱私政策文本一次性十二分類。需要指出,Bert模型既可以作為文本表示方法輸出多維詞向量,也可以單獨作為文本分類方法實現多分類。

圖4 一次性多分類法

如圖5所示,雙層級聯分類法同樣分別采用Word2vec和Bert作為文本向量表示方法,依托于可分成兩層樹狀結構的數據集,首層先將文本分為差異明顯的大類別,第二層中再將每個大類別下都細分小類。在模型設計中,先對首層的大類別實現文本粗分類,再對每個大類別下的細分類分別訓練小分類器,最終獲得文本多分類的結果。

圖5 級聯多分類法

2.2 隱私政策完整性評價方法設計

《規范》中提煉出的隱私政策內容框架代表著一篇完整的隱私政策應當包含的內容,完整合規的隱私政策應當在覆蓋《規范》要求的同時,盡可能詳細地陳述對用戶各項隱私信息收集和使用的方式,即各個分類標簽下條款數目相對較多的隱私政策完整性更高。因此,本文將隱私政策完整性的評價量化為不同內容類別數量的比較,即從不同APP隱私政策內容出發,將隱私政策文本各個類別的文本內容相對含量作為APP隱私政策評價的判斷依據。研究利用L2范式歸一化(式(1))的思想,將對應APP類型中不同標簽的APP的隱私條款數進行歸一化處理后映射到(0,10)區間內并求和,得到APP隱私政策完整性得分。

(1)

式中,xi,j表示同一分類下APPi(如18*郵箱)在隱私類別j(如未成年人信息)下的隱私政策條數;Scorei表示APPi最終的完整性得分。

3 隱私政策文本分類實驗

3.1 數據采集、標注與預處理

本文計劃選擇艾瑞數據APP應用獨立設備排行榜下與用戶隱私強相關的8種類別中排名前列的APP,如表1所示,采用人工錄入的方式對隱私政策條款進行采集,共收集得到80個APP隱私政策的14 000余條政策條款。

表1 實驗收集隱私政策文本來源APP

在根據圖1隱私政策完整性內容框架中的12種類別和4種大類作為分類標簽,對采集到的APP隱私條款進行人工標注和格式處理后,共獲得約14 000條無重復有標簽文本作為初始數據集,如表2所示。

考慮到數據不平衡的問題,在進行過采樣處理后得到了以下包括約30 000條帶標簽隱私政策條款的數據集,如表2所示。

對數據集的格式與分布進行基本處理后,為了進行詞嵌入,還需要對數據集進行文本預處理。由于Bert模型自帶文本預處理的特性,輸入Bert的數據集不需要預先進行太多調整。但Word2vec模型仍需要通過NLTK工具包[47]進行去停用詞、標注詞性和分詞3個預處理步驟,才能獲得用于分類訓練的詞向量。

3.2 隱私政策文本分類模型效果對比分析

實驗采用Python語言,主要使用Keras[46]深度學習框架,將預處理后的文本數據分別輸入一次性多分類模型和雙層級聯分類模型進行訓練。在對模型結構和參數進行多輪優化調整后,得到不同模型的分類結果如表3、表4所示。

表3 一次性多分類法模型最佳結果

表4 雙層級聯分類法粗分類最佳結果

一次性多分類模型中,Bert作為文本向量表示模型的效果均優于Word2vec,此外,單獨的Bert、Bert+CNN和Bert+att+BiLSTM 3種模型均能取得較高得分。

如表4所示,在級聯分類的第一層粗分類中,Bert的準確率和F1值均最高,因此將Bert模型作為細分類文本向量表示的基礎。

基于粗分類的最佳模型結果,在細分類中,選擇CNN、LSTM和BiLSTM 3個模型來承接Bert模型輸出的向量,對4個粗分類下的子類別分別訓練小分類器。最終細分類的準確率與F1值由4個小分類器按類別權重合并計算得出,如表5、表6所示。

表5 雙層級聯分類法細分類中子分類器的最佳實驗結果

表6 雙層級聯分類法細分類最佳實驗結果

將粗分類和細分類的實驗評價指標分別相乘,即可得到級聯分類的準確率與F1值結果,如表7所示。

表7 雙層級聯分類法最佳實驗結果

可以看出,粗分類和細分類準確率均較低,粗分類的準確率最高僅有90%,除“信息使用”子分類器的分類準確率在84%左右外,其他子分類器準確率也均在90%左右。在本實驗中,無論是十二分類還是四分類,用Bert和Bert+CNN進行十二分類的實驗效果明顯比其他方法都好。在十二分類實驗中,Bert模型的準確率比Bert+CNN稍低,但F1值比Bert+CNN略高。一次性進行十二多分類的實驗的效果遠好于雙層級聯分類,推測其原因是數據集標注質量的限制,導致首層粗分類的準確率不及預期,對接下來的模型銜接產生了較大的負面影響?;谏衔闹刑岬降臏蚀_率可能存在的弊端,并且以四分類中Bert的準確率與F1值都比Bert+CNN更高作為側面依據,認為使用Bert進行一次性十二分類是在本次實驗中效果表現最佳的隱私文本分類方法。

4 基于文本分類結果的隱私政策完整性評價

基于之前分類模型的效果,實驗將選擇使用Bert模型從8種分類中分別選擇一個對應的APP,如表8所示,用前文收集的共80個APP隱私政策文本作為訓練集,對這8個APP的隱私政策文本進行分類預測并評價其隱私政策完整性。

表8 用于評價的隱私政策文本來源APP

利用Bert對待測APP進行分類后結果如表9所示。

表9 APP隱私政策文本分類結果

4.1 隱私政策縱向對比評價

縱向對比是指分別對8個APP在其所屬APP分類中的內容含量水平對比。從標注結果推測,不

同類別的APP隱私政策表現存在較大差異,因此實驗比較同類型的APP隱私政策文本相對數量,利用式(1)計算得到待測APP的完整性得分,如表10、圖6所示。

圖6 8個APP隱私政策完整性對比

表10 8個APP隱私政策完整性得分

可以看出,與同類型的APP進行比較,轉*的隱私政策所包含的內容詳細且完整;18*郵箱和智*火車票在同類型APP中也處于領先地位,但少數內容仍有一定欠缺;隨手*表現平平,能夠對《規范》中提出的大部分隱私政策內容進行詳細描述;而蝸*睡眠、天*社區、簡*和星巴*表現很差,部分條款大量缺失,亟需補充完善隱私政策。

4.2 不同類別APP隱私政策完整性評價

本部分旨在對不同類別的APP隱私政策完整性進行比較分析。與縱向對比類似,實驗對不同類型的APP隱私政策文本數量平均值進行L2范式歸一化(式(1))后映射到(0,10)區間內并求和,得到不同類別APP隱私政策完整性得分。結果如表11、圖7所示。

圖7 不同類別APP隱私政策完整性對比

表11 各類別APP隱私政策完整性得分

可以看出,不同類型的APP在隱私政策文本的完整性評價上,呈現出不同的特點。電子商務類APP呈現領跑局面,除了對個人信息收集的描述略有不足;同樣涉及金錢的金融理財類APP則同樣在安全風險上表現十分突出;旅游出行、美食外賣、社交網絡三類APP在隱私政策內容對比中處于中游水平;健康醫療類APP僅著重介紹了信息使用方面的條款,而忽視了用戶對隱私保護與維護權益的需求;通訊聊天類APP僅在“個人信息存儲”與“參與管理權利”兩種類別上得分較高,需要進行大范圍改動優化;拍攝美化類APP的表現尤為不足,各項得分均較低,對《規范》中隱私政策范例的實踐普遍表現不佳,需要行業整體對隱私政策進行整改。

4.3 隱私政策與法律條款人工對比核驗

為了驗證基于文本分類方法完整性評價的結果,研究分別縱向對比中完整性得分最高和最低的轉*和星巴*APP隱私政策,直接對照《規范》中給出的隱私政策編寫要求進行人工復核,二次驗證分類和完整性得分計算方法的有效性。

經過人工比對,轉*的隱私政策內容基本符合要求,僅有一些細節有所遺漏,如未描述提供個人信息后可能存在的安全風險,未表明在發生個人信息安全后平臺方將承擔法律責任。此外,轉*在隱私政策中指出其隱私政策所涉及的個人信息與個人敏感信息內容參考自《規范》,與本文中的完整性評價使用了同一參考法規。對比結果與通過文本分類獲得的評價結果相符。

星巴*的隱私政策在各個內容類別都缺漏較多,隱私政策文本撰寫得比較簡單。在信息收集方面,除了未對“安全風險/負面影響”進行說明外并沒有明顯不足。在信息存儲方面,星巴*沒有詳細說明平臺方對個人信息保護的措施,未如編寫要求中所述列舉出遵循的個人信息安全協議和取得的認證,也沒有注明個人信息的存儲時間,說辭含糊不清。對于較為細節的信息安全事件發生后平臺方的擔責與對用戶的告知方式,也只字未提。在信息使用方面,星巴*未提及關于響應用戶請求的部分。雖然在隱私政策中說明了對用戶的個人信息可能會存在跨境傳送和訪問的情況,但并未按要求詳細說明需要跨境傳輸的數據類型以及將遵循的跨境規范,僅說明了會有跨境動作,未介紹詳情。在用戶權利方面,星巴*僅給出了平臺方的聯系方式,但沒有給出對出現無法輕易和解的爭端時的解決方法,如申請外部爭議解決機構審議等??傮w來看,其隱私政策的特點是僅有大框架,而重要細節模糊不清。在政策中常使用“適當”“合理”等詞匯來概括性說明,對具體情形沒有詳細列舉。體現在上文的橫向比較與縱向比較結果中,即可以看到不同類別的文本內容數量均較低,導致評分極低。星巴*隱私政策的人工比對結果同樣與基于文本分類的完整性評價得分結果基本吻合。

5 結論與展望

本文基于體現上下文語義的BERT模型應用于APP隱私政策完整性評價中,在能夠保證文本分類效果的前提下,提出準確高效的隱私政策完整性評價體系和方法。以上分析結果表明,首先,使用文本分類方法對隱私政策文本進行完整性評價,能夠得出與人工比對法律規范近似的結論,基本能夠體現出不同APP隱私政策的完整性表現,文章提出的基于BERT文本分類和L2范式歸一化的完整性得分計算方法基本有效。在8個用于隱私政策評價的APP中,隱私政策完整性的得分表現可以分為4個梯隊。不同類別APP隱私政策文本在編寫上各有特點,如電子商務類APP隱私政策的內容更為完善,但同樣與用戶財產掛鉤的金融理財類型APP在完整性上則有所差距,拍攝美化類APP則對隱私政策的編寫要求不夠重視,不能達到《規范》中的隱私政策內容標準。其次,基于BERT的文本分類模型能夠在隱私政策完整性研究中取得很好的效果,其十二分類的F1值達到0.8489,證明利用BERT模型的文本分類方法來進行隱私政策完整性評價研究有其合理性和準確性。

此外,本研究將在以下方面進一步探索。首先,實驗樣本數據量不夠大,不足以發揮預訓練模型的特點,同時CNN等傳統神經網絡需要多次Epoch訓練才能收斂,對于部分數據可能存在方差較高的問題。未來可以收集更多APP的隱私政策文本作為訓練集,讓模型能夠學習到更多隱私政策文本特征,提升模型效果。其次,分類實驗中文本粒度較大,僅對隱私政策條款進行了分類研究,體現隱私政策文本的語義特征不充分。可以通過命名實體識別和知識抽取等方法獲取隱私政策中涉及到的具體隱私保護規則和信息,進一步判斷其隱私保護力度和合法性。

猜你喜歡
分類文本內容
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
分類算一算
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數據分析中的分類討論
教你一招:數的分類
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 超碰精品无码一区二区| 欧美日韩一区二区在线播放| 91偷拍一区| 波多野结衣在线se| 久久中文字幕2021精品| 青草视频免费在线观看| 东京热一区二区三区无码视频| 国产后式a一视频| 伊人激情综合| 日韩成人午夜| 国产av剧情无码精品色午夜| 99视频精品全国免费品| 又黄又爽视频好爽视频| 中文字幕1区2区| 久久中文电影| 日本一区二区不卡视频| 国产精品尤物铁牛tv| 国产亚洲视频在线观看| 91蝌蚪视频在线观看| 国产精品爽爽va在线无码观看| 国产精品亚洲欧美日韩久久| 精品欧美日韩国产日漫一区不卡| 欧美黄网站免费观看| 国产精品黑色丝袜的老师| 国产免费一级精品视频| 亚洲一道AV无码午夜福利| 欧美精品H在线播放| 18禁影院亚洲专区| 久久婷婷国产综合尤物精品| 亚洲精品大秀视频| 制服丝袜一区二区三区在线| 亚洲天堂在线视频| 国产成人久久综合777777麻豆| 久久久久久国产精品mv| 欧美成人一级| 日韩在线视频网| 无码'专区第一页| 国产精品污视频| a亚洲视频| 一区二区三区国产| 丁香五月婷婷激情基地| 日韩在线永久免费播放| 丁香五月婷婷激情基地| 91精品在线视频观看| 午夜精品福利影院| av午夜福利一片免费看| 特级精品毛片免费观看| 国产一级在线播放| 视频一本大道香蕉久在线播放 | 欧美另类第一页| 国产精品99在线观看| 二级特黄绝大片免费视频大片| 国产精品亚洲五月天高清| 久久一本日韩精品中文字幕屁孩| 男女精品视频| 在线观看国产黄色| 啦啦啦网站在线观看a毛片| 美女无遮挡免费网站| 国产日韩欧美精品区性色| 日韩精品成人在线| 亚洲国产午夜精华无码福利| 国产在线精品99一区不卡| 久久国产精品夜色| 色婷婷亚洲十月十月色天| 中文无码毛片又爽又刺激| 99精品免费欧美成人小视频| 国产微拍精品| 谁有在线观看日韩亚洲最新视频 | 国产成人免费手机在线观看视频| 直接黄91麻豆网站| 伊人久久大香线蕉影院| 精品国产香蕉在线播出| 国产内射一区亚洲| 国产凹凸一区在线观看视频| 亚洲精选无码久久久| 亚洲综合色区在线播放2019| 自拍中文字幕| 日本91在线| 国产视频只有无码精品| 婷婷亚洲最大| 日韩A∨精品日韩精品无码| 22sihu国产精品视频影视资讯|