999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法理論探究

2020-08-08 05:50:46謝小義
科學(xué)咨詢 2020年32期
關(guān)鍵詞:模型

汪 云 曾 平 謝小義

(天門職業(yè)學(xué)院 湖北天門 431700)

引 言

隨著科學(xué)技術(shù)的不斷發(fā)展,以大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)為代表的先進(jìn)科技,逐漸在生活中產(chǎn)生了深遠(yuǎn)的影響。熱別是大數(shù)據(jù)技術(shù),能夠通過對數(shù)據(jù)的收集、存儲、計(jì)算和分析,使數(shù)據(jù)價(jià)值的意義得到充分的發(fā)揮,對生活各方面的影響越來越深遠(yuǎn)。傳統(tǒng)的大數(shù)據(jù)計(jì)算,采用的是批量計(jì)算模式;經(jīng)過不斷發(fā)展,逐漸發(fā)展為在線學(xué)習(xí)計(jì)算,其效率得到了顯著的提升,這一過程具有非常重要的現(xiàn)實(shí)意義。

一、基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法的關(guān)鍵

盡管當(dāng)前基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法已經(jīng)逐漸成熟,但是在以下三個(gè)方面還面臨著關(guān)鍵的問題。

(一)收斂性較低

對于大數(shù)據(jù)技術(shù)來說,要處理的各種流數(shù)據(jù)具有非常明顯的隨機(jī)性,但是這些隨機(jī)性的數(shù)據(jù)需要對其展開實(shí)時(shí)處理,并將結(jié)果迅速反饋出來;而且絕大多數(shù)的流數(shù)據(jù)僅僅在短時(shí)間內(nèi)有價(jià)值,因此通過大數(shù)據(jù)展開計(jì)算和分析的數(shù)據(jù),往往只有很少一些能夠保存,而絕大部分會被放棄。因此,針對此類計(jì)算,系統(tǒng)必須要具備很高的收斂速度,才能夠確保流數(shù)據(jù)的價(jià)值能夠在其有效期內(nèi)得到體現(xiàn)[1]。但是當(dāng)前的在線學(xué)習(xí)算法,盡管與傳統(tǒng)的批量學(xué)習(xí)計(jì)算相比,其效率已經(jīng)有了大幅提升,但是其收斂性卻明顯不足,在分析實(shí)時(shí)流數(shù)據(jù)方面依然需要持續(xù)改進(jìn)。

(二)可擴(kuò)展性較低

大數(shù)據(jù)要處理的流數(shù)據(jù)是一個(gè)非常龐大的數(shù)據(jù)量,而且在數(shù)據(jù)源不停止的情況下,數(shù)據(jù)會持續(xù)生成,因此這樣的數(shù)據(jù)的數(shù)量是難以量化的;同時(shí),系統(tǒng)在針對流數(shù)據(jù)實(shí)施計(jì)算分析的過程中,由于具有無限多的龐大數(shù)據(jù),所以是無法通過硬盤予以存儲的,因此這樣必然會造成流數(shù)據(jù)管理難度非常高。采用在線學(xué)習(xí)算法,也無需儲存流數(shù)據(jù),而是僅僅就內(nèi)存中數(shù)據(jù)實(shí)施計(jì)算,這就意味著其擴(kuò)展性相對較低,這對于在線算法的性能來說也是一種嚴(yán)重的制約。

(三)自動化工具較少

基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法,往往需要在這個(gè)過程中對一些格式實(shí)施轉(zhuǎn)化,對相關(guān)參數(shù)實(shí)施優(yōu)化,然后才能夠更好地滿足計(jì)算目標(biāo),獲得良好的滿意度。在傳統(tǒng)的批量計(jì)算模式下,因?yàn)檫@是一種靜態(tài)訓(xùn)練的分析模式,所以出現(xiàn)了一些自動化工具,并且經(jīng)過發(fā)展已經(jīng)非常成熟,諸如Libsvm工具,這為批量計(jì)算模式提供了諸多便利[2]。然而,隨著在線學(xué)習(xí)算法的出現(xiàn),計(jì)算遇到的難度更大。既因?yàn)閿?shù)據(jù)產(chǎn)生速度過快,又由于數(shù)據(jù)的生成量過大,而且要實(shí)現(xiàn)動態(tài)訓(xùn)練,所以使得傳統(tǒng)的工具都無法適用。因此,適合于在線學(xué)習(xí)算法的自動化工具非常匱乏,這在一定程度上限制了在線學(xué)習(xí)算法的應(yīng)用。

二、幾種基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法

(一)在線學(xué)習(xí)的線性模型

1.感知器的在線學(xué)習(xí)算法

在當(dāng)前大數(shù)據(jù)分析為基礎(chǔ)的在線學(xué)習(xí)算法中,產(chǎn)生了多種不同的算法,然而就應(yīng)用范圍來看,感知器的應(yīng)用是最為廣泛的一種。這是一種屬于機(jī)器學(xué)習(xí)仿生學(xué)領(lǐng)域的分類學(xué)習(xí)機(jī)的模型,其算法具有較高的復(fù)雜度,在當(dāng)前機(jī)器算法領(lǐng)域中有著非常廣泛的應(yīng)用。其主要算法原則為[3]:在正確分類的前提下,無需對其權(quán)重實(shí)施變化,因此對其實(shí)施“賞”;在錯(cuò)誤分類的前提下,則應(yīng)當(dāng)對其發(fā)生的錯(cuò)誤予以修正,就是調(diào)整其方向,因此應(yīng)當(dāng)針對其權(quán)重實(shí)施“罰”。然后,針對全部錯(cuò)誤分類樣本,以求和方式實(shí)施懲罰,具體可依據(jù)如下的算法公式:

從在線學(xué)習(xí)算法的分類上來看,感知器算法本質(zhì)上是一種賞罰算法。該算法被廣泛應(yīng)用于線性可分問題的解決;而且作為一種相對比較基礎(chǔ)的在線學(xué)習(xí)算法,感知器算法的出現(xiàn),對于推動及其學(xué)習(xí)具有非常重要的意義。另外,隨著感知器算法的不斷發(fā)展,出現(xiàn)了一種更具收斂性的二階感知器,這是一種可以持續(xù)對公式實(shí)施更新的計(jì)算方法,未來應(yīng)該有更廣泛的應(yīng)用前景。

2.在線學(xué)習(xí)中被動—主動算法

這是一種能夠主動得出全局最優(yōu)解,并且以此為基礎(chǔ)對其展開驗(yàn)證并能夠確保其實(shí)現(xiàn)的算法模型。這種算法的本質(zhì)思維,就是在一個(gè)樣本的支持向量機(jī)的基礎(chǔ)設(shè)想,從而使得向量機(jī)最大間隔約束得以有效的轉(zhuǎn)化。此外,該算法的更新采用了如下的機(jī)制,當(dāng)新數(shù)據(jù)出現(xiàn)錯(cuò)誤,則會對算法實(shí)施更新,以最大程度的避免數(shù)據(jù)錯(cuò)誤;當(dāng)新數(shù)據(jù)無錯(cuò)誤,則算法繼續(xù)使用無更新。

3.在線稀疏解學(xué)習(xí)算法

該算法的根本原理是以批量整體訓(xùn)練為基礎(chǔ)以得到邊界最優(yōu)值。然而,因?yàn)樵诰€學(xué)習(xí)算法都是以隨機(jī)梯度下降法作為訓(xùn)練方法的,所以在實(shí)際應(yīng)用中結(jié)果的稀疏性是非常難以保障的,而通過梯度截取法,則能夠在一定程度上得到有效稀疏解。通常是在過程中,把更新權(quán)重都以0賦值,這樣就能夠讓出現(xiàn)的特征數(shù)目進(jìn)一步增加,從而表現(xiàn)出稀疏權(quán)重向量。與隨機(jī)梯度下降法相比,梯度截取法注意更能夠保障算法的性能[4]。

(二)在線學(xué)習(xí)的非線性模型

在了解了在線模型的線性模型以后,我們對非線性模型也做一些簡單的介紹。當(dāng)前,主要的非線性模型有如下的四種方法。第一種是核感知器,這種方法本質(zhì)上是線性模型中感知器算法的一種升級和發(fā)展,是一種基于核函數(shù)思想而產(chǎn)生的算法,使得其算法分類能力得到了非常明顯的提升。第二種是核在線被動—主動算法,這同樣是一種基于核函數(shù)產(chǎn)生的算法,該算法在批量向量機(jī)處理方面顯示了非常強(qiáng)大的能力,然而迄今為止尚未大規(guī)模針對實(shí)用數(shù)據(jù)訓(xùn)練,因此實(shí)際應(yīng)用中還不廣泛。第三種是固定的緩沖器核在線學(xué)習(xí)算法,這是一種通過對隨機(jī)感知器分類錯(cuò)誤的集合的判斷,當(dāng)集合狀態(tài)充分飽和,則以一個(gè)新的將次樣本替換,以確保數(shù)據(jù)盡可能保持一定穩(wěn)定性。第四種是核在線梯度下降法,這種方法目前也尚未大范圍推廣應(yīng)用。

(三)非傳統(tǒng)的在線學(xué)習(xí)算法

除了上面介紹的各種在線學(xué)習(xí)算法以外,還有一些非傳統(tǒng)在線學(xué)習(xí)算法,其中最為典型的有兩種,一種是多任務(wù)在線學(xué)習(xí),另一種是組LASSO在線學(xué)習(xí)。前者主要是基于共享信息的前提下實(shí)施若干關(guān)聯(lián)任務(wù)的同時(shí)學(xué)習(xí),因此其效率相對于常規(guī)學(xué)習(xí)方法來說要明顯更高。后者的主要優(yōu)勢是使用非常便捷,復(fù)雜程度相對較低,因此其在學(xué)習(xí)目標(biāo)變量選擇方面有較為廣泛的應(yīng)用。

三、基于大數(shù)據(jù)分析的在線學(xué)習(xí)算法的發(fā)展趨勢

(一)學(xué)習(xí)的泛化能力與可理解性的強(qiáng)化

當(dāng)前大數(shù)據(jù)領(lǐng)域的研究日新月異,在這樣的發(fā)展速度下,我們有理由相信,在未來的發(fā)展中,在線學(xué)習(xí)算法必然會遇到各種各樣的極具挑戰(zhàn)性的問題,而克服這些挑戰(zhàn)性問題就是推動技術(shù)持續(xù)發(fā)展的動力。其中,提升學(xué)習(xí)泛化能力是在線學(xué)習(xí)算法的發(fā)展中遇到的一大難題之一,而這也是當(dāng)前在應(yīng)用領(lǐng)域?qū)τ趯W(xué)習(xí)算法的最大的期待。就當(dāng)前學(xué)習(xí)理論的發(fā)展?fàn)顩r來看,向量機(jī)泛化能力技術(shù),基本上都涵蓋了從理論到實(shí)踐的全方面。并且,在很多領(lǐng)域中,可理解性對于學(xué)習(xí)算法同樣具有至關(guān)重要的意義。

(二)學(xué)習(xí)速度與應(yīng)用能力的提升

在社會的實(shí)踐領(lǐng)域,將各種機(jī)器學(xué)習(xí)方法融入其中,從而在提升社會事務(wù)效率的同時(shí),也使得機(jī)器學(xué)習(xí)速度得到進(jìn)一步提升,這是在大數(shù)據(jù)理論不斷發(fā)展以后研究人員追逐的目標(biāo)。然而,在學(xué)習(xí)速度和訓(xùn)練速度之間,如何能夠找到有效的平衡,進(jìn)而消除二者矛盾,這是一個(gè)非常重要的課題。比如,K鄰算法盡管其測試速度相對較差,但是實(shí)際應(yīng)用的速度卻非常理想[5]。傳統(tǒng)學(xué)習(xí)算法,主要針對標(biāo)記數(shù)據(jù),而在線學(xué)習(xí)算法將針對所有產(chǎn)生的數(shù)據(jù)展開,因此其對處理速度有更高的要求;再加上在處理過程中還必然會受到屬性變化、噪聲干擾等影響,因此還需要其具有更強(qiáng)的應(yīng)用能力,從根本上提升其應(yīng)用效率。

四、小結(jié)

大數(shù)據(jù)時(shí)代的來臨,對于在線學(xué)習(xí)算法來說,既是一種良好的機(jī)遇,又提出了更高的挑戰(zhàn)。所謂機(jī)遇,是因?yàn)榇髷?shù)據(jù)為在線學(xué)習(xí)算法提供了更優(yōu)秀的技術(shù)支持;所謂挑戰(zhàn),是因?yàn)榇髷?shù)據(jù)獨(dú)有的諸多特性,顛覆了傳統(tǒng)學(xué)習(xí)算法,主要是批量機(jī)器學(xué)習(xí)的模式。在無法計(jì)量,且不斷生成的大數(shù)據(jù)模式下,批量機(jī)器算法遠(yuǎn)遠(yuǎn)無法滿足實(shí)際計(jì)算需求,而在線學(xué)習(xí)算法當(dāng)前也還存在著一些問題。基于此,本文針對基于大數(shù)據(jù)在線學(xué)習(xí)算法展開總結(jié)性的闡述,同時(shí)對未來的發(fā)展趨勢也作出了分析,筆者希望其有助于我國在線學(xué)習(xí)算法的不斷發(fā)展和推廣應(yīng)用。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品成人久久| 亚洲人成影视在线观看| 国产丝袜无码精品| 亚洲人在线| 五月婷婷综合色| 青青热久免费精品视频6| 久久久久久高潮白浆| 国产成人a在线观看视频| 亚洲开心婷婷中文字幕| h网站在线播放| 久久黄色一级视频| 久久亚洲美女精品国产精品| 久久精品国产亚洲麻豆| 92精品国产自产在线观看| 亚洲最新地址| 2020最新国产精品视频| 国产丝袜一区二区三区视频免下载| 久久综合伊人77777| 欧美日韩中文国产| 97亚洲色综久久精品| 美女视频黄频a免费高清不卡| 中文字幕有乳无码| 超碰免费91| 亚洲天堂日韩av电影| AV不卡无码免费一区二区三区| 免费女人18毛片a级毛片视频| 伊人91在线| 国产高清又黄又嫩的免费视频网站| 无码精油按摩潮喷在线播放| 波多野结衣视频网站| 视频一区亚洲| 久久久噜噜噜久久中文字幕色伊伊| 国产传媒一区二区三区四区五区| 好吊色妇女免费视频免费| 色哟哟国产精品| 国产精品一区二区在线播放| 青青草综合网| 欧美区日韩区| 中文字幕精品一区二区三区视频| 婷婷亚洲天堂| 亚洲综合色婷婷| 久久视精品| 大香网伊人久久综合网2020| 成人欧美日韩| 欧美日韩国产系列在线观看| 国产成人久久777777| 日韩在线影院| 午夜欧美理论2019理论| 亚洲色无码专线精品观看| 亚洲愉拍一区二区精品| 亚洲一区毛片| 一级看片免费视频| 99ri精品视频在线观看播放| 久热re国产手机在线观看| 亚洲91精品视频| 国产99欧美精品久久精品久久 | AV天堂资源福利在线观看| 中文字幕在线不卡视频| 国内精品免费| 国产9191精品免费观看| 色婷婷电影网| 国产自产视频一区二区三区| 亚洲另类第一页| 视频国产精品丝袜第一页| 在线另类稀缺国产呦| 波多野结衣视频网站| 国产精品网拍在线| 亚洲毛片一级带毛片基地| 亚洲va欧美va国产综合下载| 国产精品亚洲一区二区三区z| 国产内射在线观看| 亚洲国产中文精品va在线播放 | 欧美日韩久久综合| 国产精品视频系列专区| 看国产一级毛片| 国产精品美女免费视频大全| 青青极品在线| 国产欧美日韩视频怡春院| 国产精品男人的天堂| jizz亚洲高清在线观看| 露脸真实国语乱在线观看| 91九色国产在线|