陳俊操
摘要:隨著現(xiàn)代社會的迅速發(fā)展,越來越多的先進(jìn)機(jī)器設(shè)備應(yīng)用到我們的日常生產(chǎn)生活當(dāng)中,其中大數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)的發(fā)展成為人們普遍關(guān)注的話題,本文對大數(shù)據(jù)機(jī)器系統(tǒng)學(xué)習(xí)的方式進(jìn)行分析,探究優(yōu)化對策,為機(jī)器學(xué)習(xí)的進(jìn)一步發(fā)展奠定一個(gè)良好的基礎(chǔ),進(jìn)一步研究其學(xué)習(xí)系統(tǒng)的發(fā)展趨勢,為相關(guān)工作人員的具體工作提供一定的理論標(biāo)準(zhǔn)依據(jù)。
關(guān)鍵詞:大數(shù)據(jù);機(jī)器學(xué)習(xí)系統(tǒng);研究進(jìn)展
前言
隨著現(xiàn)在大數(shù)據(jù)時(shí)代逐漸來臨,我們了解到機(jī)器學(xué)習(xí)系統(tǒng)的發(fā)展方向主要可以分為兩種,第一種是學(xué)習(xí)機(jī)制,機(jī)器對于人類的行為已經(jīng)存在一定的模擬學(xué)習(xí)能力,第二種就是在這個(gè)信息傳輸迅速,數(shù)量龐大的時(shí)代,機(jī)器如何在大數(shù)據(jù)集合當(dāng)中進(jìn)行有效信息的提取利用,以及對于潛在信息的深入分析,機(jī)器在分析數(shù)據(jù)的同時(shí),也是在追求更高水平的應(yīng)用學(xué)習(xí),為了機(jī)器能夠更加科學(xué)有效地對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),迅速吸收并加以分析,推動當(dāng)代數(shù)據(jù)社會的發(fā)展,相關(guān)工作人員必須對于機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行深層次的研究。
1.機(jī)器學(xué)習(xí)的常見方法
1.1監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是基于一個(gè)預(yù)先設(shè)定好的學(xué)習(xí)標(biāo)準(zhǔn),然后通過精確的計(jì)算公式來進(jìn)行參數(shù)的相關(guān)調(diào)整和完善以達(dá)到某個(gè)具體的目的,可能是為了要求精度或者最小的誤差,讓模型在不斷地調(diào)整過程當(dāng)中達(dá)到最優(yōu),然后把成功的模型當(dāng)做一個(gè)成功的標(biāo)準(zhǔn)來衡量之后的新樣例指標(biāo),通常情況下學(xué)習(xí)模型可以分為神經(jīng)網(wǎng)絡(luò),貝葉斯分類器以及決策回歸幾種常見的類型,運(yùn)用精確方便的現(xiàn)代科學(xué)方法來進(jìn)行數(shù)據(jù)分析以調(diào)整減小誤差。在神經(jīng)網(wǎng)絡(luò)模型當(dāng)中可以使用梯度優(yōu)化的方法,在支持向量機(jī)內(nèi)進(jìn)行二次優(yōu)化,通過不斷的有效調(diào)整來獲取最優(yōu)化模型。
1.2無監(jiān)督學(xué)習(xí)
與前者不同,無監(jiān)督學(xué)習(xí)是不存在預(yù)先的模型的,沒有可以加以利用分析的信息,在具體的利用途徑當(dāng)中,無監(jiān)督分析主要用在處理信息,密度估計(jì)等工作當(dāng)中,當(dāng)數(shù)據(jù)流存在比較密集的分布,無監(jiān)督分析可以進(jìn)行相關(guān)樣本的聚集分類,在數(shù)據(jù)流當(dāng)中進(jìn)行采樣分析,選取最佳的相關(guān)數(shù)據(jù)表示,“最佳”這個(gè)判定標(biāo)準(zhǔn)會隨著情況的發(fā)展而逐漸變得不同,在分析主成分的工作當(dāng)中,達(dá)到最佳需要尋找最適合表達(dá)數(shù)據(jù)投影的子空間,流行學(xué)習(xí)是為了探究事物真實(shí)的流形分布,聚類分析則是無監(jiān)督學(xué)習(xí)當(dāng)中最主要的一項(xiàng)工作,就是講不同的數(shù)據(jù)流分為不同的層次,分別形成聚集的樣例簇,常見的聚類方法分為層次聚類,自組織影射和k均值聚類,無監(jiān)督學(xué)習(xí)由于沒有預(yù)先設(shè)定的情況,所以在對于數(shù)據(jù)進(jìn)行度量的時(shí)候具有較大的自由,分為基于相似性和度量兩個(gè)主要方面。
1.3半監(jiān)督學(xué)習(xí)
傳統(tǒng)的機(jī)器在處理數(shù)據(jù)的時(shí)候?qū)τ谀切奈匆娺^的數(shù)據(jù)采取的是損失數(shù)據(jù)處理,這樣會造成一些有效設(shè)定數(shù)據(jù)的丟失,計(jì)算機(jī)進(jìn)行工作的時(shí)候會出現(xiàn)一種無監(jiān)督學(xué)習(xí)狀態(tài),而監(jiān)督學(xué)習(xí)就是基于已完成識別的信息數(shù)據(jù)進(jìn)行分析,在同時(shí)存在已識別和未識別的信息狀態(tài)當(dāng)中,會出現(xiàn)一種監(jiān)督與未監(jiān)督學(xué)習(xí)相結(jié)合的處理模式,這時(shí)就需要相應(yīng)的半監(jiān)督學(xué)習(xí)處理分析方法,半監(jiān)督學(xué)習(xí)不僅可以對于已經(jīng)具有地域標(biāo)識的數(shù)據(jù)進(jìn)行相應(yīng)處理,還可以對沒有標(biāo)識無法識別的數(shù)據(jù)進(jìn)行分類,對其進(jìn)行回收利用,確保相關(guān)數(shù)據(jù)可以達(dá)到最大程度的利用,尤其是在現(xiàn)在這個(gè)信息數(shù)據(jù)大爆炸的社會,會有很多超出原本認(rèn)知范圍的數(shù)據(jù),但是可能帶來的是更進(jìn)一步的發(fā)展,如果按照原來傳統(tǒng)的分析損耗程度,不利于數(shù)據(jù)處理的進(jìn)一步發(fā)展,如果不對其進(jìn)行新一步的分類和處理,會對于原本有價(jià)值的數(shù)據(jù)產(chǎn)生大量的浪費(fèi)。
1.4集成學(xué)習(xí)技術(shù)
科學(xué)的學(xué)習(xí)方法還是集取多種學(xué)習(xí)方法的優(yōu)點(diǎn),對于現(xiàn)存的學(xué)習(xí)系統(tǒng)進(jìn)行不斷的優(yōu)化,取其精華,棄其糟粕,無論是人力還是物力,單個(gè)的學(xué)習(xí)方法必然會有一定的發(fā)展限制,集合的多學(xué)習(xí)機(jī)制可以以一種方法來彌補(bǔ)另一種方法的不足,利用集合的學(xué)習(xí)系統(tǒng)來應(yīng)對不斷變化的時(shí)代發(fā)展,越來越多數(shù)據(jù)的出現(xiàn)給人們有些眼花繚亂的錯(cuò)覺,數(shù)據(jù)處理問題是機(jī)器對人類進(jìn)行模擬學(xué)習(xí)的一項(xiàng)重要因素,需要在現(xiàn)有的基礎(chǔ)上進(jìn)行進(jìn)一步的分析結(jié)合,為數(shù)據(jù)分析管理和利用提供更多的可選擇的發(fā)展方向。
2.機(jī)器學(xué)習(xí)系統(tǒng)發(fā)展趨勢
2.1提升泛化能力
機(jī)器學(xué)習(xí)系統(tǒng)主要是通過不同的試驗(yàn)來選取最優(yōu)的工作方案,從而逐漸推廣應(yīng)用,提高機(jī)器運(yùn)作的整體效率,所以為了機(jī)器能夠更好地投入到工作當(dāng)中,提高機(jī)器學(xué)習(xí)系統(tǒng)的泛化能力至關(guān)重要,目前經(jīng)過大多數(shù)的測試,支持向量機(jī)這一項(xiàng)已經(jīng)初步結(jié)合了理論知識與實(shí)踐結(jié)果,成為應(yīng)用比較廣泛的學(xué)習(xí)方法,可以結(jié)合比較廣泛的知識,但是泛化能力還有很大的提升空間,機(jī)器學(xué)習(xí)系統(tǒng)還需要不斷實(shí)踐,不斷進(jìn)行改進(jìn)完善。
2.2提升學(xué)習(xí)可理解性
對于大多數(shù)生產(chǎn)運(yùn)作過程當(dāng)中,都不需要人類進(jìn)行過多的操作,都是由相關(guān)工作人員輸入口令,然后機(jī)器在其內(nèi)部進(jìn)行精確的算法計(jì)算,最后輸出相應(yīng)的數(shù)據(jù)內(nèi)容,但是要想讓機(jī)器的學(xué)習(xí)能力能夠應(yīng)付更高端更復(fù)雜的問題的時(shí)候,需要的是對于數(shù)據(jù)的可解釋程度,這也是在市場上競爭的一個(gè)主要因素,所以為了提高機(jī)器的學(xué)習(xí)系統(tǒng)的有效性,需要相關(guān)工作人員對于數(shù)據(jù)進(jìn)行分析,增強(qiáng)其可解釋性,有助于計(jì)算機(jī)學(xué)習(xí)體系水平的提高。
2.3提升學(xué)習(xí)速度
現(xiàn)在這個(gè)信息迅速發(fā)展傳播的社會,數(shù)據(jù)產(chǎn)生的速度也大大加快,為了提高機(jī)器對這些數(shù)據(jù)進(jìn)行分析的速度,在關(guān)鍵時(shí)刻不掉鏈子,在不同的領(lǐng)域中進(jìn)行機(jī)器學(xué)習(xí)系統(tǒng)的優(yōu)化,相關(guān)工作人員對于機(jī)器的學(xué)習(xí)速度進(jìn)行專業(yè)的測試和檢驗(yàn),總體的評價(jià)可以分為兩部分,訓(xùn)練是在具體的實(shí)踐過程當(dāng)中,尋求最佳的計(jì)算方案,后者是通過預(yù)測來實(shí)現(xiàn)最優(yōu)方案在計(jì)算當(dāng)中的速度優(yōu)化,要想得到科學(xué)有效的結(jié)果,需將兩者合理結(jié)合,提高機(jī)器學(xué)習(xí)系統(tǒng)的運(yùn)行效率。
3.總結(jié)
在機(jī)器學(xué)習(xí)系統(tǒng)優(yōu)化的過程當(dāng)中,首先要明確的是機(jī)器學(xué)習(xí)的常見方式,包括不存在既定數(shù)據(jù)的無監(jiān)督學(xué)習(xí)以及事先設(shè)計(jì)好數(shù)據(jù)模式的監(jiān)督學(xué)習(xí),還有將兩者有效結(jié)合提高學(xué)習(xí)效率的半監(jiān)督學(xué)習(xí),兩者結(jié)合可以實(shí)現(xiàn)取長補(bǔ)短,還有基層學(xué)習(xí)技術(shù)和強(qiáng)化學(xué)習(xí)積累,與此同時(shí),機(jī)器學(xué)習(xí)系統(tǒng)的多方面綜合發(fā)展是未來發(fā)展的必然趨勢,機(jī)器學(xué)習(xí)系統(tǒng)的優(yōu)化也是為了跟上數(shù)據(jù)時(shí)代發(fā)展的腳步,有助于國家經(jīng)濟(jì)的發(fā)展與提高。
參考文獻(xiàn)
[1]韓雪純.大數(shù)據(jù)時(shí)代下機(jī)器學(xué)習(xí)的應(yīng)用研究[J].科技風(fēng),2018,351(19):63-63.
[2]張素芳,翟俊海,王聰,等.大數(shù)據(jù)與大數(shù)據(jù)機(jī)器學(xué)習(xí)[J].河北大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,38(3):299-308.