肖嘉慧
摘要:聚類算法在人工智能領(lǐng)域應(yīng)用廣泛,是公認(rèn)的優(yōu)秀的人工智能應(yīng)用工具之一。TensorFlow的開(kāi)源性為聚類算法的應(yīng)用提供了更好的平臺(tái),是一種行之有效的大數(shù)據(jù)下的基于數(shù)據(jù)流圖的計(jì)算工具。因此它必須依賴海量存儲(chǔ)的數(shù)據(jù)倉(cāng)庫(kù),同時(shí)它通過(guò)數(shù)據(jù)挖掘技術(shù)進(jìn)行大數(shù)據(jù)商業(yè)化應(yīng)用是十分有價(jià)值的。
關(guān)鍵詞:TensorFlow平臺(tái);人工智能;聚類算法
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)05-0150-01
在國(guó)內(nèi)外現(xiàn)有的語(yǔ)音、語(yǔ)義、視覺(jué)智能識(shí)別的研究中,常見(jiàn)的模型構(gòu)造理論工具包括線性回歸方程、模糊數(shù)學(xué)理論、多元線性方程等。這些工具構(gòu)造出的理論識(shí)別模型在識(shí)別效率和識(shí)別準(zhǔn)確度方面還有所欠缺。此外,多數(shù)文獻(xiàn)構(gòu)建的模型著重討論航線布局的優(yōu)化的機(jī)制,而不是從航線科學(xué)規(guī)劃角度來(lái)構(gòu)建語(yǔ)音、語(yǔ)義、視覺(jué)智能識(shí)別。因此,本文以TensorFlow的開(kāi)源性為課題背景,構(gòu)建基于聚類算法的語(yǔ)音、語(yǔ)義、視覺(jué)智能識(shí)別。TensorFlow平臺(tái)模型可以準(zhǔn)確測(cè)算大數(shù)據(jù)下的基于數(shù)據(jù)流圖,為AI人工智能提供科學(xué)識(shí)別結(jié)論,從而避免了資源的浪費(fèi)。
1 聚類算法概述
到目前為止,聚類算法的定義并不統(tǒng)一,其中目前最常用的聚類算法的概念是由Everitt在1974年提出的,它認(rèn)為一個(gè)類簇內(nèi)的實(shí)體具有一定的相似性,而各個(gè)類簇之間的實(shí)體存在很大的差異;類簇是測(cè)試空間中點(diǎn)的會(huì)聚,一個(gè)類簇內(nèi)的任意兩點(diǎn)之間的距離都不大于不同類簇內(nèi)任意兩點(diǎn)的距離;換言之,類簇就是一個(gè)多維空間內(nèi)相對(duì)密度較高的點(diǎn)的的連通區(qū)域,它們能夠借助相對(duì)密度較低的點(diǎn)集合區(qū)域和其它區(qū)域(類簇)進(jìn)行分離。
從不同的角度出發(fā),聚類分析具有不同的分類。從數(shù)據(jù)在聚類中的積聚規(guī)則及應(yīng)用這些規(guī)則的方法,可以將聚類算法具體劃分為層次化聚類算法、網(wǎng)格的聚類算法、劃分式聚類算法、基于密度以及其他聚類算法。
2 聚類算法在人工智能領(lǐng)域應(yīng)用現(xiàn)狀
國(guó)外基于數(shù)據(jù)流圖的計(jì)算在AI學(xué)習(xí)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的成功運(yùn)用參考實(shí)例有很多。本文以排在前列的基于數(shù)據(jù)流圖的計(jì)算運(yùn)用參考實(shí)例為例開(kāi)展詳細(xì)闡述。現(xiàn)有的基于數(shù)據(jù)流圖的計(jì)算在AI學(xué)習(xí)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)中的運(yùn)用參考實(shí)例,是以語(yǔ)音、語(yǔ)義、視覺(jué)的聚類方式分析基于數(shù)據(jù)流圖的計(jì)算來(lái)指引系統(tǒng)設(shè)計(jì)的。基于數(shù)據(jù)流圖的計(jì)算指引下的系統(tǒng)將形成語(yǔ)音、語(yǔ)義、視覺(jué)的資源文件。虛擬基于數(shù)據(jù)流圖的計(jì)算數(shù)據(jù)結(jié)果是以真實(shí)的數(shù)字化移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)社交平臺(tái)APP、網(wǎng)上交易和家用電器控制基本業(yè)務(wù)記錄為基礎(chǔ),結(jié)合人工智能技術(shù)分布結(jié)構(gòu)和聚類方法而設(shè)計(jì)的。
本文闡述了基于數(shù)據(jù)流圖的計(jì)算技術(shù)的概念、技術(shù)指標(biāo)、模型設(shè)計(jì)技術(shù)選型競(jìng)爭(zhēng)能力、使用價(jià)值和所應(yīng)對(duì)的挑戰(zhàn)問(wèn)題。他認(rèn)為,雖然曾經(jīng)花了不少的經(jīng)費(fèi)設(shè)計(jì)本文相關(guān)的AI學(xué)習(xí)系統(tǒng),但是,面對(duì)著眼下迫不及待要處理的問(wèn)題,本文相關(guān)的AI學(xué)習(xí)系統(tǒng)還需優(yōu)化正在使用的模糊算法。
數(shù)字化聚類分析促進(jìn)了語(yǔ)音、語(yǔ)義、視覺(jué)的發(fā)展,是AI學(xué)習(xí)系統(tǒng)發(fā)展歷史的里程碑。語(yǔ)音、語(yǔ)義、視覺(jué)的科技化才開(kāi)始規(guī)模化的推廣,通常被用于移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)社交平臺(tái)APP、網(wǎng)上交易和家用電器控制等領(lǐng)域。在推廣中,語(yǔ)音、語(yǔ)義、視覺(jué)的推廣的實(shí)用度日趨升高,新推出的數(shù)字化民航平臺(tái)在諸多大規(guī)模的規(guī)劃和建設(shè)工程中獲得了廣泛地使用,同時(shí)贏得了理想的模型設(shè)計(jì)技術(shù)選型效果。伴隨著模型設(shè)計(jì)技術(shù)選型的繁榮,語(yǔ)音、語(yǔ)義、視覺(jué)的同通信、計(jì)算機(jī)科技的有機(jī)融合,形成了人工智能技術(shù)識(shí)別領(lǐng)域的專業(yè)科技。
3 聚類算法在TensorFlow平臺(tái)中的應(yīng)用前景
TensorFlow平臺(tái)能夠通過(guò)構(gòu)建有向圖的形式來(lái)對(duì)所要執(zhí)行的操作進(jìn)行描述,其可以更加高效地利用設(shè)備的CPU以及GPU進(jìn)行高速計(jì)算,聚類算法在TensorFlow平臺(tái)的應(yīng)用,能為企業(yè)提供更加快速、靈活的開(kāi)發(fā)工具,進(jìn)而促進(jìn)企業(yè)更有效的進(jìn)行先進(jìn)系統(tǒng)、產(chǎn)品的開(kāi)發(fā)。例如,IBM所大力研發(fā)的PowerBI人工智能平臺(tái),就是聚類算法在TensorFlow平臺(tái)中的未來(lái)應(yīng)用趨勢(shì),其實(shí)現(xiàn)了支持企業(yè)級(jí)開(kāi)源機(jī)器學(xué)習(xí)和深度學(xué)習(xí)架構(gòu),以構(gòu)建相應(yīng)的認(rèn)知應(yīng)用。PowerBI人工智能平臺(tái)能夠減少企業(yè)在Power體系結(jié)構(gòu)上部署這類開(kāi)源架構(gòu)時(shí)的復(fù)雜性和風(fēng)險(xiǎn)。GPU到CPU以及CPU到GPU之間的NVLink連接,對(duì)于大幅提升分析應(yīng)用性能以及深度學(xué)習(xí)能力具有重要意義,使得編程任務(wù)得到了大幅簡(jiǎn)化,這與傳統(tǒng)平臺(tái)構(gòu)建相比,效率得到了大大提升。
在TensorFlow平臺(tái)開(kāi)源化推廣和實(shí)施的探究方面通常側(cè)重內(nèi)容為:當(dāng)中用以資源重組的通常為資源分享與語(yǔ)音、語(yǔ)義、視覺(jué)的綜合性技術(shù),用以處理協(xié)調(diào)問(wèn)題的通常是協(xié)作運(yùn)用,而移動(dòng)運(yùn)用和物流網(wǎng)通常被用以提升基本業(yè)務(wù)的便捷度,云計(jì)算則主要用以格式一致管理。
從目前的文檔看,TensorFlow支持CNN、RNN和LSTM算法,這都是目前在Image、Speech和NLP最流行的深度神經(jīng)網(wǎng)絡(luò)模型。語(yǔ)音、語(yǔ)義、視覺(jué)的聚類方式TensorFlow平臺(tái)開(kāi)源化推廣一定具備動(dòng)態(tài)AI學(xué)習(xí)系統(tǒng)下的綜合性技術(shù)功能。動(dòng)態(tài)AI學(xué)習(xí)系統(tǒng)下的綜合性技術(shù)可以被視作一站類服務(wù)運(yùn)作流程,將過(guò)去分散的多個(gè)服務(wù)處理環(huán)節(jié)根據(jù)用戶的需求自行整合成諸多存在關(guān)聯(lián)性的服務(wù)處理流程。此種服務(wù)處理流程可以顯著提升業(yè)務(wù)識(shí)別參與者使用的便捷度,推出迎合員工多元化需求的業(yè)務(wù)處理過(guò)程。
這一次的Google開(kāi)源深度學(xué)習(xí)系統(tǒng)TensorFlow在很多地方可以應(yīng)用,比如智能化的語(yǔ)音識(shí)別、抽象語(yǔ)言分析、廣告設(shè)計(jì)、三維立體展示等。然而,我們也要客觀的看待TensorFlow對(duì)于工業(yè)界機(jī)器學(xué)習(xí)系統(tǒng)的作用,不能進(jìn)行過(guò)于夸大宣傳。在一個(gè)完整的工業(yè)界語(yǔ)音識(shí)別系統(tǒng)里,除了深度學(xué)習(xí)算法外,還有很多工作是專業(yè)領(lǐng)域相關(guān)的算法。在TensorFlow平臺(tái)中,數(shù)據(jù)清洗存在的時(shí)間節(jié)點(diǎn)往往集中在數(shù)據(jù)傳輸表單之時(shí)。TensorFlow平臺(tái)中數(shù)據(jù)清洗的目標(biāo)即是對(duì)發(fā)生錯(cuò)誤的數(shù)據(jù)庫(kù)實(shí)例進(jìn)行適當(dāng)?shù)奶幚怼@纾STensorFlow平臺(tái)數(shù)據(jù)傳輸表單自動(dòng)下載的圖形文件和頁(yè)面樣式文件、文件類型為gif,jpeg,jpg,map,css,cgi等文件、索引為109的數(shù)據(jù)庫(kù)實(shí)例、TensorFlow平臺(tái)請(qǐng)求方法為POST 和 HEAD的數(shù)據(jù)庫(kù)實(shí)例等等都能夠刪除。
4 結(jié)語(yǔ)
本文的TensorFlow平臺(tái)采用聚類算法進(jìn)行優(yōu)化,并找出了其中的高頻項(xiàng)目組。聚類算法技術(shù)的優(yōu)點(diǎn)是能為TensorFlow平臺(tái)發(fā)現(xiàn)新的語(yǔ)音、語(yǔ)義、視覺(jué)智能識(shí)別的信息,缺點(diǎn)是需要TensorFlow平臺(tái)提供主觀的評(píng)價(jià)信息,而TensorFlow平臺(tái)的評(píng)價(jià)信息可能會(huì)過(guò)時(shí),使用不便。在這個(gè)時(shí)候,隨著TensorFlow平臺(tái)和資源的加大投入,聚類算法在人工智能領(lǐng)域應(yīng)用前景會(huì)更好,人工智能應(yīng)用領(lǐng)域相關(guān)系統(tǒng)的性能會(huì)逐步地變強(qiáng),能處理大規(guī)模的數(shù)據(jù)量。
參考文獻(xiàn)
[1]劉帆,劉鵬遠(yuǎn),李兵,徐彬彬. TensorFlow平臺(tái)下的視頻目標(biāo)跟蹤深度學(xué)習(xí)模型設(shè)計(jì)[J].激光與光電子學(xué)進(jìn)展,2017,54(09):283-291.
[2]張俊,李鑫.TensorFlow平臺(tái)下的手寫(xiě)字符識(shí)別[J].電腦知識(shí)與技術(shù),2016,12(16):199-201.