999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)下的大學(xué)生知識(shí)能力分類模型的構(gòu)建方法

2018-01-30 16:36:25雷良燦
電子技術(shù)與軟件工程 2017年15期
關(guān)鍵詞:大數(shù)據(jù)

雷良燦

摘要:針對(duì)傳統(tǒng)高斯過程分類失衡數(shù)據(jù)的低精度和低效率,通過引入樣本權(quán)重系數(shù)的似然函數(shù)、后驗(yàn)概率中的誘導(dǎo)變量及誘導(dǎo)因子重構(gòu)研究,解決原始方法的分類向少數(shù)類偏移和計(jì)算復(fù)雜問題,本文重點(diǎn)闡述分類模型的構(gòu)建內(nèi)容和研究技術(shù)路線,并給出模型的具體應(yīng)用和評(píng)價(jià)辦法,結(jié)果表明本文提出的大學(xué)生知識(shí)能力分類模型的構(gòu)建方法切實(shí)可行。

【關(guān)鍵詞】大數(shù)據(jù) 分類模型 高斯過程分類似然函數(shù)

針對(duì)大量數(shù)據(jù)分類問題,國(guó)內(nèi)外學(xué)者開展了大量研究工作,取得了很好的效果。目前,這個(gè)領(lǐng)域內(nèi)的研究主要集中在三個(gè)方而的改進(jìn):數(shù)據(jù)集、算法和評(píng)價(jià)標(biāo)準(zhǔn)。數(shù)據(jù)集方而,主要是對(duì)數(shù)據(jù)預(yù)處理以改善數(shù)據(jù)集中各類樣本之問數(shù)目的不平衡,但隨著大數(shù)據(jù)思維及運(yùn)用的普及,規(guī)范統(tǒng)計(jì)工作推進(jìn)增強(qiáng)了數(shù)據(jù)的高維計(jì)量性,用于探討行為規(guī)律、預(yù)測(cè)發(fā)展方向等領(lǐng)域的數(shù)據(jù)挖掘、時(shí)序跟蹤、關(guān)聯(lián)分析、網(wǎng)絡(luò)聚類等大數(shù)據(jù)處理技術(shù)與相應(yīng)軟件不斷完善,并逐步被集中于大數(shù)據(jù)管理系統(tǒng),以服務(wù)大數(shù)據(jù)分析,方便政府?dāng)?shù)據(jù)挖掘、形勢(shì)預(yù)測(cè)與調(diào)整措施提出。因此,針對(duì)高校大學(xué)生知識(shí)能力分類與評(píng)價(jià)智能處理研究顯得十分必要,本文在大數(shù)據(jù)背景下,給出分類模型的主要研究?jī)?nèi)容、研究方法及實(shí)驗(yàn)方案。這對(duì)于高等學(xué)校、企事業(yè)等單位的人才分類與評(píng)價(jià)均具有重要的現(xiàn)實(shí)意義。

1 分類模型的構(gòu)建內(nèi)容分析

本模型的構(gòu)建內(nèi)容主要包括如下三個(gè)方而的內(nèi)容,具體如下:

1.1 大規(guī)模失衡數(shù)據(jù)的高斯過程模型似然函數(shù)重構(gòu)研究

基于傳統(tǒng)高斯過程分類模型,通過對(duì)似然函數(shù)的重構(gòu),建立似然函數(shù)及在似然函數(shù)基礎(chǔ)上構(gòu)建的聯(lián)合似然函數(shù)與大規(guī)模數(shù)據(jù)集中少數(shù)類的敏感關(guān)系模型,使得錯(cuò)分少數(shù)類樣本的代價(jià)大于錯(cuò)分多數(shù)類樣本的代價(jià),最終改善少數(shù)類樣本的分類預(yù)測(cè)精度。

1.2 高斯過程模型后驗(yàn)概率誘導(dǎo)變量及誘導(dǎo)子

在傳統(tǒng)高斯過程模型基礎(chǔ)上,構(gòu)建誘導(dǎo)變量Fu,繼而探索引入Fu的后驗(yàn)概率P,在大規(guī)模正負(fù)類中,最終合成誘導(dǎo)變量Fu中的誘導(dǎo)子集,使得誘導(dǎo)變量和子集趨于最優(yōu),籍此降低計(jì)算復(fù)雜度和提升失衡數(shù)據(jù)的分類精度。

1.3 基于高校大學(xué)生知識(shí)能力的大規(guī)模失衡數(shù)據(jù)的高精度分類方法的實(shí)驗(yàn)性驗(yàn)證和應(yīng)用

本文設(shè)計(jì)一個(gè)基于寧德師范學(xué)院大學(xué)生知識(shí)能力特征的大規(guī)模數(shù)據(jù)分類驗(yàn)證平臺(tái),驗(yàn)證上述各項(xiàng)研究?jī)?nèi)容的結(jié)論,逐步完善各個(gè)環(huán)節(jié)在整體中的性能要求,建立性能評(píng)價(jià)模型,通過評(píng)價(jià)模型迭代完善分類模型性能和分類精度。

2 模型構(gòu)建的技術(shù)路線分析

存牛頓方法、粗糙集、內(nèi)外P集、K均值聚類算法等相關(guān)理論技術(shù),對(duì)高斯過程模型的似然函數(shù)重構(gòu)設(shè)計(jì)和實(shí)驗(yàn)、后驗(yàn)概率分布計(jì)算中的誘導(dǎo)變量及誘導(dǎo)因子構(gòu)建方法進(jìn)行研究,然后對(duì)核心算法進(jìn)行實(shí)驗(yàn)仿真和驗(yàn)證。最后進(jìn)行系統(tǒng)級(jí)設(shè)計(jì),建立系統(tǒng)模型,完成系統(tǒng)驗(yàn)證。具體的研究路線如圖1所示。

下而闡述解決主要問題的技術(shù)路線,具體如下:

2.1 大規(guī)模失衡數(shù)據(jù)的高斯過程模型似然函數(shù)重構(gòu)研究技術(shù)路線

第一步:建立不少于10組的規(guī)模不一的失衡數(shù)據(jù)集,根據(jù)高校貧困學(xué)生的分布狀況,應(yīng)控制這10組數(shù)據(jù)的規(guī)模控制比例,正負(fù)樣本的比例控制在1:10000以內(nèi),其中小于1:5000的實(shí)驗(yàn)數(shù)據(jù)組不少于3組。

第二步:在傳統(tǒng)高斯過程潛變量函數(shù)基礎(chǔ)上,定義在訓(xùn)練本上的似然函數(shù),并建立而向第一步多組數(shù)據(jù)集上的聯(lián)合似然函數(shù),這里的聯(lián)合似然函數(shù)的構(gòu)建將根據(jù)實(shí)驗(yàn)數(shù)據(jù)組的變化,構(gòu)建多個(gè)聯(lián)合似然函數(shù),實(shí)驗(yàn)驗(yàn)證聯(lián)合似然函數(shù)的與實(shí)驗(yàn)數(shù)據(jù)組的最佳關(guān)系,同時(shí)驗(yàn)證聯(lián)合似然函數(shù)的、實(shí)驗(yàn)數(shù)據(jù)組、各組正負(fù)樣本比例三者之問的關(guān)系。

第三步:充分驗(yàn)證錯(cuò)分一個(gè)少數(shù)類樣本的代價(jià)與錯(cuò)分一個(gè)多數(shù)類樣本的代價(jià)對(duì)比結(jié)果,并驗(yàn)證聯(lián)合似然函數(shù)對(duì)于少數(shù)正樣本類的敏感性。

第四步:在聯(lián)合似然函數(shù)中的正負(fù)類樣本對(duì)應(yīng)的似然函數(shù)上引入不同的權(quán)重系數(shù),進(jìn)行迭代式重構(gòu)實(shí)驗(yàn),使得錯(cuò)分少數(shù)類樣本的代價(jià)大于錯(cuò)分多數(shù)類樣本的代價(jià),在該步研究中,可能會(huì)遇到權(quán)重系數(shù)取值問題,對(duì)于問題解決辦法為:總體上應(yīng)確保少數(shù)類樣本對(duì)應(yīng)的權(quán)重系數(shù)要大于1,而多數(shù)類樣本對(duì)應(yīng)的權(quán)重系數(shù)要小于1,兩類樣本數(shù)目越懸殊,權(quán)重的差距應(yīng)根據(jù)實(shí)驗(yàn)迭代驗(yàn)證結(jié)果設(shè)定在一個(gè)合理值,總體目標(biāo)是保證聯(lián)合似然函數(shù)中正負(fù)類樣本在整體上具有一樣的話語權(quán)。

2.2 高斯過程模型后驗(yàn)概率誘導(dǎo)變量及誘導(dǎo)子集的構(gòu)建研究技術(shù)路線

為構(gòu)建一個(gè)最佳化的誘導(dǎo)變量和誘導(dǎo)子集,采用如下研究技術(shù)路線:

第一步:首先對(duì)樣本集使用粗糙集和P集理論方法進(jìn)行連續(xù)數(shù)據(jù)離散化處理,繼而進(jìn)行樣本集的篩選和屬性約簡(jiǎn)研究。

第二步:構(gòu)建誘導(dǎo)變量Fu,通過微積分推導(dǎo)出含有誘導(dǎo)變量Fu的后驗(yàn)概率,在構(gòu)建變量和后驗(yàn)概率推導(dǎo)中,采用有限儲(chǔ)存牛頓方法、Gauss-Hermite求積公式、稀疏矩陣等計(jì)算得出高斯函數(shù)逼近參數(shù)值。

第三步:在第一步基礎(chǔ)上,進(jìn)一步利用K均值聚類算法或改進(jìn)的聚類算法、分別從正負(fù)類中選取相同數(shù)目的樣本來構(gòu)成最佳誘導(dǎo)子集,在本步研究過程中,將會(huì)遇到的問題是:當(dāng)均值聚類算法的迭代次數(shù)設(shè)定為某數(shù)值時(shí),該算法有時(shí)會(huì)存在生成的聚類中心數(shù)目小于設(shè)定的數(shù)目的情況,從而造成聚類失敗,針對(duì)這種問題,采用的辦法是將隨機(jī)從樣本較多的聚類中選取相應(yīng)數(shù)目的樣本來補(bǔ)齊。

3 實(shí)驗(yàn)方案

在實(shí)驗(yàn)方法上,可采用如下實(shí)驗(yàn)方案:

(1)對(duì)比實(shí)驗(yàn):設(shè)置四個(gè)或四個(gè)以上同傳統(tǒng)高斯過程分類模型及目前優(yōu)秀的分類算法對(duì)比實(shí)驗(yàn),通過實(shí)驗(yàn)結(jié)果的對(duì)比分析,找出本研究方法存在的問題,改正不足,逐步完善分類方法。

(2)驗(yàn)證實(shí)驗(yàn):在高校大學(xué)生消費(fèi)、購(gòu)買等行為大規(guī)模特征數(shù)據(jù)基礎(chǔ)上,對(duì)集成后的分類方法進(jìn)行驗(yàn)證性實(shí)驗(yàn),通過驗(yàn)證性實(shí)驗(yàn),主要驗(yàn)證本課題的研究能否達(dá)到預(yù)期的設(shè)計(jì)目標(biāo)。

在實(shí)驗(yàn)工具上,采用如下實(shí)驗(yàn)方案:

(1)在實(shí)驗(yàn)階段,對(duì)于似然函數(shù)重構(gòu)、誘導(dǎo)變量及誘導(dǎo)因子的構(gòu)建、及與其它分類算法的對(duì)比實(shí)驗(yàn)主要采用Matlab仿真軟件進(jìn)行實(shí)驗(yàn)分析與處理。此外,部分對(duì)比驗(yàn)證性實(shí)驗(yàn)借用sPss分析工具進(jìn)行分析與評(píng)價(jià)。

(2)在驗(yàn)證性應(yīng)用階段,在本課題研究的分類方法基礎(chǔ)上,進(jìn)一步使用VC工具開發(fā)出高校大學(xué)生知識(shí)能力輔助決策平臺(tái)。

4 結(jié)論

本文根據(jù)高校大學(xué)生知識(shí)能力評(píng)價(jià)業(yè)務(wù)的需求,結(jié)合海量數(shù)據(jù)樣本實(shí)際情況,介紹了大規(guī)模失衡數(shù)據(jù)的高斯過程模型似然函數(shù)重構(gòu)、高斯過程模型后驗(yàn)概率誘導(dǎo)變量及誘導(dǎo)子集的構(gòu)建兩個(gè)重點(diǎn)研究?jī)?nèi)容及其研究技術(shù)路線,繼而闡述了分類模型的實(shí)驗(yàn)方案和評(píng)價(jià)方法,文中介紹的模型構(gòu)建方法具有較好的借鑒性,為了進(jìn)一步提供模型的精確度,后續(xù)將開展樣本數(shù)據(jù)的關(guān)于大學(xué)生知識(shí)能力敏感特征選擇研究。

參考文獻(xiàn)

[1]邢勝,王熙照,王曉蘭,基于多類重采樣的非平衡數(shù)據(jù)極速學(xué)習(xí)機(jī)集成學(xué)習(xí)[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)), 2016, 52(01): 203-209.

[2] Kim Hyun-chul, Ghahramani Z. Bayesian Gaussian process classification with the EM-EP algorithm[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 28 (12): 18-2 0.

[3]H. Han,W.Y.Wang,B.H.Mao, Borderline-SMOTE:A new over-sampling method inimbalanced data sets learning. The 2005 International Conference on Advances in Intelligent Computing(ICIC' 05), 2014: 878-887.endprint

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
基于大數(shù)據(jù)的小微電商授信評(píng)估研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
主站蜘蛛池模板: 国产日韩欧美中文| 国产精品免费入口视频| AV在线天堂进入| 久久天天躁夜夜躁狠狠| 国产精品无码作爱| 亚洲伦理一区二区| 久一在线视频| 国产麻豆精品手机在线观看| 国产一级在线观看www色 | 97免费在线观看视频| 久久久久久久久18禁秘| 国产成人高清精品免费5388| 9丨情侣偷在线精品国产| 精品撒尿视频一区二区三区| 免费国产高清视频| 欧美日韩国产精品va| 国产欧美日本在线观看| 日本免费新一区视频| 欧美激情视频一区| 国产欧美在线| 爱做久久久久久| 激情网址在线观看| 亚洲男女在线| 中国一级特黄大片在线观看| 九色91在线视频| 91麻豆精品国产高清在线| 亚洲综合18p| 国产黑丝视频在线观看| 乱色熟女综合一区二区| а∨天堂一区中文字幕| 妇女自拍偷自拍亚洲精品| 无码人中文字幕| 亚洲精品天堂在线观看| 欧美午夜视频| 国产麻豆精品手机在线观看| 亚洲精品中文字幕无乱码| 亚洲国产看片基地久久1024| 欧美午夜小视频| 国产精品入口麻豆| 国产丝袜无码精品| 国产精品久久国产精麻豆99网站| 综合色亚洲| 国产va在线观看免费| 国内熟女少妇一线天| 美女免费黄网站| 欧美在线黄| 国内自拍久第一页| 99精品视频播放| 四虎影视永久在线精品| 亚洲一区二区三区国产精品| 亚洲精品天堂自在久久77| 日本三级精品| 亚洲日韩每日更新| 亚洲国产在一区二区三区| 四虎永久免费地址在线网站| 久久91精品牛牛| 免费99精品国产自在现线| 欧美日韩在线亚洲国产人| 无码AV高清毛片中国一级毛片| 欧美啪啪网| 亚洲人成影院午夜网站| 色婷婷亚洲十月十月色天| 99久久精彩视频| 91亚瑟视频| 波多野结衣视频网站| 亚洲视频在线青青| 在线色综合| 婷婷色丁香综合激情| 久久综合亚洲色一区二区三区| 国产噜噜在线视频观看| 精品伊人久久久大香线蕉欧美| 久久人与动人物A级毛片| 国产又粗又猛又爽视频| 黄色网在线| 午夜日b视频| 91精品久久久久久无码人妻| 国产视频一二三区| 亚洲国产精品无码久久一线| 亚洲一区二区三区香蕉| 精品久久久久久成人AV| 国产成人喷潮在线观看| 91在线视频福利|