999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據分析的“浙江新高考”志愿填報輔助推薦平臺研究

2019-12-23 09:28:13黃戴琴周強虞飛華
電腦知識與技術 2019年31期

黃戴琴 周強 虞飛華

摘要:浙江新高考改革為“七選三”的模式后,高考志愿填報多了一個科目限選要求,考生志愿填報成為一項復雜的數據工程。本研究基于高?;拘畔祿?、當年招生計劃數據、歷年投檔數據、考生個人數據,通過設計推薦算法,基于Android平臺開發了高考志愿填報輔助系統,能夠快速精確地推薦一組符合考生填報意愿的當年招生計劃數據列表。

關鍵詞:大數據分析;用戶協同過濾;高考志愿填報;推薦系統

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2019)31-0075-04

高考是目前我國教育體制中最重要的考試之一?;謴透呖家詠恚芏嗫忌ㄟ^高考進入高校學習,改變了自己的命運,也有很多人考生因為志愿填報的失誤,錯失了心目中想要踏入的大學,又或是從事完全不適合自己的行業,而遺憾終身。高考志愿填報關乎一個人的命運,如何在上千所學校,上萬個專業中挑選出符合考生自己分數以及興趣的高校和專業,是困擾廣大考生和家長的重要問題。

浙江省新高考改革后,脫離傳統的單調文理分科模式,采用新型“7選3模式”,即除去語文、數學和外語三門必考課程之外,還要在傳統的理科和文科科目中選3門作為高考自選科目,其中包括歷史、政治、地理、物理、化學、生物和技術(含通用技術和信息技術)。浙江省新高考志愿填報實行平行專業志愿填報機制,以一所學校的一個專業為一個志愿,最多填報80個志愿。

“7選3模式”對于考生而言多了一份分數自信和興趣抉擇,同時也限制了報考專業方向。在這個模式下,部分專業對選考科目及分數有明確要求。這就成為考生報考志愿的一大難點。傳統的志愿抉擇階段主要盲目地借助于大量的書籍和網絡上的資料,各種各樣的資料讓人眼花繚亂,根本無法從這么多良莠不齊的信息中找到真正有價值的,浪費大量時間在查找資料上,往往卻徒勞無功,導致對有效信息掌握不足或自身定位不清晰。李勝在《傳統高考志愿填報的反思及現實展望》中提到,多數家長和教師過多的關注高校的“名聲”,而忽略了與學生自身興趣和能力匹配的專業嘲,這種錯誤的想法也影響了大多數考生對未來發展和職業規劃的不重視甚至迷茫和被動。隨著信息時代的和教育信息化的飛速發展,大可以借助大數據和互聯網的力量,在眾多院校和專業中找到適合自己的方向。

目前我國考志愿填報平臺相關研究較多。中國教育在線、高考派、第一高考網等是國內高考志愿填報平臺的典型案例。上述主流的高考志愿填報服務平臺,主要提供院校信息查詢功能,各院校的歷年招生分數查詢為主要功能,并且雖然有根據考生分數進行志愿智能推薦,但沒有綜合考慮“浙江省新高考7選3限制”、考生填報意愿的院校地域信息、院校聲譽度、是否雙一流、歷年招生信息、當年招生計劃、大學排行榜信息、學科專業排名信息、就業信息等數據。顯然這些信息,對考生來說是志愿填報的重要參考信息,并且部分信息每年都是動態變化的,如歷年招生人數和當年招生計劃人數的增減,就會對院校專業的招生分數產生一定的波動和不穩定性,上述平臺且缺乏靈活性。

基于分析國內主流高考志愿填報平臺的不足,本研究提出一個“浙江新高考”志愿填報方案智能推薦平臺,有目的指向浙江省新高考政策,旨在解決考生志愿填報不明確問題,采集新高考志愿填報涉及的數據,結合考生填報意愿和高考成績,通過大數據計算和基于用戶的協同過濾算法,給考生智能推薦的一個或多個志愿填報候選方案。

1推薦算法設計

協同過濾推薦算法是一個雖然傳統古老但依然應用廣泛的推薦算法,主要用于預測和推薦,基于對用戶的偏好對用戶進行群組劃分并產生相似推薦。協同過濾技術分為四類:基于用戶的協同過濾嘲、基于項目的協同過濾、基于混合的協同過濾、基于模型的協同過濾。

基于用戶的協同過濾推薦的原理就是“物以類聚,人以群分”,將目標用戶的喜好或標簽作為一種反饋,與其他有相似喜好的用戶組成一個集合,這種用戶被稱作目標用戶的“鄰居”。最后將目標用戶的“鄰居”的其他目標用戶沒接觸過的喜好推薦給目標用戶,形成目標用戶的“新喜好”。

基于項目的協同過濾算法與之類似,是以項目或物品作為目標,通過用戶的評價,比較不同項目與項目之間的評價距離來產生預測評價,生成推薦集合?;诨旌系膮f同過濾算法顧名思義就是把“用戶”和“項目”混合在一起形成的推薦算法。基于模型的協同過濾算法將用戶和項目之間的關系作為研究對象,設計一個合適的模型,通過過程優化來達到推薦效果。

通過綜合比較上述四種過濾方法,本文針對浙江新高考志愿填報的特點,融合大數據技術,采用了基于用戶的協同過濾技術,通過對考生的各種屬性和偏好,給予有效的高考志愿填報推薦。

建立一個基于用戶的協同過濾系統只需要三步:第一步,繪制用戶畫像矩陣;第二步,搜索最近鄰;第三步,生成推薦結果。

1.1用戶畫像矩陣建立

在大環境的影響下,高考不僅是考生個人自己的事,更成為一個家庭的大事。根據相關文獻和調研發現,高考志愿填報的影響因素,不僅包括考生的高考分數,還包括考生的個人興趣、發展前景和家庭情況等,谷寶柱在《高考志愿選擇行為的影響因素研究》中利用國內外文獻和問卷調查相結合,得出結論:影響考生高考志愿填報的主要因素有個人因素、家庭因素、高校因素、國家社會因素和經濟因素五個方面。綜合分析影響考生填報志愿的因素和考生的個人意愿得出在高考志愿填報中,影響志愿填報的因素主要有:學校類型(如985、211、一流大學、普通一本、普通二本、普通三本等),學校地區、考生分數、歷年錄取分數線等。根據這些影響因素和考生自身意愿確定了用戶偏好信息的方向和內容,繪制用戶畫像矩陣。

用戶畫像矩陣內容主要來源于用戶自己完善的信息內容,以考生的基本屬性數據、學生的總分、三門主課分數、7選3科目及其對應分數為基礎,通過要求所推薦的學校是否要是985院校、所推薦的學校是否要是211院校以及對城市和地區的完成偏好設置,共同作為目標用戶的喜好和標簽。

用戶畫像矩陣建立后,就將其作為用戶屬性,用于接下來的數據分析。

1.2最近鄰搜索

1.2.1用戶數據標準化

為了方便數據處理,根據考生輸人的考生成績信息和填報意向信息,在用戶屬性確定后,對數據進行數據標準化處理,本文采用rain-max標準化對數據進行標準化處理,如公示l所示:

其中d表示考生的原始數據,rain表示屬性的最小值,min表示屬性的最大值。

1.2.2計算用戶鄰近性

最近鄰搜索就是以考生屬性為基礎,計算考生與考生偏好之間的相似度。在標準化的考生屬性數據的基礎上,采用皮爾遜相關系數進行最近鄰搜索,計算考生之間的距離,以此來表示考生間的相似鄰近度,如公示2所示:

1.3推薦結果生成

推薦結果是基于鄰近用戶的錄取高校和專業產生的,首先要確定鄰居用戶,通過相似鄰近度的計算和搜索,將近鄰度為0的用戶作為目標用戶的最近鄰用戶,作為鄰居用戶并將其對應成功錄取的院校加入推薦集合中。

由于每年的試卷難度不同等因素,分數作為參考量的價值并不穩定,所以根據用戶的排名作為主要參考更為嚴格精準。根據目標用戶的所處分數排名段,選取距離最小的x個用戶作為另據用戶,并將x個用戶所錄取的高校按人數進行降序排列處理,并依次加入推薦集合中,再根據考生的偏好設置進行逐一甄別,甄別后的推薦內容放入新的推薦集合,直到新的推薦集合中的個數到達目標數,即50條,形成最終的推薦集合。

2平臺功能設計

經過向高考考生和家長發放問卷調研,結合基于用戶協同過濾算法,本文設計的浙江新高考志愿填報平臺主要分為an-droid客戶端和服務端兩個程序,包含以下幾個模塊,具體如圖1所示。

2.1android客戶端功能

1)用戶注冊:用于考生申請合法身份,建立考生的個人信息檔案并保存考生的基本社會屬性,作為目標用戶。

2)用戶登錄:驗證考生身份的合法性,保障考生的信息安全。

3)高考成績填報:保存考生的語文、數學和外語三門公共課分數、7選3科目及其對應分數、學生總分以及排序位序信息作為必須數據,應用于數據的協同過濾算法。

4)意向信息填報:主要收集考生對高校層次、地理位置偏好以及專業的意向信息,作為主要篩選和推薦依據。

5)高校資訊和信息展示:包含展示各個高校的基本信息、專業情況和歷年招生情況,為考生更好提供對高校了解的環境和途徑。也會向用戶提供呈現一些與高考相關信息的文章,用戶可以瀏覽資訊以了解一些填報志愿的相關政策和由各考試院推送的一些有用的文章。

2.2服務端功能

1)數據采集:首先選取各高校官方招生網站、省教育考試院、第三方評價機構和教育部網站為目標URLs,也就是指定入口。將這些URL從網絡上下載下來存放進待抓取的容器中,把待抓取的容器中的URL提取出來,并進行訪問,解析后的數據儲存到服務器中。將解析完成的URL重新放回容器中,在容器中進行篩選后循環之前的操作。

利用網絡爬蟲技術從各高校網站和省教育考試院網站收集獲取各高?;拘畔祿斈陮I招生計劃數據、歷年專業招生計劃數據、歷年專業錄取分數數據和,從第三方評價機構中收集高校綜合排名數據、學科專業排名數據和就業質量排名數據,從教育部網站獲取雙一流建設大學和雙一流學科建設大學數據,數據來源如圖2所示。

2)數據存儲:一個安全可靠的系統必然離不開數據存儲。系統將通過爬蟲技術抓取到的數據以Excel表格的格式保存到本地服務器,將Excel文件通過接口API上傳到數據庫服務器,對文件中的數據進行處理,處理完成后成功連接到數據庫并將數據插入到數據庫對應的數據表中。

3)數據計算:主要對高校、招生專業的排名情況、歷年招生計劃、本年招生信息和歷年錄取情況、考生成績、考生的意向數據進行大數據計算。

4)志愿推薦:運用基于用戶協同過濾算法,先根據用戶屬性建立用戶畫像矩陣,然后利用公示(1)對數據進行標準化。在經過標準化后的數據基礎上,利用公示(2)計算考生與考生之間的距離,最后生成推薦集,即生成符合高生意愿的高校和專業志愿推薦列表。

3系統測試

設計測試用例,根據測試用例進行系統測試,首先填寫考生的名次、批次,語文、數學和外語三門公共課成績和7選3的科目和對應分數,自動生成總成績,如圖3所示。

然后,考生填志愿填報意向意愿,包括排除的省、直轄市和自治區,學校辦學性質和類型,是否要求一流大學建設和是否要求一流學科建設,是否要求985、211和重點大學,如圖4所示。

根據圖3和圖4的數據,高考志愿填報輔助推薦平臺,經過服務端計算,最后將推薦結果列表推送到android客戶端,效果如圖5所示:

4總結

針對浙江省新高考的特點,本文設計的浙江新高考志愿填報推薦平臺,結合了網絡爬蟲技術、大數據處理技術和基于用戶協同過濾算法,通過采集大量高考生填報相關的數據和各個高校招生情況和信息,設計用戶協同過濾算法,設計了android客戶端和服務端。測試結果表明,該平臺可以為考生推薦符合考生成績區間和考生感興趣的學校和專業列表,能夠大大減少考生在海量數據中尋找高校和專業的時間,相對手工填報明顯提高了精確度,解決了由于信息不足或者對自身定位有誤等問題,更好地填補了目前高考推薦系統對于浙江省考生志愿填報推薦的空缺,滿足廣大浙江考生的需求,具有較好的應用價值。雖然本平臺已經有了較好的推薦效果,但是在用戶協同過濾算法中,還需要通過數據訓練集的不斷測試,完善協同過濾算法以提高推薦精確度,特別在數據稀疏的情況,需要進一步的研究和改進。

主站蜘蛛池模板: 九九久久精品国产av片囯产区| 国产亚洲精品在天天在线麻豆| 最新精品国偷自产在线| 日韩无码精品人妻| 久久久精品久久久久三级| www中文字幕在线观看| 国产又色又爽又黄| 欧美一区二区三区不卡免费| 国产精品视频第一专区| 国产一区二区三区精品久久呦| 欧美第九页| 亚洲九九视频| 欧美日韩在线亚洲国产人| 日韩天堂网| 欧美亚洲一二三区| 99一级毛片| 亚洲男人的天堂视频| 伊人蕉久影院| 色偷偷av男人的天堂不卡| 好吊色国产欧美日韩免费观看| 在线亚洲精品福利网址导航| 日本国产精品一区久久久| 亚洲av无码久久无遮挡| 澳门av无码| 91午夜福利在线观看| 无码国产伊人| 91久久精品国产| 欧美成人精品在线| v天堂中文在线| aaa国产一级毛片| 日本免费a视频| 亚洲swag精品自拍一区| 老司国产精品视频91| 欧美三级不卡在线观看视频| 2020精品极品国产色在线观看| 噜噜噜综合亚洲| 国产天天射| 色婷婷在线播放| 国产精品白浆在线播放| 久久性妇女精品免费| 久久人人妻人人爽人人卡片av| 日本黄色不卡视频| 国产视频一区二区在线观看| 无码一区二区波多野结衣播放搜索| 伊人中文网| 日韩中文无码av超清| 欧美一级高清片欧美国产欧美| 久久91精品牛牛| 国产一级精品毛片基地| 欧美国产成人在线| 亚洲国产在一区二区三区| 色噜噜在线观看| 91精选国产大片| 国产SUV精品一区二区| 综合久久五月天| 亚洲欧洲国产成人综合不卡| 中文无码毛片又爽又刺激| 成年午夜精品久久精品| 超碰精品无码一区二区| 国产人成在线观看| 亚洲免费三区| 精品福利一区二区免费视频| 丰满人妻久久中文字幕| 青青青伊人色综合久久| 亚洲综合天堂网| 丝袜国产一区| 成·人免费午夜无码视频在线观看 | 很黄的网站在线观看| 欧美在线视频不卡| 欧美视频免费一区二区三区| 久久国产精品77777| 欧美黄色a| 国产美女一级毛片| 亚洲,国产,日韩,综合一区| 久久精品丝袜| 日韩高清成人| 亚洲国产高清精品线久久| 亚洲第一中文字幕| 麻豆精品视频在线原创| 99久久精品国产自免费| 老司机aⅴ在线精品导航| 久草热视频在线|