金昌錦
(福州職業(yè)技術(shù)學(xué)院 福建省福州市 350108)
伴隨著國家經(jīng)濟(jì)的快速發(fā)展和產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整升級需求,大學(xué)及職業(yè)教育涌現(xiàn)出一大批新興的符合國家發(fā)展方向需求的新專業(yè)。這些專業(yè)也提供了大量新興的崗位需求,不同類型的崗位需求差異明顯。特別是一些專業(yè)崗位,社會(huì)認(rèn)知度不高,學(xué)生自身了解就業(yè)信息的難度較大,了解相關(guān)崗位信息的積極性不高,不利于學(xué)生樹立正確的職業(yè)觀念,不利于學(xué)生對自身未來職業(yè)生涯進(jìn)行規(guī)劃。大部分就業(yè)信息都是互聯(lián)網(wǎng)上收集到的零散信息,或是身邊家人朋友和老師等的宣傳推介,難以形成明晰的職業(yè)認(rèn)知。與此同時(shí),新興領(lǐng)域崗位的任職要求日新月異,以上渠道和方式都不能夠滿足學(xué)生對新專業(yè)新崗位,老專業(yè)新崗位的就業(yè)信息與任職要求的信息獲取要求。為了讓學(xué)生能夠在學(xué)校就讀期間就能夠緊跟本專業(yè)崗位發(fā)展情況,明確目標(biāo)就業(yè)崗位的任職條件,做好職業(yè)生涯規(guī)劃的同時(shí)有針對性的培養(yǎng)自身職業(yè)素養(yǎng),迫切需要一個(gè)崗位信息實(shí)時(shí)更新的就業(yè)信息查詢系統(tǒng)來幫助學(xué)生及時(shí)的了解就業(yè)信息,幫助大中專院校師生明確學(xué)習(xí)目標(biāo)。
就業(yè)問題一直是社會(huì)關(guān)注的熱點(diǎn)問題,目前此類針對就業(yè)信息的網(wǎng)絡(luò)爬取工作,前人已經(jīng)做了較多研究。例如:太原科技大學(xué)的王芳采用基于Python 的Scrapy 框架設(shè)計(jì)了某招聘網(wǎng)站的爬蟲系統(tǒng)并實(shí)現(xiàn)數(shù)據(jù)清洗及分析,但是沒有考慮多個(gè)招聘網(wǎng)站作為數(shù)據(jù)源的情況[1];淮陰師范學(xué)院的常逢佳采用Python 的requests 庫針獲取拉勾網(wǎng)招聘數(shù)據(jù),通過Ajax 異步請求的Json 數(shù)據(jù)獲取了職位信息簡介,并對獲取的薪資、工作年限等做了簡單數(shù)據(jù)清洗和分析,但沒有獲取崗位的詳情信息[2]。福州職業(yè)技術(shù)學(xué)院的金昌錦實(shí)現(xiàn)了多數(shù)據(jù)源的招聘信息的數(shù)據(jù)采集,針對復(fù)雜的數(shù)據(jù)采用Python 的matplotlib 庫進(jìn)行了圖表化,最后使用中文分詞庫jieba 進(jìn)行分詞操作,再用wordcloud 形成圖云展示[3]。根據(jù)以上的研究情況分析,目前相關(guān)爬蟲爬取的就業(yè)信息大多僅作為研究目的,沒有真正實(shí)際的開放給高校中的教師和學(xué)生使用和參考。本文開發(fā)了一個(gè)系統(tǒng)能夠定期爬取最新的就業(yè)崗位信息,對數(shù)據(jù)進(jìn)行整理清洗后可供高校師生參考。也可以根據(jù)教師和學(xué)生的需求新增新的就業(yè)崗位進(jìn)行數(shù)據(jù)采集,并實(shí)現(xiàn)了基本的畢業(yè)生就業(yè)情況管理功能。
不同類型爬蟲爬取網(wǎng)頁內(nèi)容的方式的不同,根據(jù)其爬取特點(diǎn),一般將其分為分為通用型爬蟲和聚焦型爬蟲兩類[4]。通用型爬蟲通常是指類似百度、必應(yīng)和谷歌搜索這樣的面對整個(gè)互聯(lián)網(wǎng)內(nèi)容進(jìn)行爬取檢索的方式。而針對某個(gè)某類爬取者指定的網(wǎng)頁信息內(nèi)容進(jìn)行爬取的方式,即稱為聚焦型爬蟲。本文所需采集的數(shù)據(jù)為就業(yè)崗位信息數(shù)據(jù),采用的是聚焦型網(wǎng)絡(luò)爬蟲進(jìn)行抓取。
B/S 架構(gòu)即瀏覽器和服務(wù)器結(jié)構(gòu)模式,是隨著Internet 技術(shù)的興起,對C/S 架構(gòu)的一種變化或者改進(jìn)的架構(gòu)[5]。B/S 構(gòu)架的優(yōu)點(diǎn)如下:
(1)表現(xiàn)層、業(yè)務(wù)邏輯層和數(shù)據(jù)訪問層是相互獨(dú)立的,互不影響,可以降低各層之間的依賴,系統(tǒng)維護(hù)和升級方式簡單,開發(fā)人員能夠集中精力關(guān)注某一層。
(2)在計(jì)算機(jī)技術(shù)發(fā)展的背景下,B/S 構(gòu)架采用當(dāng)前標(biāo)準(zhǔn)的網(wǎng)絡(luò)協(xié)議,具有良好的兼容性。
(3)B/S 構(gòu)架操作方便快捷,無需安裝任何應(yīng)用程序,用戶只需通過瀏覽器即可與后臺(tái)的服務(wù)器和數(shù)據(jù)庫進(jìn)行數(shù)據(jù)信息交換[6]。
Django 是一個(gè)開放源代碼的Web 應(yīng)用框架,由Python 寫成。具有功能完善、要素齊全、文檔完善、強(qiáng)大的數(shù)據(jù)庫訪問、靈活的URL 映射等優(yōu)點(diǎn)[7]。
本系統(tǒng)主要使用者為學(xué)院內(nèi)各個(gè)專業(yè)的學(xué)生、相應(yīng)的專業(yè)教師和各班級輔導(dǎo)員三類參與者。
(1)主要為學(xué)生提供就業(yè)崗位信息的查詢,畢業(yè)生就業(yè)信息的上報(bào)等服務(wù);
(2)為專業(yè)教師提供最新的就業(yè)崗位信息數(shù)據(jù),及時(shí)了解行業(yè)崗位任職要求的更新與變化,根據(jù)學(xué)生提交的申請及崗位的變化的情況及時(shí)更新本專業(yè)就業(yè)崗位信息及其任職要求;
(3)為輔導(dǎo)員提供學(xué)生畢業(yè)前后就業(yè)情況信息審查及報(bào)送功能。
總體設(shè)計(jì)要實(shí)現(xiàn)系統(tǒng)易于使用,操作便捷,有較強(qiáng)的易用性,較低的學(xué)習(xí)成本。二要能根據(jù)用戶需求爬取跟蹤最新的崗位信息,及時(shí)將信息提供給教師處理,并提供給學(xué)生了解。三是解決目前學(xué)生畢業(yè)前后就業(yè)信息報(bào)送渠道不通暢,輔導(dǎo)員工作量大,信息報(bào)送緩慢不及時(shí)等問題。
本系統(tǒng)根據(jù)設(shè)計(jì)目標(biāo),主要分為5 大模塊,總體的模塊設(shè)計(jì)參見圖1。

圖1:就業(yè)崗位跟蹤與就業(yè)管理系統(tǒng)功能模塊圖
3.2.1 崗位信息查詢模塊
本模塊可以加深學(xué)生對于所學(xué)專業(yè)相關(guān)崗位的任職要求的了解,實(shí)時(shí)掌握最新的崗位技能與知識(shí)要求。學(xué)生可以查詢了解各個(gè)專業(yè)主要崗位的就業(yè)區(qū)域,薪資分布,任職要求等就業(yè)信息,也可提交新興崗位信息采集的申請;教師角色除了可以實(shí)現(xiàn)學(xué)生角色的功能以外,還可以對學(xué)生提交的申請進(jìn)行審核,審核通過后提交崗位信息爬取模塊獲得相關(guān)信息并審核,最終實(shí)現(xiàn)就業(yè)崗位信息的更新。
3.2.2 就業(yè)崗位信息采集更新模塊
本模塊定期對數(shù)據(jù)庫內(nèi)已存在的就業(yè)崗位在相關(guān)招聘網(wǎng)站進(jìn)行數(shù)據(jù)抓取并清理,歸集后由專業(yè)教師進(jìn)行人工審核修改后存入數(shù)據(jù)庫中。由教師審核后提交的新增的崗位加入下一次的爬取過程。爬蟲采用基于Python 語言編寫的網(wǎng)絡(luò)爬蟲進(jìn)行數(shù)據(jù)采集,利用成熟的Scrapy 框架配合Mysql 數(shù)據(jù)庫進(jìn)行爬取及存儲(chǔ)任務(wù),最后使用Re 正則表達(dá)式庫和Jieba 中文分詞庫對數(shù)據(jù)進(jìn)行清洗,提取出有效的就業(yè)崗位信息內(nèi)容。
3.2.3 畢業(yè)生基本信息管理模塊
本模塊可直接導(dǎo)入現(xiàn)有學(xué)校教務(wù)系統(tǒng)學(xué)生基本信息數(shù)據(jù)表,同時(shí)提供修改更正的功能。
3.2.4 畢業(yè)生就業(yè)情況管理模塊
以往畢業(yè)生就業(yè)信息都是通過學(xué)生上報(bào)材料給輔導(dǎo)員,輔導(dǎo)員人工收集材料整理后統(tǒng)一上報(bào)。本模塊實(shí)現(xiàn)畢業(yè)生就業(yè)情況自主上傳,輔導(dǎo)員角色可進(jìn)行審核及管理,自動(dòng)生成就業(yè)信息情況報(bào)表。
3.2.5 系統(tǒng)管理模塊
系統(tǒng)管理模塊可以由管理員進(jìn)行用戶的增減、查詢,進(jìn)行用戶基本信息維護(hù),權(quán)限設(shè)置及修改等。
本系統(tǒng)采用的是Mysql 數(shù)據(jù)管理系統(tǒng),主要有以下數(shù)據(jù)結(jié)構(gòu)表,見以下表格:
(1)用戶信息表:如表1所示。

表1:用戶信息表
(2)畢業(yè)生基本信息表:如表2所示。

表2:畢業(yè)生基本信息表
(3)崗位信息表:如表3所示。

表3:崗位信息表
(4)畢業(yè)生就業(yè)情況表:如表4所示。

表4:畢業(yè)生就業(yè)情況表
本系統(tǒng)測試時(shí)服務(wù)器端采用的是Windows Server2003 操作系統(tǒng),客戶端采用Windows10 操作系統(tǒng),使用Chrome 和360 極速瀏覽器進(jìn)行系統(tǒng)運(yùn)行驗(yàn)證。
用戶登陸模塊是面向用戶的第一道窗口,必須確保該模塊運(yùn)行穩(wěn)定,操作編輯,安全性高。實(shí)際測試中本界面運(yùn)行情況達(dá)到預(yù)期要求,如圖2所示。

圖2:用戶登陸界面實(shí)現(xiàn)
系統(tǒng)主界面如圖3所示。

圖3:系統(tǒng)主界面(學(xué)生用戶)
隨著國家產(chǎn)業(yè)升級的步伐逐步加快,在教育部的統(tǒng)一規(guī)劃下,大中專院校緊跟時(shí)代發(fā)展設(shè)立了眾多新興的就業(yè)崗位,舊有的專業(yè)及崗位也融合了新的知識(shí)和技能。通過本系統(tǒng)實(shí)時(shí)的跟蹤最新就業(yè)崗位信息,收集整理后呈現(xiàn)給專業(yè)教師和學(xué)生參考,不僅讓學(xué)生對自己未來可能的就業(yè)崗位有更清晰的認(rèn)識(shí),更可以讓學(xué)生提前規(guī)劃自身學(xué)習(xí)方向和目標(biāo)。對于教師而言也可以隨時(shí)緊跟行業(yè)發(fā)展情況,及時(shí)調(diào)整教學(xué)方向,提高教學(xué)的針對性。同時(shí)本系統(tǒng)還實(shí)現(xiàn)了基本的就業(yè)生畢業(yè)情況的管理功能,學(xué)生提交就業(yè)情況證明材料更加便捷,輔導(dǎo)員審核就業(yè)情況的效率和上報(bào)的準(zhǔn)確性有效性得到提升,可以很好的服務(wù)于本學(xué)院的就業(yè)引導(dǎo)及就業(yè)管理工作,系統(tǒng)總體上實(shí)現(xiàn)了設(shè)計(jì)目標(biāo)。