摘"要:隨著信息技術的迅猛發展,計算機科學與技術專業的人才培養面臨著新的挑戰和機遇。本文旨在提出一種通過大數據分析的方法緊跟計算機行業發展需求制訂人才培養方案的思路。首先,通過抓取國內大型招聘網站上的招聘信息,再對抓取的信息進行清洗,保留有效信息。其次,通過統計和分析招聘信息中的崗位名稱、技能要求、素質要求等關鍵信息,將分析統計結果運用可視化等手段進行展示,獲得計算機科學與技術專業領域所涵蓋的崗位及專業技能要求和素質能力要求。最后,結合學校人才培養定位、專業自身特點、畢業生崗位信息反饋及行業專家建議,科學精準地定位人才培養目標。
關鍵詞:大數據分析;人才培養;招聘信息;數據爬取
中圖分類號:G424""文獻標識碼:A
隨著信息技術的迅猛發展,特別是近年來人工智能大模型呈現出快速增長的態勢,導致計算機技術領域技術不斷推陳出新。計算機科學與技術專業已成為當今社會的熱門專業之一,這對計算機科學與技術專業的人才提出了更高的要求。如何科學精準地定位人才培養目標,以滿足市場的不斷變化和需求,是當前高校面臨的重要問題。傳統的人才培養模式往往側重于理論知識的傳授,而忽視了市場需求導向的專業技能、實踐能力的培養。高校參考社會招聘信息對人才的要求進行人才培養是培養應用型人才的重要途徑,很多學校和專業都對此做了研究和嘗試,取得了很好的效果[13]。本文通過基于大數據分析技術對招聘網站上的數據進行抓取和分析,旨在探討計算機科學與技術專業的人才市場需求和定位,為學校的人才培養提供有益的參考。
一、總體研究思路
本文綜合參考了對大型招聘網站信息提取、處理、利用的相關文獻后[46],結合本校本專業的特點,制定了主要研究思路,具體包括以下五個方面的內容。
(一)數據抓取與處理
在國內大型招聘網站上抓取關于計算機科學與技術專業的招聘信息。通過使用Python語言編寫爬蟲程序進行數據采集,獲取大量的招聘信息數據。然后對抓取的數據進行清洗和預處理,去除重復、無效和錯誤的數據,確保數據的準確性和可靠性。
(二)數據分析與挖掘
采用大數據挖掘和機器學習等手段,對清洗后的數據進行深入分析。通過統計和分析招聘信息中的崗位名稱、技能要求、素質要求等關鍵信息,揭示計算機科學與技術專業領域所涵蓋的崗位類型、技能要求以及素質要求的特征和規律。
(三)可視化展示與深入分析
將各項分析結果通過柱形圖、折線圖、詞云圖等可視化的方法展示出來。通過對可視化結果進行深入分析,我們可以更加直觀地了解計算機科學與技術人才的市場需求和定位,并對崗位進行分類和歸納。
(四)人才培養目標定位
結合學校“應用型人才”培養定位、計算機科學與技術專業自身特點、畢業生崗位信息反饋和行業專家建議,對計算機科學與技術專業的人才培養目標進行科學精準的定位。通過對比市場需求和當前人才培養模式的差異,提出改進和優化人才培養方案的建議。
二、數據抓取與處理研究思路
選擇國內大型招聘網站作為主要數據來源,通過編寫爬蟲程序作為數據采集工具,獲取招聘網站上的計算機科學與技術專業相關招聘信息。在數據抓取過程中,遵守網站的爬蟲協議和法律法規,確保數據的合法性和合規性,注重數據的完整性和準確性,確保所抓取的信息能夠真實反映市場對該專業人才的需求。抓取到的數據通常包括崗位名稱、工作地點、薪資待遇、學歷要求、技能要求、素質要求等多個字段。然而,原始數據中往往存在重復、無效和錯誤的數據,如過期職位、非計算機科學與技術專業職位等。因此,需要對抓取的數據進行清洗和預處理,通過去除重復數據、填補缺失值、糾正錯誤數據等方法,確保數據的準確性和可靠性。在數據處理過程中,使用Python中的Pandas庫進行數據的清洗和整理。Pandas提供了高效的數據結構和數據分析工具,使得我們能夠方便地對數據進行處理和分析。本研究需要重點關注企業對有5年工作經驗的計算機專業人才的技能要求、素質要求,以此對數據進行進一步的處理和轉換,以便后續的分析和挖掘能更好地支撐人才培養目標的確立。
三、數據分析與挖掘研究思路
在數據清洗的基礎上,采用大數據挖掘和機器學習等手段,對有5年工作經驗的計算機科學與技術專業的招聘信息進行深入分析。首先,對職位名稱進行了聚類分析,以識別出該專業領域所涵蓋的主要崗位。通過聚類分析,我們發現計算機科學與技術專業的崗位主要包括軟件開發工程師、Web前端工程師、數據分析師、網絡安全工程師等。接著,對職位描述和技能要求進行了文本挖掘,提取出各崗位所需的專業技能和素質能力要求。在文本挖掘過程中,使用Python中的NLTK庫進行自然語言處理,通過分詞、詞性標注等手段,提取出職位描述和技能要求中的關鍵詞和短語,進而分析出各崗位所需的專業技能和素質能力要求。通過文本挖掘,發現不同崗位對專業技能和素質能力的要求各不相同。例如,軟件開發工程師需要熟練掌握編程語言、具備算法與數據結構理解能力、熟悉軟件開發工具等;而數據分析師則需要具備數據挖掘、數據分析、數據可視化等能力。同時,還發現所有崗位對求職者的綜合素質也有較高的要求,如溝通能力、團隊合作能力、創新能力等。
四、可視化展示與深入分析部分研究思路
為了更直觀地展示分析結果,采用了柱形圖、折線圖、詞云圖等可視化的方法。通過柱形圖,展示了各崗位的招聘數量和占比,以了解市場的熱門崗位和冷門崗位。通過折線圖,可以展示各崗位的技能要求和素質能力要求的變化趨勢,以把握市場的變化和發展趨勢。通過詞云圖,可以展示各崗位的關鍵詞和技能要求,以更直觀地了解崗位的特點和要求。
第一,通過柱形圖,展示了各崗位的招聘數量和占比,以了解市場的熱門崗位和冷門崗位。在Python中,使用Matplotlib庫來繪制柱形圖,將各崗位的招聘數量和占比這些數據存儲在Python的列表中。開始繪圖時,先導入Matplotlib庫中的pyplot模塊。然后使用pyplot中的bar函數來創建柱形圖,將崗位的列表作為x軸的數據,將招聘數量的列表作為y軸的數據。為了增強圖表的可讀性,可以添加標題、x軸和y軸的標簽以及圖例。最后使用pyplot的show函數來顯示圖表。這樣,就可以直觀地看到各崗位的招聘數量和占比。通過柱形圖,可以清晰地對比不同崗位之間的招聘熱度,從而更準確地把握市場的熱門崗位和冷門崗位,這為后續的深入分析和決策提供了有力的數據支持。
第二,通過折線圖,展示了各崗位的技能要求和素質能力要求的變化趨勢,把握市場的變化和發展趨勢。在繪制折線圖時,選擇了使用Matplotlib庫,它提供了靈活的繪圖接口,能夠方便地繪制出各崗位技能要求和素質能力要求的變化曲線。在具體的繪制過程中,首先,使用已經抓取并整理后的各崗位的技能要求和素質能力要求的數據,這些數據包括不同時間點或不同條件下的數值變化。其次,利用Matplotlib庫中的pyplot模塊的plot函數繪制折線圖。將時間點或條件設置為x軸的數據,技能要求或素質能力要求的數值設置為y軸的數據。為了提升折線圖的可讀性和直觀性,可以添加標題、x軸和y軸的標簽、圖例以及數據點的標簽。最后,通過pyplot的show函數來展示折線圖。通過觀察折線圖,可以直觀地分析出各崗位的技能要求和素質能力要求的變化趨勢,從而更好地理解市場的變化和發展方向,這為接下來的分析和決策提供了堅實的數據基礎。
第三,通過詞云圖,展示了各崗位的關鍵詞和技能要求,以便直觀地了解崗位的特點和要求。在Python中,使用WordCloud庫來生成詞云圖。WordCloud庫能夠根據文本中詞語的出現頻率生成相應的詞云圖,能夠直觀地看到各崗位的關鍵詞和技能要求。具體生成詞云圖的過程中,首先,準備好已經抓取并整理后的各崗位的職位描述或技能要求文本數據。其次,使用WordCloud庫中的WordCloud類來創建一個詞云對象,并將文本數據傳遞給它。在這個過程中,可以設置一些參數來調整詞云圖的外觀,比如背景顏色、字體大小、最大詞語數量等。最后,調用詞云對象的generate方法來根據文本數據生成詞云圖,生成后可以使用Matplotlib庫來顯示這個詞云圖,或者將其保存為圖片文件。通過觀察詞云圖,我們可以直觀地看到各崗位中最重要、最頻繁的關鍵詞和技能要求,從而更深入地了解崗位的特點和要求,這為專業崗位分析和職業規劃提供了有力的數據支持。
通過深入分析,發現計算機科學與技術專業人才的市場需求呈現出多元化和差異化的特點。不同崗位對專業技能和素質能力的要求各不相同,且隨著技術的發展和市場的變化而不斷變化。因此,學校需要根據市場需求和定位,科學精準地定位人才培養目標。在這個過程中,Python的可視化工具提供了強大的支持,能夠更直觀地展示分析結果,為人才培養目標的定位提供更客觀有力的依據。
五、人才培養目標定位的建議
結合學校的應用型人才培養定位以及計算機專業方向為移動互聯、數據可視化、網絡安全的特色,參考行業企業專家給出的建議及畢業生反饋的信息,對人才培養目標進行了科學精準的定位。
首先,注重培養學生的實踐能力和創新能力。通過校企合作進行項目實踐、實習實訓等方式,將企業實際的項目經驗引入人才培養中,可以提高學生的實際操作能力和解決問題的能力,這將有助于學生更好地適應市場需求,提高就業競爭力。
其次,注重培養學生的跨學科融合能力。在掌握計算機技術的同時,我們鼓勵學生結合其他學科知識進行創新和應用,鼓勵學生積極參加學科競賽,特別是跨學科的競賽活動,這將有助于學生拓寬視野,提高綜合素質,為未來的職業發展打下堅實的基礎。
最后,注重培養學生的持續學習和適應變化能力。計算機技術發展迅速,市場需求也在不斷變化。因此,我們鼓勵學生緊跟技術前沿,進行先進技術的在線學習,不斷提升自我,以適應計算機行業不斷更新的技術發展和變化。
基于上面的結果分析,對人才培養目標做出了如下建議:
(1)優化課程設置:根據市場需求和技術發展,不斷更新和完善課程設置。納入最新的技術和應用,確保學生掌握最新的知識和技能。這將有助于學生更好地適應市場需求,提高就業競爭力。
(2)加強與企業合作:與知名企業建立合作關系,共同開展人才培養和項目實訓。這將有助于學生更好地了解市場需求和行業動態,提高實踐能力和創新能力。同時,企業也可以為學生提供更多的實習和實踐機會,使學生能夠更好地適應市場需求。
(3)注重培養學生的綜合素質和能力:除了專業技能和知識外,還需要注重培養學生的溝通能力、團隊合作能力、創新能力等非技術性能力。這將有助于學生更好地適應市場需求和職業發展要求,提高綜合素質和競爭力。
結語
本文介紹了基于大數據分析的高校應用型人才培養定位的研究思路,利用網絡公開的招聘數據資源,采用計算機爬蟲技術、數據分析技術及數據可視化技術,跟蹤行業、企業對計算機專業人才的最新需求,獲得計算機科學與技術專業領域所涵蓋的崗位、專業技能要求以及素質能力要求數據。再結合學校的人才培養定位及企業專家建議和畢業生就業崗位情況反饋,利用多角度的數據構建科學的人才培養方案的研究方法,為高校人才培養定位研究提供了一種有意義的參考。
參考文獻:
[1]郝琳琳.招聘大數據分析在優化人才培養方案中的應用[J].河北軟件職業技術學院學報,2024,26(01):2729.
[2]孫學軍,齊俊景,闞曲欣.基于招聘數據挖掘的高職人才培養方案構建研究:以物流類專業為例[J].職教論壇,2019(08):159164.
[3]張曉玲,倪月犁.基于招聘信息的電商數據運營人才培養路徑研究[J].商場現代化,2024(17):2628.
[4]常逢佳,李宗花,文靜,等.基于Python的招聘數據爬蟲設計與實現[J].軟件導刊,2019,18(12):130133.
[5]潘成花,王丹.基于Selenium+PyECharts的智聯招聘數據采集與可視化[J].科技創新與生產力,2024,45(07):130132.
[6]許丹亞,賈雨瀟.網絡招聘信息抽取與分析系統設計[J].無線互聯科技,2022,19(21):8285.
基金項目:2021年度省高等教育教學改革研究項目:基于大數據分析的人才培養定位研究與實踐(項目編號:SJGY20210747);2021年度黑龍江工程學院教育教學改革研究項目:基于大數據分析的人才培養定位研究與實踐(項目編號:JG202109)
作者簡介:曲天偉(1976—"),女,漢族,黑龍江綏化人,碩士,副教授,研究方向:計算機應用技術、高等教育。