方利勝
摘 要: 隨著互聯網的廣泛應用,利用網絡平臺進行招聘已經成為用人單位的主流招聘形式。面對海量的應聘簡歷,有效的提取并篩選應聘信息成為用人單位招聘工作的重點和難點。文章從用人單位制作招聘信息表及后續應聘大數據篩選兩個方面著手,應用Matrixlaboratory(MATLAB)編程語言對應聘信息進行提取和篩選,從而快速統計不同需求所關注的應聘信息。
關鍵詞:應聘;大數據;信息提取
中圖分類號:TP311 文獻標志碼:A 文章編號:2095-2945(2018)33-0031-02
Abstract: With the wide use of the Internet, using the network platform for recruitment has become the mainstream form of recruitment. In the face of a large number of resumes, the effective extraction and screening of information has become the focus and difficulty of the recruitment work of employers. This paper starts from the following two aspects: making the recruitment information form and screening big data, using the Matrixlaboratory (MATLAB) programming language to extract and screen the application information, so as to quickly count the application information of different needs.
Keywords: application; big data; information extraction
引言
隨著互聯網的廣泛應用,利用網絡平臺進行招聘已經成為用人單位的主流招聘形式。面對海量的應聘簡歷,有效的提取并篩選應聘信息成為用人單位招聘工作的重點和難點。Matlab 是美國MathWorks 公司推出的一套高性能的數值計算和可視化科學計算軟件,是目前國內外高校和研究部門進行科學研究的重要工具。Matlab包含數百個內部核心函數[1],是目前用于信息統計的主要手段之一。本文應用(MATLAB)編程語言對應聘信息進行提取和篩選,從而快速統計應聘信息。
1 招聘信息表
為了保證后續招聘信息的提取,建議先將招聘所需要的關鍵信息制作成規范表格,主要內容應包括姓名、出生年月、性別、政治面貌、籍貫、畢業學校及專業、聯系方式。同時,在網絡招聘平臺上,招聘單位應注明不按標準格式提交基本信息表不予入圍,如表1所示。
待應聘者提交表格后,利用xlsread[2]及dlmwrite[3]命令將所有應聘者關鍵信息統計到一個excel表格中,如表2所示。
2 簡歷篩選
為了方便后續統計應聘人數及篩選人員,應要求應聘者用姓名命名簡歷。由于有的應聘者未按標準格式提供基本信息表,這部分人員的信息將不會統計到表2中,因此,會出現基本信息表中的人員與簡歷個數不一致的情況,需要將未統計入表的人員簡歷刪除。利用dir命令讀取簡歷的文件名,用xlsread命令讀取信息表中人名,通過for[3]循環確定簡歷人名是否在信息表中,若在,提取信息表中的序號,用copyfile[3]重新命名簡歷文件,新文件名為“序號 人名”,若不在,則簡歷新文件名為“nonum人名”。在編程過程中,應注意,由于人名存在2個字、3個字甚至4個字的情況,因此在人名對應時,應先用if[3]命令判斷人名字符數,再進行比對。執行命令語句后,在目標文件夾檢查篩選后的簡歷,有如下兩種情況,第一,簡歷名稱為“nonum 人名”,直接刪除該簡歷;第二,簡歷名稱前的序號中斷,導致這種情況發生的原因有兩個,一是信息表中對應缺失序號人員的簡歷未下載,二是存在應聘者重名現象,這種情況需要根據信息表中的序號重新命名。在信息表信息與簡歷信息一一對應后,打印簡歷的排序即為信息表人員的排序,方便以后對應查詢。
3 特定信息提取
有時需統計所有應聘人員的特定信息,如統計本次招聘共涉及到的學校數量、專業類別、男女比例等。利用xlsread命令讀取相應關鍵信息列,對于學校及專業列,通過if命令識別“大學”或“學院”字符來間隔單元格內信息,最后將提取的信息用xlswrite命令寫到新表格中。
4 結束語
目前利用網絡平臺進行招聘已經成為用人單位的主流招聘形式。面對海量的應聘簡歷,有效的提取并篩選應聘信息成為用人單位招聘工作的重點和難點。從應聘者提供的電子簡歷到對應聘者進行面試,中間的工作量巨大。簡化工作內容并提供關鍵信息成為用人單位關注的重點。另外,對于每次招聘,用人單位也希望從各個角度分析招聘工作存在的不足,因此,特定信息的統計成為招聘工作必不可少的環節。本文從用人單位制作招聘信息表及后續應聘大數據篩選兩個方面著手,應用(MATLAB)編程語言對應聘信息進行提取和篩選,從而快速統計不同需求關注的應聘信息。本文應用的基礎在于應聘者應按照招聘單位的要求提供信息,對于重復規律性的工作,利用計算機編程語言可以大大提供工作效率,隨著各個行業大數據的產生,結合計算機簡化工作內容必將成為各行各業發展的趨勢。
參考文獻:
[1]鄭喜英,孔波.基于Matlab的概率統計教學研究[J].河南教育學院學報:自然科學版,2014,23(1):56-60.
[2]寇金寶,洪林,李德勝.實現MATLAB與Excel數據交互的一種可行方法[J].天津職業大學學報,2010,19(2):93-95.
[3]張志涌,楊祖櫻.MATLAB教程:R2010A[M].北京航空航天大學出版社,2010.