沙 巖
(徐州醫科大學醫學信息與工程學院,江蘇 徐州 221000)
隨著移動互聯網、云計算、物聯網的快速發展,特別是移動客戶端、社交網絡、位置服務(LBS)等信息發布方式的不斷涌現,數據正以前所未有的速度在不斷地增長和累積[1],全球數據在2010年進入ZB時代。IDC監測數據表明,人類自有史以來所有數據量大約每18個月翻一番,全球產生和存儲的數據總量從2009年的0.8ZB(萬億GB)增加到2018年的33ZB,并預計在2025年達到175ZB。
大學生創業能力和水平不斷提升,成就感不斷增強,參與社會主義市場經濟發展、享有社會主義改革成果達到新高度[2]。大學生受教育水平不斷提升。大學生創業之路更加多元化,創業水平和質量進一步提高。同時,數據存儲、互聯網、可穿戴設備、網絡爬蟲等新技術的發展,數據收集變得原來越容易,大學生創業數據出現大爆發的趨勢。
我國全面產業轉型升級為大學生創業賦予了全新的機會。近年來科學技術革命性變化帶來組織模式的重大變革,大數據、云計算和移動互聯網快速發展,使生產組織方式呈現出了明顯的個人化、小規模化、分布化等特征[3]。互聯網和物聯網的高速發展,促生了大量商業運營平臺和產品模式創新。“互聯網+”和大數據在帶來傳統產業結構重構的同時,更催生了無數的商業機會和價值創造空間,它把人重新組織進新的財富創造體系之中[4-6]。大學生創業項目更是如遇春風,盡享組織變革、消費升級帶來的絕好機會。設計、生產、包裝、銷售等活動不再受場所和物理空間限制,極大縮減了管理運營成本和生產要素成本,這些提供了大學生創業的充分條件[7-9]。大學生創業與我國產業升級的多維融合,使大學生創業能力進一步提升[10]。大學生創新創業的微生產、微體驗、微設計等各種小型組織形態,實現了強大的市場網絡效應,為原本生存很難的小微個體生產組織提供了全新的交易和體驗環境,激活了大量大學生創業所需的信息、知識等生產要素[11-12]。帶動了成千上萬大學生創業,涌現出海量的大學生創業案例,其報道出現在形式各樣的社交網絡中。然而我們關注的往往是其蘊含信息的實時性,其創業過程的累計數據價值沒有得到較好利用。如何高效、充分地利用這些海量創業數據,并對大學生創業產生正面引導價值,促進大學生更好更快創業,是我們值得思考的問題。
2015年5月21日教育部下發通知舉辦第一屆中國“互聯網+”大學生創新創業大賽,大賽由教育部與政府、各高校共同主辦的一項技能大賽。從表1可以看出,中國“互聯網+”大學生創新創業大賽從第一屆舉辦開始,參賽高校數量逐年增加,舉辦高校多為雙一流建設高校,此項賽事已成為眾多青年實現創新創業成才夢想的搖籃和青年創新創業“奧斯卡”盛會。

表1 2015—2020年中國“互聯網+”大學生創新創業大賽詳細情況
第八屆中國國際“互聯網+”大學生創新創業大賽2022年4月8日啟動以來,已有281萬個項目、1210萬名學生報名參賽,無論參賽項目數還是報名人數均均成為全國影響力最大的大學生創業大賽,數據如表2所示。

表2 2020—2022年中國“互聯網+”大學生創新創業大賽規模情況
文章選取2020—2022年中國“互聯網+”大學生創新創業大賽項目信息作為數據分析的主要來源,通過網絡爬蟲、數據挖掘等技術實現大學生創業資源數據的擷取、存儲、提煉、處理、集成和分析。從而對大學生創業產生正面引導價值,促進大學生更好更快創業,提高對大學生創業的輔助決策能力。使其更好地參與經濟社會發展、享有改革發展成果,同時為大學生創業提供全面準確的科學依據和決策支持。
網絡爬蟲是一個按照一定邏輯掃描或者“爬行”網頁的程序或者腳本,網絡爬蟲是一種計算機程序,可以根據科學計算、數據處理及網頁開發等方面的需求,在互聯網上進行數據、信息的爬取,高效、精準地進行數據采集[13-14]。基于此,本文結合絡爬蟲的技術原理對大學生創業熱點進行分析。在此基礎上,進行大學生創業數據采集。本文主要抓取2020—2021年中國“互聯網+”大學生創新創業大賽中獲得各類獎項的文本信息,對出現頻率較高的關鍵詞進行描述和可視化表示。
本文利用K均值、EM等聚類算法,針對中國“互聯網+”大學生創新創業大賽積累的大量創業數據建立分群模型,通過分群模型對創業者進行細分,找出有相同特征的金銀牌創業團隊,然后有針對性地進行展示。而且,聚類算法也可以實現離群點檢測,即在對創業數據進行聚類的過程中,發現一些創業團隊的異常數據,據此判斷這些創業團隊是否存在有特點的創業思路。使用C4.5、SVM和貝葉斯等分類算法,針對創業團隊的行為數據,對創業團隊進行等級評定。使用預測相關的算法,對創業能力模型進行建模,建立預測模型,預測創業風險,采取措施保護大學生創業者。使用相關分析找出金銀牌創業團隊的潛在規律,哪些創業模式容易獲得中國“互聯網+”大學生創新創業大賽金銀牌。如圖1所示。
我們現在處在數字經濟時代,數字經濟的影響力和增長點持續增強,以新工科、新醫科、新農科、新文科助力“新農業、新農村、新農民、新生態”建設,引導廣大高校創業者扎根基層創新創業。在全球新一輪信息化浪潮下,云計算、大數據、物聯網、移動通信、人工智能、機器人、虛擬現實……持續發力,信息科技在今后相當長的一個時期內依然是世界經濟社會發展,尤其是中國經濟轉型升級的主要驅動力。利用網絡爬蟲技術,抓取2020—2021年中國“互聯網+”大學生創新創業大賽中獲得銀獎以上的項目文本信息,包括項目名稱、所屬區域、所屬學校及項目負責人信息。利用關聯規則數據挖掘技術,數據分析如下。
從2021—2022年中國“互聯網+”大學生創新創業大賽參賽項目名稱中,共提取了60個熱詞,出現頻率較高的熱詞包含人工智能、信息技術、信息科技、云計算、大數據等。主要的技術方向分為硬件設備研制和軟件及其信息化系統研制,與工程項目緊密結合,更偏重于技術設計實現和未來工程實用。
從2021—2022年中國“互聯網+”大學生創新創業大賽參賽項目中,共提取了10個項目區域熱詞,出現頻率較高的熱詞包含北京、上海、成都、南京等。從這些熱詞上來看,這些區域屬于較發達地區,創意思維、資本成熟度等各類資源都較為齊全。
從2021—2022年中國“互聯網+”大學生創新創業大賽參賽項目中,共提取了10個項目來源高校熱詞,出現頻率較高的熱詞包含電子科技大學、西安電子科技大學、浙江大學等。電子科技大學學子在第七屆中國國際“互聯網+”大學生創新創業大賽取得2金5銀佳績。這些大學有以下特點:強調文理結合和理工融入,本科生教育更強調塑造興趣豐富、人格完整、科學思辨的通識人才,而不是把本科生直接培養成專家;上研究生、爭取出國深造、爭取短期交流交換,出國交換等概率較高。
通過關聯規則數據挖掘分析,在萬物互聯的大數據時代,我國大學生創業把我熱點、項目開發能力較強,能夠緊貼時代需求和社會需要。但大學生創業能力存在區域上的差距和高校之間的差距。可從以下方面提高大學生創業能力,使其更好地參與經濟社會發展、享有改革發展成果,為有關部門提供全面準確的科學依據和決策支持。
健全創業教育體系,提升高校創業氛圍,推進產教融合,搭建大學生創業與企業之間的橋梁。面向“學校+生態”特色人才培養戰略。以學校為中心,企業為生態,校企協同,形成協同育人資源圈,與企業共同打造“校—企”無邊界協同育人新模式,與企業簽訂合作協議,合作開展教育培訓及項目開發,打造實習實訓實踐平臺。在與企業協同構建實訓基地過程中,挖掘社會新需求,深化技術融合、產教融合。
優化高校創業培育體系,培養大學生創業思維。建立“產教融合、雙創育人”培養模式,提升學生創新實踐能力。深化OBE“成果產出為導向”的教育理念,培養產教融合的復合型人才;將綜合課程設計、學科競賽、企業培訓、創新團隊建設納入實踐課程群;鼓勵學生參與各級創新創業活動,切實將學生雙創能力提升放到首位。發揮校企聯盟優勢,促進創新創業成果轉化。
立足大學生創業者成長成才需求,積極引導廣大大學生創業者投入科研創新實踐,搭建創客空間,為大學生創業育人助力,形成學生參與科技創新活動的常態化機制。推進協同育人、促進大學生創新精神、創業意識和創新創優能力的增強。