999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“互聯網+”雙創大賽信息推薦集成模型研究

2024-04-29 00:00:00羅駿龐建華
科技創業月刊 2024年2期
關鍵詞:互聯網

基金項目:四川省科技廳軟科學計劃“成渝地區雙城經濟圈高校聯盟科技創新協同戰略研究”(2021JDR0071)

作者簡介:羅駿(1965-),男,四川大學公共管理學院教授,研究方向:知識管理與競爭情報;龐建華(1998-),男,四川大學公共管理學院碩士研究生,研究方向:知識管理與競爭情報。

摘" 要:“互聯網+”雙創大賽是推動大學生創新創業的重要途徑,然而隨著大賽的蓬勃發展,參賽者很難在海量數據中高效獲取所需信息。為此,提出構建一種信息推薦模型,以完善“互聯網+”雙創大賽的信息服務研究,為選手提供有用的大賽信息,幫助他們了解競爭對手、理解市場和行業,提高項目的競爭力。在調研四川大學“互聯網+”雙創大賽信息服務現狀與用戶需求的基礎上,構建了集成Doc2Vec和LDA算法的“互聯網+”雙創大賽信息推薦模型。經檢驗,該模型能夠較好地進行“互聯網+”雙創大賽信息推薦服務。最后提出了下一步研究構想。

關鍵詞:“互聯網+”;大學生創新創業大賽;信息推薦;信息服務;Doc2Vec;LDA

中圖分類號:G649.2

文獻標識碼:A

doi:10.3969/j.issn.1672-2272.202307038

Research on Integrated Information Recommendation Model for the China International “Internet+” College Innovation and Entrepreneurship Competition

Luo Jun,Pang Jianhua

(School of Public Administration, Sichuan University,Chengdu 610207,China)

英文摘要Abstract:The China International “Internet+” College Innovation and Entrepreneurship Competition is an important way to promote college students' innovation and entrepreneurship. However, with the development of the competition, it is difficult for participants to efficiently obtain the required information from the massive data. Based on this, this paper proposed an information recommendation model to improve the information service research on the competition, and help participants understand competitors, the market and industry, and improve the competitiveness of the project by providing useful competition information. Based on the investigation of the information service status of the competition in Sichuan University and the needs of participants, this paper built an integrated information recommendation model based on Doc2Vec and LDA algorithms. After testing, this model can be used for information recommendation service of the competition. Finally, this paper summarized the conclusions and contributions of the research, and puts forward the conception of the next research work.

Key Words:“Internet+”; College innovation and entrepreneurship competition; Information recommendation; Information service; Doc2Vec; LDA

0" 引言

2021年10月國務院辦公廳印發的《關于進一步支持大學生創新創業的指導意見》指出,中國國際“互聯網+”大學生創新創業大賽(以下簡稱“互聯網+”雙創大賽)中的項目團隊存在融資困難、創業經驗匱乏、缺少創業引導等諸多問題,高校需要加強服務平臺建設,加強大學生創新創業信息服務,加強信息資源整合,優化大學生創新創業環境[1]。

“互聯網+”雙創大賽是目前規模最大,影響最大的大學生創新創業競賽。據統計,8屆“互聯網+”雙創大賽累計有3 643萬名大學生報名參賽,產生了約800萬個的創新創業項目,積累了大量的項目知識和情報。但隨著數據量的爆炸式增長,參賽者難以有效地找到所需信息,同樣遭遇 “信息過載”及“信息迷航”的問題。

目前對于“互聯網+”雙創大賽的已有研究主要集中在大賽本身[2-4]、參賽項目[5-6]、參賽團隊等方面[7-8],以及探尋高校圖書館等信息服務主體為大學生提供的雙創服務現狀[9-11]和對創新創業項目信息管理系統平臺建設[12-13]。雖然有學者提出學生普遍存在對比賽認知不到位、對創新創業認知不夠的問題,建議為學生提供更多的信息服務,但是對于如何在大賽中為學生提供信息服務目前尚未有成熟的研究成果,且此類研究鮮有涉及雙創個性化信息推薦服務。

本文結合目前的信息推薦技術發展,以四川大學為例,了解師生在“互聯網+”雙創大賽中實際需求,收集整理創新創業相關信息,采用基于Doc2Vec和LDA集成的內容推薦算法設計并實現“互聯網+”雙創大賽信息推薦模型。將推薦算法應用在“互聯網+”雙創大賽中,一定程度擴展了推薦系統的應用研究,也擴展了大學生創新創業信息服務的研究對象。

1" 需求分析

通過調研和訪談第八屆“互聯網+”雙創大賽參賽學生,本文發現學生主要存在項目信息、組隊信息和大賽新聞方面的信息服務需求。其中,創新創業項目信息包括高校的歷屆參賽項目信息以及全國歷屆獲獎項目信息,推薦歷屆獲獎項目可以讓參賽選手了解到前人的成功經驗和創新創業思路,從而在自己的項目中借鑒,是用戶需求最多的一類信息。

截至2022年第八屆“互聯網+”雙創大賽結束,全國大學生創業服務網共收錄了上百萬個項目信息,但是該平臺的檢索功能十分單一,并且搜索結果的排序是固定的,學生很難在短時間內找到需要的項目信息,而學校也并未向團隊提供系統性的獲獎項目信息。

四川大學主要通過微信公眾號、官方QQ群以及學校官網等渠道來為學生提供的“雙創”信息服務,服務內容主要包括發布大賽通知、活動預告以及成員招募等信息。學校雖有提供組隊和大賽新聞方面的信息服務,但由于缺乏專門的創新創業信息平臺,且這些活動的宣傳渠道較為獨立,使得信息資源分布零散,其服務效果并不理想。

本文構建的“互聯網+”雙創大賽信息推薦模型主要包含了獲獎項目、團隊招募、大賽新聞等方面的信息推薦內容。

涉及的數據均為文本數據,因此使用基于內容的推薦算法模型來構建“互聯網+”雙創大賽的信息推薦模型。需要對待推薦實體進行向量化處理,對不同實體的向量模型進行相似度計算,根據相似度形成最終的信息推薦列表。

2" 數據獲取與預處理

2.1" 項目信息獲取

“全國大學生創業服務網”是“互聯網+”雙創大賽的官網,是最權威的信息發布平臺。本文利用Python,根據歷屆獲獎項目名單,逐條爬取獲獎項目的項目名稱、項目概述、所屬領域、所在地,并在這4個屬性信息基礎上,人工添加每個項目的所屬學校、獲獎情況等信息,共爬取5 338個獲獎項目信息。部分獲獎項目數據如表1所示。

2.2" 數據預處理

由于數據集中項目名稱信息常用高度抽象化的精簡表達,所以本文選擇項目概述信息進行向量建模。而項目概述信息是長文本,因此需要先進行分詞處理。本文使用基于統計詞典的分詞方法,利用python里的jieba中文分詞工具包進行分詞。使用的通用停用詞表由將四川大學機器智能實驗室停用詞庫、哈工大停用詞表、中文停用詞表、百度停用詞表去重后得到。此外,由于使用場景是“互聯網+”雙創大賽,“團隊”“項目”“公司”“市場”等與創業有關的詞語都會多次出現,但是它們沒有實際含義,所以本文將這些詞放入專業停用詞表,以減少數據噪音。

3" 項目概述文本向量化

3.1" 構建Doc2Vec向量模型

Doc2Vec算法是一種用于將文本數據表示為向量的算法,其可以獲得句子、段落和文檔的向量表達,是Word2Vec的拓展。本文在獲取文本數據并對其進行分詞、去停用詞等預處理之后,利用Doc2Vec中的PV-DM方法對文本進行了向量模型構建,具體參數與結果分別如表2、表3所示。

3.2" 構建LDA向量模型

LDA模型可以將文檔聚類到不同的主題中,模型采用貝葉斯網絡進行訓練,由“文檔—單詞—主題”三層構成。文檔是LDA 模型的基本單位,被表示為一個單詞序列,每個單詞屬于某個主題。主題是概括文檔內容的一種方式,是詞的概率分布。采用LDA模型進行主題建模,首先需要確定主題數量K的值。本文使用一致性作為評價指標,經實驗確定主題數K=10時一致性較高,且聚類結果較為理想,故采用主題數K=10對文本進行主題挖掘,其他模型參數的設置如表4所示。

確定主題數后,LDA模型可以通過學習完成主題聚類,將文本中的詞匯歸納到對應的主題下,實現對文本集的主題挖掘。如表5所示,對歷屆獲獎項目的簡介進行主題聚類,根據每個主題所包含的詞項,可判斷該主題下的文本描述的大概內容。如主題1包含“學生 培訓 課程 教學 校園”等詞語,說明主題1包含許多與教育教學相關的項目;主題2中有“智能 數據 機器人 智慧 算法 軟件”等具有明顯含義的詞語,因此可推斷主題2應該有許多與人工智能、軟件開發相關的項目;主題3包含“治療 患者 醫療 醫院 診斷 疾病”等詞項,可推測主題3下是有關于醫療健康方面的項目。

4" 項目間相似度計算

相似度計算是構建“互聯網+”雙創大賽信息推薦模型構建的重要一步。常用的相似度計算包括余弦相似度、歐幾里得距離、皮爾遜相關系數以及JS距離。由于余弦相似度適用于各類空間向量的計算,因此選擇余弦相似度作為Doc2Vec向量模型的相似度計算。LDA模型本質上是一種概率模型,將文本表示為概率分布,而JS距離是一種度量概率分布相似度的方法,因此其適用于LDA主題模型的相似度計算。

4.1" 余弦相似度計算

使用Doc2Vec模型對文本信息進行建模獲得向量模型后,本文通過計算兩個文本之間余弦相似度來判斷它們的相似程度并進行推薦。最終形成維度為5 338×5 338的項目相似度矩陣。

4.2" JS距離計算

通過LDA主題模型對項目簡介進行主題建模后,可以得到項目-主題矩陣,本文使用JS距離計算每個項目在K維主題上的占比情況得到項目間的相似度矩陣。JS距離的取值范圍為[0,1],距離越接近0則項目之間的相似度就越大,在計算文本相似度時,通常使用相似度而不是距離來表示文本之間的相似性,因此本文使用1-JS距離來代表相似度。最終形成維度為5 338×5 338的項目相似度矩陣。

4.3" 加權相似度計算

即通過實驗確定賦予JS相似度和余弦相似度的合適權重,將兩種度量方法的相似度值結合,以改善推薦效果。

本研究采用加權相似度計算方法,經過多次實驗,確定了基于LDA與Doc2Vec的相似度值的最終權重分別為0.45和0.55。通過加權相似度公式計算獲得項目間基于余弦相似度和LDA模型的相似度矩陣,維度仍為5 338×5 338,前10個項目的加權相似度矩陣如表7所示。

5" 各算法推薦效果檢驗

為了驗證本文提出的算法是一種高效、準確的推薦方法,本文采用真實的參賽項目數據集進行實驗,對比分析實驗如下:

第一種推薦方法使用LDA對項目簡介信息建模并基于JS 距離計算相似度。

第二種推薦方法使用Doc2Vec對項目簡介信息建模并基于余弦距離計算相似度。

第三種推薦方法采用本文提出的LDA和Doc2Vec相結合的方法,即將以上兩種方法的相似度結果進行線性相加,形成最終的推薦列表。

最后,采用人工測評的方式判斷推薦結果的準確率,并綜合考慮推薦結果的準確率、穩定性、相似度等來分析判斷各算法的優劣。

本文每次從四川大學歷屆參賽項目中隨機選取1個參賽項目作為測試集計算各算法的準確率,共進行了10次實驗。由圖1可知,基于Doc2Vec算法與混合算法的準確率較高,且波動軌跡幾乎一致;基于LDA的算法的準確率最低,且軌跡與另外兩種算法相差較大;本文提出的Doc2Vec與LDA相結合的算法的準確率最高,不僅遠高于單一的LDA算法,也較于單一的Doc2Vec算法有明顯改良,推薦效果最佳。因此本文選擇的算法能有效提高“互聯網+”雙創大賽信息推薦模型的質量和準確度,可以準確地進行項目推薦。具體的測試項目及其推薦列表分別如表6、表7所示。

6" 結語

針對當前“互聯網+”雙創大賽中,參賽者的個性化信息服務等需求,本文提出了構建基于語義的Doc2Vec與LDA集成的內容推薦方法,并應用于“互聯網+”雙創大賽信息推薦模型,幫助大學生在大賽中高效地獲取信息。實驗證明“互聯網+”雙創大賽信息推薦模型能快速、準確地為用戶推薦所需信息。參賽選手能夠基于此從其他項目中學習和借鑒成功的經驗,也可以進行競爭分析,并把握市場上類似項目的趨勢,從而更好地定位自己的項目和制定更有效的競爭策略。

本文不僅豐富了“互聯網+”雙創大賽的研究內容,也是將信息推薦算法應用于大學生創新創業信息服務中的成功嘗試。但本研究僅是初步嘗試,后續研究還有以下問題需要解決:

由于組隊信息和新聞信息的實際數據量不大,因此本文沒有對組隊信息和新聞信息進行實證研究,僅對項目信息進行了建模。

此外,該模型可以擴展以支持更復雜的信息傳遞系統,后續可以設計實現一個推薦系統網站或者直接將模型搭建在微信公眾號、APP,主動為用戶在參加“互聯網+”雙創大賽的過程中提供信息。

參考文獻:

[1]" 中華人民共和國國務院辦公廳.

國務院辦公廳關于進一步支持大學生創新創業的指導意見[J].中華人民共和國教育部公報,2022(Z1):2-5.

[2]" 吳愛華,侯永峰,郝杰,等. 以“互聯網+”雙創大賽為載體深化高校創新創業教育改革[J]. 中國大學教學,2017 (1): 23-27.

[3]" 梁會青,翁立婷. 中美大學生創業競賽比較[J]. 世界教育信息, 2018, 31(1): 26-32.

[4]nbsp; 蔡晨笑. “互聯網+”大學生創新創業大賽研究[D]. 上海:華東師范大學, 2018.

[5]" 劉慶梅. “Design Thinking”指導下設計專業跨學科雙創人才培養研究——以“互聯網+大學生創新創業大賽”實踐項目為例[J]. 教育教學論壇, 2017 (13): 124-125.

[6]" 滕桂法,張昱婷,劉小利,等. 以“互聯網+”大學生創新創業大賽成功項目論高校創新創業教育體系[J]. 河北農業大學學報(農林教育版), 2017, 19(6): 18-23.

[7]" 張芳.“互聯網+”大學生創新創業大賽項目團隊建設問題研究——以商洛學院為例[J]. 創新與創業教育,2019, 10(1): 70-72.

[8]" 陳濤. 學科融合視角下創新團隊的建設——以中國“互聯網+”大學生創新創業大賽為例[J]. 西部素質教育, 2019, 5(21): 55-57.

[9]" 陳婧,譚豐隆,劉洋陽.高校圖書館創客空間建設路徑研究[J].圖書館,2021(7):77-81,90.

[10]" 劉譯陽, 王崢, 楊雨師. 高校圖書館創新創業信息服務驅動下知識庫構建模式研究[J]. 情報科學,2020,38(2):109-115.

[11]" 何建新,劉信洪. 高校圖書館面向創新創業教育校內協同信息服務研究[J].高等農業教育,2017(3): 21-25.

[12]" 白巖,張志義. “互聯網+、大數據”背景下大學生就業創業能力培養策略及應用系統平臺的建設[J]. 黑龍江科技信息, 2016 (1): 116-117.

[13]" 劉謙,周勁,廷羅晶.大學生創新創業平臺設計中大數據模塊應用分析與設計[J].中國新技術新產品,2022(16):45-48.

(責任編輯:吳" 漢)

猜你喜歡
互聯網
互聯網+背景下數學試驗課程的探究式教學改革
科技視界(2016年21期)2016-10-17 18:47:55
基于“互聯網+”的京東自營物流配送效率分析
科技視界(2016年21期)2016-10-17 18:37:15
互聯網+醫療保健網的設計
科技視界(2016年21期)2016-10-17 17:07:28
試論網絡大環境下音樂作品的法律保護問題
商(2016年27期)2016-10-17 06:43:49
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
淺析互聯網時代維基百科的生產模式
今傳媒(2016年9期)2016-10-15 22:51:03
“互聯網+”環境之下的著作權保護
今傳媒(2016年9期)2016-10-15 22:15:57
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
從“數據新聞”看當前互聯網新聞信息傳播生態
今傳媒(2016年9期)2016-10-15 22:06:04
互聯網背景下大學生創新創業訓練項目的實施
考試周刊(2016年79期)2016-10-13 23:23:28
主站蜘蛛池模板: 国产主播一区二区三区| a级毛片一区二区免费视频| AV网站中文| 国产又粗又猛又爽| 日韩毛片免费| 久久女人网| 国产成人夜色91| 欧美日韩国产成人在线观看| 在线免费不卡视频| 中文字幕免费播放| 九九视频在线免费观看| 色播五月婷婷| 久久99国产综合精品1| 欧美亚洲国产精品第一页| 2020久久国产综合精品swag| 欧美在线网| jizz在线观看| 精品在线免费播放| 国内自拍久第一页| 在线欧美a| 伊人无码视屏| 野花国产精品入口| 国产欧美又粗又猛又爽老| 久久久久夜色精品波多野结衣| 在线精品亚洲国产| 2022国产91精品久久久久久| 久草视频福利在线观看| 国产日韩久久久久无码精品| 999国产精品| 国产欧美另类| 国产极品粉嫩小泬免费看| 新SSS无码手机在线观看| 亚洲福利一区二区三区| 国产在线观看精品| 在线看片免费人成视久网下载| 97久久人人超碰国产精品| 日本欧美视频在线观看| 嫩草国产在线| 久久久受www免费人成| 亚洲精品日产AⅤ| 国产亚洲欧美另类一区二区| 婷婷亚洲最大| 国产成人精品高清在线| www.日韩三级| 亚洲日韩第九十九页| 小说区 亚洲 自拍 另类| 国产高清不卡视频| 伊人无码视屏| 女人18一级毛片免费观看 | 最新国语自产精品视频在| 人妻出轨无码中文一区二区| 国产靠逼视频| 中国黄色一级视频| 国产国产人在线成免费视频狼人色| 国产精品区视频中文字幕| 亚洲综合色婷婷中文字幕| 欧美日韩一区二区三区四区在线观看| 亚洲视频影院| 日韩天堂视频| 国产欧美视频在线观看| 亚洲欧美日韩色图| 成人精品亚洲| 亚洲国产理论片在线播放| 免费观看成人久久网免费观看| 在线毛片网站| 欧美三级不卡在线观看视频| 欧美视频在线不卡| jijzzizz老师出水喷水喷出| P尤物久久99国产综合精品| 亚洲欧美在线看片AI| 国产农村精品一级毛片视频| 91破解版在线亚洲| 重口调教一区二区视频| 国内黄色精品| a网站在线观看| 亚洲国产在一区二区三区| 日韩欧美视频第一区在线观看 | 国产无吗一区二区三区在线欢| 无码福利视频| 91亚洲影院| 亚洲日韩AV无码精品| 国产精品视频导航|