崔鵬 承德石油高等專科學校
基于Apriori算法的大學生早餐數據分析
崔鵬 承德石油高等專科學校
大學生的課程相對其它學習階段較為輕松,但是依然算得上繁重,每天學習新的知識、熟練技能,腦力勞動非常消耗能量,尤其是消耗蛋白質,為了保證學校效果,學生要保證每天能儲存足夠多的營養素。早餐距離前一晚餐的時間最長,一般在12小時以上,體內儲存的糖原已經消耗殆盡,因此早餐是非常重要的,本文利用Apriori算法對大學生的早餐消費信息進行挖掘,以期找到影響早餐的因素。
Apriori算法 高校餐飲 大學生食堂 飲食營養 大數據 數據挖掘
首先需要準備一個有2000份就餐信息的數據倉庫,從中把在時間段6:00至9:00消費為0元以上的數據進行提取,得到數據如表1所示,以文本形式保存后指定給程序,在程序中設置的輸入數據為:最小支持度min_sup=0.05。
表1 學生早餐消費表(限于篇幅此處只展示了八個學生)
然后利用Aprior算法,把在6:00至9:00消費金額為0元的全部置“0”,通過“與”運算獲得K-頻繁集,一旦出現2-項集就可以停止運算了,最終輸出得到關聯規則如表2所示。
表2 有早餐消費記錄學生的關聯規則(此處以五個規則為例)
挖掘結果顯示所選高校的大學生在早餐上有諸多不良飲食行為,主要表現在:首先是不重視早餐,并且早餐質量普遍偏低。從結果上看絕大多數的學生早餐攝取的食物種類不超過兩種,種類單調、營養結構不合理,而且還有部分學生根本不吃早餐;然后是學生食用牛奶及乳制品和水果頻率偏低,油雜食品以及零食攝入過多。最后是存在挑食現象,這類學生數量很多。
除去早餐之外,從大學生的整體飲食習慣所表現出來的差異,通過挖掘結果證明:性別的差異、不同的生源地以及所在專業的不同都有密切關系。女生的飲食習慣相對男生要好,喜歡吃零食是其最需要改正的不良飲食習慣,男生最需要的是去吃一頓豐盛的早餐,并且盡可能少吃宵夜。整體情況來看是來自城市的學生要好于來自農村的,文科專業相比其他是最好的。