999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向本科生商務思維能力培養的數據分析課程建設

2019-03-18 05:11:02孔令波
計算機教育 2019年2期
關鍵詞:優化思維數學

孔令波

(北京交通大學 軟件學院,北京 100044)

0 引 言

以2007年斯坦福大學Andrew Ng教授的機器學習公開課[1]的推出為代表,大眾對于人工智能和機器學習技術有了更多的了解和期待,大量以機器學習為核心的創業公司涌現[2]。2015年政府報告[3]提出了“大眾創業、萬眾創新”(首次概括是在2014年9月10日的夏季達沃斯論壇),作為年輕俊杰群體的大學生,創業成了熱門的話題(北京交通大學軟件學院每年都有學生進行創業的嘗試)。2017年政府報告將人工智能(機器學習是其中的核心部分之一,也是數據分析的一部分)首次寫入了全國政府工作報告[4],這更加激發了人們創業的熱情。

另一方面,文獻[5]調查發現,從大的層面看,創業失敗率統計下來是非常高的——95%以上,缺乏商業思維是最主要的原因。早在2005年Gartner 咨詢公司出具的IT 行業調查報告就指出,未來計算機從業人員真正有價值的不再是IT技術本身,而更多地體現為對商務運作的理解和把握[6]。

有鑒于此,對于本科生而言,幫助他們提升商務思維和數據分析能力,是非常有必要的。數據分析可以使學生掌握洞察現象背后的能力;商務思維能夠有助于學生了解評估創業盈利性的套路,使學生能更理性地創業,對安于就業的學生也是有益的:只有了解所在企業的盈利模式,才能有針對性地為企業創造更大的價值,這對學生畢業后的職位晉升也就更有利。

因此,對于當下本科生教育而言,商務思維和數據分析能力應該作為基本素質來培養。然而,如何設置相關的課程呢?是另外開設商務課程,還是在數據分析課程中涵蓋商務的同容呢?筆者以為,在一門課程中以商務思維串講數據分析相關技術,是一個值得嘗試的方式。

1 貫通與綜合:串講商務思維和數據分析的挑戰

在實踐過程中梳理出支持前述整合的課程建設思路,即“貫通與綜合”?!柏炌ā本褪且軌蛘业揭粭l線將相關的概念和算法從理論上落實到實際應用的案例;“綜合”就是為了支持貫通所需要不同學科的知識的整合——這也是近期新工科學科和課程建設的主旨之一[7]。

為此,就不能延續傳統的教學:一本教材(或一組相似教材)講一門課,或在講課中大量采用數學公式,似乎離了數學就講不清楚一樣。

如果延續一本教材講一門課的方式,那么,針對商務思維似乎就只能至少再增設一門課程。可是,對于學分固定、課程緊張的教學課程設計而言,增設一門課程的方式并不經濟。此外,考察現有MBA和經濟管理的課程同容,仍然是在商務的圈子里講解,無法與工科數據分析的相關概念和技術結合起來。

對于以數學推導為主要形式的教學而言,大多沒有貼合學生掌握數學的實際情況——他們對數學的感覺(見到公式,就知道怎么計算和寫程序)往往并不好。自然,如果在教學中能夠幫助學生建立這種感覺,對于學生的后續發展是非常有益的:人工智能的背后,其實就是數學在支撐。但是,挑戰也很明顯:①同容太多,不僅包括MBA的商務知識,也包括機器學習的眾多算法,如何將它們有機地整合在一起是課程建設的主要挑戰;②不能默認學生對數學都有感覺,而應幫助學生能對數學進一步有感悟。

2 課程建設思路

1)以分析和保障商務盈利性為線索整合相關的專題。

本課程想將商務思維和數據分析整合在一起,是因為商務決策是數據分析的一個重要應用。眾所周知,商務決策關心的基本問題就是盈利性,有了創業的思路,如果不能分析清楚可行的盈利模式,那創業失敗的可能性就屬于95%的范圍。

如何分析和保障盈利性,需要關心兩個基本問題:一是目標客戶的篩選,二是產品質量和生產效率/成本。所有相關的決策都需要數據分析的支持,包括統計推斷的同容、數據挖掘/機器學習的諸多算法。這也就意味著可以利用商務來串接相關的數據分析方法。

2)相關數據分析算法的選擇。

有了商務這一串接的線索,另外一個挑戰就是篩選相關的算法,算法有很多,涉及MBA、統計學、數據挖掘/機器學習等,面面俱到肯定是不可行的。為此,采取基本的、具有代表性的算法為授課的主要同容,而將復雜的、需要深入學習的算法作為文獻綜述來講授,引導學生按照自己的興趣去自學。

需要說明的是,為講解相關的數據分析算法,優化論(尤其是凸優化)的同容是必不可少的,是另外一條串接相關算法的線索。

3)以示例來熏陶學生對數學的感覺。

不再以嚴格的數學推導為主要授課方式,而是在必要的數學儲備(比如優化論的簡要介紹)基礎之上,通過展示簡單的例子來幫助學生理解計算的思路,然后進一步從數學形式上來探討改進的可能性。這既有助于學生直觀理解,又能反過來熏陶學生對數學形式化背后直觀性的感悟。

4)以歷史的角度展示相關技術的演化,體會掌握核心技術的重要性。

課程涉及的算法很多,算法的歷史也是非常有趣的同容,包括人工智能的發展(機器學習是人工智能發展的第三個階段[8])、優化論的發展[9-10]、神經網絡的發展(從早期的感知器模型到現在大熱的深度學習諸多框架)[11-12],以及數據管理系統的發展(從文件到數據庫管理系統,再到數據倉庫和大數據)[13-15]等。在講解過程中可以幫助學生更深入地體會核心技術的變與不變,如SQL(Structured Query Language,結構化查詢語言)的解釋與執行在DBMS(Database Management System,數據庫管理系統)、數據倉庫和大數據中都起著重要的作用。

目前,已經過兩輪的本科教學實踐,學生的認同度是很高的,也引起部分學生有針對性地繼續自學深入研討的興趣。

3 授課內容概述

章節安排上,本課程組織了5部分專題,分別是商務思維概述、基于統計推斷的商務決策、優化論摘要、機器學習算法概覽,以及相關數據管理技術(包括數據倉庫和大數據)串講。需要說明的是:①商務的同容自然是第一個出現,從中提煉出來的問題是后續數據分析算法的應用背景;②優化論是另一個串講數據分析方法的線索——主要的數據分析算法(尤其是機器學習算法)都可以歸結為某類優化問題(凸優化)。 此外,雖然線性規劃是凸優化的子集,但其獨特的特性和求解方法與非線性凸優化有很大的不同,所以,不在本課程中闡述線性規劃的同容,僅略作介紹以幫助學生了解;③統計推斷部分主要專注于基于置信度區間進行推斷的同容,包括ANOVA(Analysis of Variance,方差分析)和列聯表等同容,部分可轉換為優化問題形式的同容(如回歸、PCA(Principle Component Analysis,主成分分析)等),剩余同容則歸入后面數據分析部分(降維)。

較為詳細的專題同容概述如下。

1)商務思維概述。

商務活動的主旨就是賺取更大的利潤(盈利性),基于簡單的利潤公式“毛利潤 = 銷售額-已售產品成本”可以直觀地推斷出,為保證利潤就必須以高于成本的價格將滿足顧客需要的產品賣給顧客。

為此,除了產品的質量和成本(會介紹基于活動的成本分析ABC(Activity Based Costing)),分析客戶的購物習慣和模式也是保障盈利性的重要因素,并由此引出許多依賴數據分析的問題。比如,某產品不同設計對銷售的影響(ANOVA)、顧客可以接受的價格的預估(抽樣后計算置信區間)、顧客同時購買物品的組合(關聯規則)、廣告投入與銷售額的關系(列聯表)、預測銷售量(回歸,甚至是時間序列分析)、基于顧客習慣的商品推薦(分類算法),以及顧客的行為是否存在欺詐(異常檢測)等。

這些數據分析方法分散在后續統計和機器學習部分。

2)基于統計推斷的商務決策。

由于數理統計是工科學生必修的數學課程,所以主要采取串講的方式展示將相關的統計方法用于商務決策的問題,包括如何推斷顧客可接受的價格、產品質量控制檢測(基于置信區間和小概率事件的推斷)的原理是什么、投資收益評估(BEP:Break Even Points,保本點;Pay-back period,投資回收期;凈收益以及回報率等),以及產品設計對銷售的影響(ANOVA)等。

數理統計的其他部分方法劃歸到機器學習部分,包括線性回歸和主成分分析等。多元統計和時間序列則作簡要的應用介紹,鼓勵感興趣的同學自己探索。

3)優化論摘要。

如前所述,優化論是另外一個串接數據分析方法的線索:雖然不是直接用于數據分析,但優化論的知識是理解相關算法的基礎。可惜的是,在學院的課程規劃中并沒有設置此課程。網絡上可見的優化論課程,大多延續了斯坦福大學Boyd教授的凸優化課程風格——用嚴格的數學推導來闡釋凸優化求解的思想(極值和最優化條件),這是一般學生難以直觀理解的。

筆者在授課過程中對此作了簡化(不含線性規劃的同容):按照優化問題的3個層次(無約束問題、等式約束問題和包含不等式約束問題)來介紹對應的求解方法。

(1)無約束和等式約束的凸優化問題求解的基本思路就是借助一階和二階(偏)導數相結合來確定極值性質的方式(多元變量時對應一階偏導數和Hessian 矩陣的性質):令一階(偏)導數等于零,然后基于二階(偏)導數來判定是極大還是極小。

此外,對求解的算法也做了講解,涉及梯度下降和牛頓法。諸如擬牛頓法、DFP(Davidon Fletcher Powell)、BFGS(Broyden Fletcher Goldfarb Shanno)等其他算法,只做了簡要的介紹。

(2)針對包含不等約束的凸優化問題,最優化條件是目前解決此類問題最可靠的理論支撐(無約束和等式約束的情況可看作最優化條件的特例),但因其理論的難度以及實際求解算法的困難,這部分同容只是做了示例,幫助學生了解而已。想要深入淺出地講通這部分同容只能留待后續自己能力的提升了。

在講解過程中,嚴格的凸優化函數界定等同容是予以回避的,但留出了參考文獻和書目,甚至列出部分視頻供學生進一步學習。

比較欣慰的是,有一些學生嘗試著去閱讀和鉆研凸優化。可惜,他們的反饋都是說那些數學推導是巨大的障礙。這一方面印證了前面關于學生對數學感覺并不好的現象,另一方面也從側面說明基于示例幫助學生學習算法進而感悟數學的方式是有意義的。

4)機器學習算法概覽。

有了優化論的視角,講解相關的機器學習算法就顯得從容許多,因為大部分機器學習算法的計算步驟要依賴優化的思想來理解。

這些算法很多可用于回答商務分析中的關于顧客購物模式的問題,比如所購物品的關聯性(關聯規則)、購買某類產品的顧客具有什么相似的特征(聚類)、如何評估客戶的可能類別(分類)、如何精準推薦顧客可能感興趣的商品(分類)、客戶是否存在欺詐(異常檢測)等。

本課程大致覆蓋了如下的機器學習算法:①回歸,將原屬統計學的回歸問題放在這一部分,主要介紹了線性回歸,著重從優化的角度來理解,以期讓同學體會優化的視角。②降維,數據分析的一個關鍵步驟其實是特征的篩選,降維也就有著獨特的作用。講解了PCA和FA(Factor Analysis,因子分析),對其他降維算法僅僅作了介紹,如ICA(Independent Component Analysis,獨立成分分析)和LDA(Linear Discriminant Analysis,線性判別分析)。③關聯規則,Apriori 算法是必須要講的,以保證在此課程中顧全機器學習算法的完整性。④聚類,主要講解了 K-means和 DBScan(Density-Based Spatial Clustering of Applications with Noise,具有噪聲的基于密度的聚類方法),其他算法僅予以介紹,如CURE(Clustering Using Representatives)、BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies,利用層次方法的平衡迭代規約和聚類)和DENCLUE等。⑤分類,講授Logistic Regression、 決 策 樹、GMM(Gaussian Mixture Model,高斯混合模型)和SVM(Support Vector Machine,支持向量機)等。實際講授時,SVM是作為專門一節來介紹的,主要講解SVM建模的由來和嚴格線性可分情況下SVM的求解。SVM可轉換為凸優化中的QP (Quadratic Programming,二次規劃)問題,有現成的QP求解方法。僅僅如此是不足以領會到SVM理論的嚴謹之美,必須延伸到SMO(Sequential minimal optimization,序列最小優化算法)的同容??墒?,這一套下來,就不太能兼顧淺顯和直白了,所以學生的反饋還是很難。不過,值得欣慰的是,學生的反饋也表明他們對SVM的基本概念和計算步驟還是有了直觀的了解。⑥神經網絡專列一章,在介紹了感知器模型和Logistic Regression后,進一步講解了BP網絡(Back Propagation,反向傳播)、Hopf i eld 網絡等Recurrent 網絡,最后對深度學習中CNN(Convolution Neural Network,卷積神經網絡)做了原理展示。一般介紹神經網絡,除了感知機外,也就是介紹BP網絡。但是,想要理解現在深度學習中的網絡架構,Hopf i eld網絡和Boltzmann機等是必要的。其他諸如LSTM(Long-Short Term Memory,長短期記憶模型)的深度學習網絡架構只是做了概述,留作學生自學的同容。深度學習現在是很受關注的,對它們的掌握絕對是相關從業或研究人員繞不過去的方法,但放在這門課中較為詳盡地闡述在時間上就有些捉襟見肘,所以,只是在那些早期神經網絡模型的基礎上介紹了CNN,其他的深度學習模型沒有展開。建議留有專門的后續課程對此做深入探討。

5)相關數據管理技術串講。

在較為完整地統攬了數據分析的方法后,了解一下對應的數據管理技術的發展,尤其是體會數據管理和數據分析集成的趨勢,所占時間不多,但對于學生宏觀了解IT技術發展是有益的。

相關技術概括為,早期基于文件的數據管理,曾經數據管理的霸主RBDMS(Relational Database Management System,關系數據庫管理系統),數據分析和數據管理首次融合的數據倉庫(數據挖掘可以看做其中的一個處理環節),以及當下仍備受關注的大數據系統。

專題同容的概述見表1,直觀展示專題的同容以及它們之間的相互關系。

4 課程考核

學院是鼓勵所謂的過程考核的,以往采取的方式主要是布置課后作業或項目作為平時成績的依據,但平時成績往往與最后的紙面考試成績有巨大的差異。原因很清楚,那就是讓學生帶回去完成,很難保證學生的自覺性。因此,在實踐中嚴格要求在課堂上布置測試并收集學生的答案。這樣,不僅如實反映學生平時對所授同容的理解程度,還可以幫助教師有針對性地就學生困惑的地方予以重點講解。

此外,原本設想鼓勵學生自主使用Python等開發工具練習算法,但因為這部分沒有計入課程的分數系統,所以,實際情況就是很少有學生去主動完成。這是一個有趣的也是值得分析的現象:現在的大學生是怎樣確定他們的學習興趣?除了分數,如何調動他們學習艱深知識的興趣?

表1 授課內容概覽表

5 結 語

商務思維的重要性,對于現今身處鼓勵創業和創新的社會變革中的大學生而言,是愈加突出的。如何在不增加額外課程的情況下,讓學生能夠通過一門課程對商務思維有所領會,是改革這門課的初心——數據分析課程自然是最好的選擇。

雖然看上去同容很多,但經過深思熟慮,專注于為本科生提供對商務思維和數據分析以宏觀的、歷史的和廣而博的理解,那么課程的建設是可行的。并且,這種方式也得到了學生的認可——出勤率都很高,有一些學生按照給出的線索去學習相關的知識。

實踐中也意識到有不足,總結了一些經驗:①本課程現在是安排大三春季學期,筆者以為有些晚。比較好的選擇是調到線性代數完成后的學期——大二階段;②缺乏配套的實踐課程,不管是常用軟件的使用(Excel和SPSS等),還是編程的訓練(如Python);③一些有趣的專題沒有涉及,比如情感分析、過程挖掘、MDP(Markov Decision Process,馬爾科夫決策過程)和強化學習等;④后續應該有深度學習和大數據分析的課程,這樣才能保證本院的學生能具有更強的競爭力,現在的情況是,很少有本科生能上手大數據相關同容。

機器學習課程建設的思路已經有很多[16-19],與他們不同,本課程的思路是將商務思維與數據分析融合在一起。雖然實踐表明效果還不錯,但對于建設好一門課程而言,這僅僅是開始,今后還需要更為深入的探討和實踐。

猜你喜歡
優化思維數學
思維跳跳糖
思維跳跳糖
思維跳跳糖
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
思維跳跳糖
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
我為什么怕數學
新民周刊(2016年15期)2016-04-19 18:12:04
數學到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
主站蜘蛛池模板: 亚洲国产精品不卡在线| 欧美精品亚洲二区| 欧美三级视频网站| 久久伊人色| 日韩欧美中文字幕在线精品| 性色在线视频精品| 亚洲高清无在码在线无弹窗| 手机精品视频在线观看免费| 精品国产欧美精品v| 中文字幕人妻无码系列第三区| 成人av专区精品无码国产| 成人综合久久综合| 69av在线| 91最新精品视频发布页| 美女高潮全身流白浆福利区| 国产欧美日韩18| 999国产精品永久免费视频精品久久| 片在线无码观看| 国产精品成人AⅤ在线一二三四| 日韩国产无码一区| 一区二区无码在线视频| 亚洲成人在线免费| 日韩精品久久无码中文字幕色欲| 亚洲一区二区成人| 伊人色婷婷| 亚洲国产欧美目韩成人综合| 欧美成人午夜视频| 亚洲清纯自偷自拍另类专区| 亚洲视频色图| 国产毛片高清一级国语 | 亚洲成a∧人片在线观看无码| 国产美女叼嘿视频免费看| 国产成人综合久久| 国产午夜无码片在线观看网站 | 亚洲第一视频区| 毛片免费在线| 亚洲国产亚洲综合在线尤物| 国产成人精品一区二区| 9cao视频精品| 国产精品夜夜嗨视频免费视频| 99久久精品久久久久久婷婷| 911亚洲精品| 国内精自视频品线一二区| 国内99精品激情视频精品| 国产免费久久精品99re不卡 | 国产黄在线免费观看| 国产精品无码影视久久久久久久| vvvv98国产成人综合青青| 97青青青国产在线播放| 亚洲IV视频免费在线光看| 色婷婷丁香| 日本亚洲欧美在线| 真人免费一级毛片一区二区| 国产91高清视频| 成人午夜天| 欧美激情二区三区| 国产精品欧美日本韩免费一区二区三区不卡| 国产精品午夜电影| 欧美人在线一区二区三区| 国产精品3p视频| 在线观看精品自拍视频| 精品久久久久久久久久久| 全免费a级毛片免费看不卡| 高清国产在线| 999福利激情视频| 小13箩利洗澡无码视频免费网站| 国产成人精品午夜视频'| 亚洲国产精品不卡在线| 国产午夜福利在线小视频| 伊人久久精品亚洲午夜| 久久毛片基地| 亚洲av无码久久无遮挡| 国产91熟女高潮一区二区| 亚洲一级毛片| 免费aa毛片| 成年片色大黄全免费网站久久| 97se亚洲综合| 欧美a网站| 国产精品手机视频| 国产日韩精品欧美一区喷| 91无码人妻精品一区| 永久在线播放|