999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PBL的“互聯網+會計”MPAcc大數據分析能力培養

2018-08-09 03:32:46博士生導師王立宇
財會月刊 2018年16期
關鍵詞:可視化文本分析

程 平( 博士生導師),王立宇

一、引言

2017年5月,德勤財務機器人橫空出世。隨后,普華永道、安永、畢馬威等“四大”國際會計師事務所表示也相繼推出自行研制的財務機器人。同年7月,國務院頒布了《新一代人工智能發展規劃》,從國家宏觀層面規劃設計了新一代人工智能未來發展思路及路徑。重慶理工大學作為目前全國唯一的“互聯網+會計”MPAcc深化教育改革單位,為了適應會計發展趨勢和響應國務院人工智能發展戰略,建立了“互聯網+會計”MPAcc人才培養模式,旨在培養深度融合大數據、云計算、人工智能技術的高層次應用型會計人才。

“基于項目式的學習”(Project-Based Learning,PBL),倡導以“問題、案例、項目”為導向,培養學生的自主學習能力。PBL最早起源于20世紀50年代的醫學教育,在這種培養模式下,導師通常模擬真實的情景進行教學,而學生們需要通過自主探究和合作去獨立解決模擬情景中出現的問題,從而使得他們能夠學習并掌握隱含在背后的科學知識。其與傳統的培養模式有較大不同,最大的不同點在于PBL強調以學生的主動學習為主,而傳統培養模式則以教師傳輸知識為主、學生接收知識為輔。李立等[1]認為PBL教學不僅能使學生自主、獨立地思考,鍛煉其分析與解決問題的能力,更能培養學生的團隊合作意識。在PBL與課堂相結合的教學案例中,劉莉等[2]提出PBL的基本宗旨是促進學生運用在課后自學到的知識,從多個角度分析和解決實際問題,提高創新能力。

目前,隨著各高校與教育專家的不斷探索,PBL已經逐漸與人才的實踐化培養模式相結合,并取得了一定的效果。但是,具體的實踐培養還是多用于工科領域。因此,本研究充分發揮以“問題、案例、項目”為導向的思想,設計基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型,并且實際應用到重慶理工大學“西部地區財務人員薪酬研究”項目中。

二、PBL與“互聯網+會計”MPAcc大數據分析能力培養的契合

“互聯網+”時代帶來的沖擊使得MPAcc研究生不得不面對其所帶來的信息化挑戰,包括在財務分析與決策中靈活應用大數據、云計算等新技術。不少高校也對如何培養研究生的大數據分析能力進行了實踐探索。大數據本質上是數學與計算機工程的結合體[3],可以在生動地輸出理論知識的同時,提供給學生一個親自動手操作的機會[4][5]。在PBL培養模式中,導師不再是知識傳輸者,而是作為MPAcc研究生的設疑者、激勵者、引導者、評價者。研究生作為PBL的主體,從被動地接收知識到充分發揮主觀能動性,在實施項目的過程中不斷地培養批判性思維,加深對已獲得知識的理解并學會運用。根據學習成效金字塔理論,學習者在使用不同的學習方式之后知識的留存率差異非常明顯。在學習新知識兩周后,用耳朵聽講和用眼睛閱讀的知識留存率僅為5%~10%。然而,使用小組討論、馬上應用和實際操練的知識留存率可以達到75%~90%。基于PBL的培養模式充分運用了學習成效金字塔理論,使MPAcc研究生在實施大數據項目的過程中充分吸收和消化已經學到的知識,提高對于MPAcc研究生來說原本并不熟悉且晦澀難懂的信息化知識的留存率。因此,PBL可以為MPAcc大數據分析能力的培養提供有效的手段。在“互聯網+MPAcc”這種側重于理解與運用的培養模式中,將PBL與大數據分析能力培養相結合,將開創交叉領域中信息化能力培養的新思路。

三、基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型介紹

“互聯網+會計”所需的大數據分析能力主要分為以下三個方面:

一是數據爬取能力。“互聯網+”時代千萬GB的數據非常普遍,及時爬取海量的會計信息是“互聯網+會計”大數據分析的第一步。MPAcc研究生需要掌握的不僅是傳統爬蟲,還有聚焦爬蟲。其工作流程較為復雜,需要根據一定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的URL隊列。然后根據一定的搜索策略從隊列中選擇下一步要抓取的網頁URL,并重復上述過程,直到達到系統的某一條件時停止。此外,整合清洗爬取到的數據、創建與管理數據庫也是MPAcc研究生所必備的基本能力之一。

二是文本挖掘能力。大多數會計信息是文本非結構化數據,而計算機無法像人一樣理解自然語言,因此需要對文本進行深層挖掘,從海量的會計信息中提取有用的結構化數據。

三是數據分析與可視化能力。運用算法分析結構化數據,更好地發揮會計的預測、計劃、決策、控制、分析、監督等功能。“互聯網+”時代千萬GB的數據導致傳統的數據分析技術手段已無法適用,靈活運用機器學習算法就成為MPAcc研究生進行相關數據分析最為關鍵的一步。分析完成后,將分析結果進行科學計算可視化,即將復雜的多維數據分析結果生成圖像。圖像可以幫助決策層快速理解分析結果,并以此來實現輔助決策的功能。

在PBL培養模式的基礎上,以“互聯網+會計”MPAcc所需要的大數據能力培養為中心,設計了基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型,如圖1所示。

在圖1所示的培養模型中,以階段任務的循環為主線。在階段任務的執行過程中,數據爬取與清洗、預處理與文本挖掘以及分析與可視化分別為一個整體。首先,項目導師介紹項目的具體內容和基本情況,MPAcc研究生可以通過小組討論、與導師進行交流探討,確定相應的項目實施方案,預估項目完成期限,并明確項目目標。其次,將項目分解成若干階段任務,并在執行階段任務前將項目參與人員分為數據爬取與清洗小組、預處理與文本挖掘小組以及分析與可視化小組,每個小組負責一個大數據分析部分。接著,在階段任務執行中,三個小組并不是獨立進行的,需要互相監督、反饋,保證進度上的一致性。最后,在階段任務驗收環節,各小組應及時在會議上完成各自的任務匯報,導師根據匯報情況和平時表現進行考核評價。結束某一階段任務后,三個小組輪換各自負責的大數據分析內容,開始下一階段。

該培養模型充分融入了以“問題、案例、項目”為導向的思想,把大數據項目作為最終目標貫穿全局,通過實際參與項目的體驗式學習提高MPAcc研究生大數據分析能力。PBL模式與傳統模式的最大區別在于項目參與人員即MPAcc研究生在整個過程中成為了主角。會議的大部分時間用于小組成員展示與交流成果,留下少部分時間給項目導師考核、評價和總結。小組成員更多地采用翻閱參考書、觀看視頻和小組討論等方式尋找項目實施的具體方法。小組之間的競爭可以促進良性學習氛圍的形成,增強各個組員參與項目的積極性。

圖1 基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型

四、基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型在項目中的應用

重慶理工大學會計學院在2017年對MPAcc研究生開展了“西部地區財務人員薪酬研究”大數據項目,旨在培養MPAcc研究生的大數據分析能力。在該項目的成功實踐中,培養模型逐漸成熟,并且與傳統教學效果相比,大數據分析能力有了顯著的提高。

1.“西部地區財務人員薪酬研究”項目準備。為了能激起MPAcc研究生對信息化領域的興趣,并且迅速培養他們的大數據分析能力,此次大數據項目以“西部地區財務人員薪酬”為主題。該主題不僅可以讓MPAcc研究生了解當前社會背景下財務人員的薪酬狀況,而且能激起他們的興趣并積極投入到項目中。第一,在項目的準備階段,首先由項目導師闡明此次項目的基本情況,分別從前十位的招聘網站爬取各個財務崗位的招聘信息,包括職位名稱、公司名稱、薪酬區間、工作地點、崗位職責等,接著進行數據清洗和數據庫的整合,然后對文本進行預處理,并對整理好的結構化數據進行算法分析,最后對分析結果進行可視化處理,編寫項目成果報告。第二,導師和MPAcc研究生積極互動,根據他們的實際情況確定項目的完成期限,并介紹大數據分析工具Python。第三,項目導師將項目中的十個招聘網站進行分解,具體分成三個階段任務。第一個階段任務是分析智聯招聘、趕集網和獵聘網的西部地區財務人員薪酬數據,第二個階段任務是分析58同城、卓博人才和中華英才的相關數據,第三個階段任務是分析51job、大街網、拉勾網和看準網的相關薪酬數據。分解成三個階段任務也便于三個小組輪換負責,從而讓每個小組的成員都熟悉每個部分的具體操作方法。

2.“西部地區財務人員薪酬研究”項目實施。Python是項目實施中最主要的工具。它不僅具有代碼簡潔高效、易于上手編寫的特點,而且擁有豐富強大的第三方庫。Python第三方庫免費開源,擁有各種強大的功能,例如網頁爬取、Scrap框架、機器學習算法分析、OCR圖像識別等。因此,MPAcc研究生在項目準備與實施的間隙,就能很快地理解Python代碼。另外,MPAcc研究生在學習的過程中,側重點并不是編寫代碼本身,而在于第三方庫的代碼運用,能夠利用第三方庫完成三個部分的核心技術任務,降低人力物力耗費,提高完成效率。

(1)階段任務計劃。首先,對整個大數據項目從功能角度進行分解,分解為數據爬取與清洗、預處理與文本挖掘以及分析與可視化三個部分。然后,MPAcc研究生們依次選擇自己感興趣的部分,每個部分形成一個項目小組,并且投票推選出組長。最后,每個小組在正式實施項目前,需要確定任務計劃書。例如,在第一個階段任務計劃中,數據爬取與清洗小組就需要對如何學習第三方庫做出計劃,包括尋找學習視頻、查閱文獻等相關安排,由組長牽頭,分配不同的學習任務。利用實際參與項目的體驗式學習,使學生在實施過程中有代入感和責任感。在計劃制定過程中,大多采用的是小組自由討論的方式,不僅培養MPAcc研究生自主學習規劃能力,而且增強了團隊合作意識。

(2)基于PBL的數據爬取能力培養。數據爬取主要分為理解網頁源代碼、提取網站上的結構化與非結構化信息和利用數據庫整合清洗三個步驟,該部分的能力培養流程如圖2所示。

圖2 數據爬取能力培養

因此,在這個部分的學習與應用中,MPAcc研究生不僅可以熟練掌握相關第三方庫代碼,并且能熟悉網頁結構以及數據庫的設計。

爬取數據對于MPAcc研究生來說是第一能力。小組成員需要查閱大量資料來了解網頁結構,包括網頁的HTML結構語言、CSS樣式語言和JavaScript功能語言,以及網絡服務器原理和Socket編程。在此基礎上,爬取小組利用Python第三方庫Beautiful?Soup來進行網頁解析,提取結構化數據與文本數據。例如,在爬取智聯招聘崗位信息的時候,需要對網頁源代碼進行分析,找出HTML結構標簽,再使用BeautifulSoup解析和提取其中的信息。

提取完原始數據后,數據爬取小組的工作并沒有結束,還需要將它們全部匯總導入至數據庫SQLite或者Oracle中。在導入原始數據的同時,小組成員編寫數據字典做數據維度分解,以便于靈活地處理海量數據。之后,該小組使用數據字典對大規模數據進行清洗,去除殘缺、重復的數據,減少噪聲與干擾數值,糾正數據的不一致。數據爬取與清洗板塊是整個分析過程中最重要的一個步驟,MPAcc研究生能將學到的知識與網頁解析、數據庫構建進行充分結合,提高爬取數據的能力和熟練掌握數據庫的設計。

(3)基于PBL的文本挖掘能力培養。文本挖掘能力培養的流程如圖3所示。

圖3 文本挖掘能力培養

數據庫整合清洗工作完成之后,文本挖掘小組要根據所要分析的特征維度進行文本提取。文本提取是指對文本的特征項的選取,由于文本帶有主觀色彩,不可避免地會反映人的特定立場與觀點,因此絕大部分的文本數據都不是數據分析需要的,真正有分析價值的只有文本中的核心詞匯。例如,項目小組在分析薪酬與崗位職責關系的時候,某句描述崗位職責的文本信息如下:“首先對數字敏感,能統計各項數據,并做好分析;其次每月月初編制收入月報、進程表、成本月報、考核表等內部管理報表;最后能完成領導交辦的其他工作。”在這個文本信息中,可能真正有數據分析價值的只有“統計分析”和“報表”。因此,如何提取出有利用價值的信息成為文本挖掘工作最關鍵的一步。

文本挖掘是自然語言分析的分支,因此小組成員需要查閱有關自然語言分析的基礎理論知識,例如語義分析、語料庫的建立、語言模型等。部分自主學習能力強的組員及時地幫助基礎差的組員,采取小組內部討論的方式,提高學習效率,培養團隊意識。在此部分中,MPAcc研究生會用到Python第三方庫,其中最主要的是NLTK(Natural Language Toolkit)自然語言處理庫和Jieba中文分詞庫。文本挖掘小組通過第三方庫的內置函數進行文本分詞、提取、檢索,為數據分析提供有價值的信息。同時,還要用Python的循環語句和函數創建來進行文本的控制和選擇,熟練掌握文本挖掘的技巧。

(4)基于PBL的數據分析與可視化能力培養。數據分析與可視化能力培養的流程如圖4所示。

圖4 數據分析與可視化能力培養

數據分析與可視化小組在使用Python算法工具處理之前,需要復習概率論、矩陣線性代數、統計學等相關數學知識,并在此基礎上學習機器學習算法,包括決策樹分類、K均值聚類、Hmm模型、樸素貝葉斯等。機器學習算法不僅可以分析項目中的薪酬數據與各個特征維度的數量關系,而且是財務智能化的核心研究內容。在大數據背景下,機器學習算法儼然成為了會計專業學生必備的核心技能。

用于數據分析與可視化的Python第三方庫包括Numpy、Pandas、Scikit-learn、Matplotlib等,NLTK中也有關于機器學習的算法模型。其中,Numpy是科學計算模塊,提供了Python中沒有的矩陣對象,支持大規模矩陣運算、矢量運算、傅里葉變換等。Pandas是基于Numpy的數據分析模塊,提供帶標簽的數據結構和大量標準數據模型,是高效操作大型數據集所必備的工具。Scikit-learn是機器學習算法模塊,其主要功能分為分類、回歸、聚類、數據降維、模型選擇和數據預處理六大部分。Matplotlib是科學計算可視化模塊,可以將分析結果以各種圖形形式展示出來。另外,利用科學計算可視化軟件Matlab也能進行圖形處理。

這部分任務難度較高,一方面是因為這部分需要較強的數學分析能力,另一方面是因為其所需的第三方庫較多且代碼復雜,不容易熟練掌握。數據分析與可視化小組需要尋找相關教學視頻、查閱文獻書籍,同時數學基礎好的組員可以積極幫助其他組員,采用自由交流的方式,逐步提高學習效率。通過運用第三方庫的函數,MPAcc研究生可以迅速地建立相關算法模型,導入數據參數,得出分析結果。之后,小組成員運用可視化工具與軟件繪制分析結果圖。在這部分任務的完成過程中,MPAcc研究生在深刻理解算法理論的基礎上,可以逐步提高數理分析能力與作圖能力。

(5)項目進度控制與反饋。項目進度控制與反饋的具體方法如圖5所示。

一般而言,如何調控好項目進度對于身為“監理”的教師來說是一個棘手的問題,需要教師擁有較強的宏觀調控能力,使三個實施小組有機合作。另外,參加此次項目的研究生要及時匯報各自小組的進度,及時提供信息。文本提取小組和數據分析小組需要數據入庫之后才能在Python應用平臺上進行文本挖掘和數據分析,并且這兩部分的背景知識較為復雜,在此之前這兩個小組可以分別先進行理論知識上的學習,等大部分數據入庫之后再分析數據維度、提取文本等。同時,當數據爬取小組完成相應任務之后,可以利用剩余時間學習其余兩部分的理論知識,一方面可以給其余兩組提供幫助,另一方面也為接下來的任務輪換做足準備,從而縮短任務完成時間。

圖5 項目進度控制與反饋

在這個環節中,可以采用舉辦研討會的方式,讓MPAcc研究生自由提問交流。同時,項目導師也需要定期檢查任務完成情況,及時給出評價。在研討會上,一個小組的成員可以向其他小組提出自己的疑問或建議,被提問組負責答疑并聽取他人的建議,由此也可以更好地總結自己組的項目成果。

3.“西部地區財務人員薪酬研究”項目驗收。為了保證每個MPAcc研究生學習的主動性與高效性,更改傳統的課程評分標準也極其重要。項目導師設計了新的評分標準,將個人分數分成小組成績和個人表現分兩大部分,旨在提高MPAcc研究生的積極性與項目參與度。每個小組的成績體現在PPT成果展示、知識點的運用和任務報告上。個人表現分為研討會自由提問交流、課堂上臺展示、回答問題、課后主動性等。依據新的評分標準,能達到公平驗收和促進成員積極參與的目的。

(1)階段任務成果展示與匯報。三個小組的任務成果展示環節是基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型中比較重要的一部分,通過對成果的總結,加深每個學生對知識點的理解。在此環節中,項目導師要求每個小組指派主講人上臺講解PPT和展示小組的研發成果。PPT的講解需要主講人對理論知識的正確理解以及每個第三方庫的熟練應用,因此充足的準備必不可少。在PPT的講解過程中,主講人事先需要對關鍵點有一個比較深入的理解,才能完美展示本小組的任務成果。之后,在編寫任務成果報告的時候,不僅要把結論完美呈現,還需要對每個知識點做詳細解釋,展示運行代碼,便于其他小組成員觀看學習,從而使知識不斷深化,達到靈活應用的目的。

(2)項目總結。項目導師在各個實施小組研討交流提問時進行方法上的引導,對小組成果展示做出中立評價。在有限的時間內,導師更多考慮的是如何指引學生,帶領學生進行深入探究,激起學生對新知識的好奇心。在驗收過程中,把大部分時間交給學生進行成果展示交流,這就需要教師有較強的組織管理能力,能及時地給出評價分數。在整個階段任務即將結束的時候,要先對知識點進行匯總與講解,再安排下一個階段任務,輪換三個小組各自負責的部分,保證各個階段任務之間的有機銜接。

同時,MPAcc研究生在進行項目總結時,需要積極思考在參與項目的過程中所學到的大數據分析知識如何與會計、審計、稅務等專業領域相結合,將大數據工具運用到所學專業。例如,MPAcc研究生可以尋找若干大數據審計案例,通過數據挖掘,發現審計疑點,再通過分散核查,確認問題。此外,MPAcc研究生在學習過程中不僅能培養大數據分析能力,還可以間接地培養大數據思維。后者往往比前者更為重要,“互聯網+”時代數據為王,新型財務部門的基本職能之一就是將各種經營數據歸類、整理、儲存,然后根據戰略、核算、稅務、成本管控、資金管理、績效考核等不同用途提取相關數據、建立分析模型、進行數據校驗、輔助決策。敏銳的大數據思維能幫助MPAcc研究生更好地適應“互聯網+”所帶來的挑戰,這也是大數據項目的最終意義。

五、結論

人工智能的推廣應用預示著復合型財會人才將是未來財會行業需求的主體,具備大數據分析能力和大數據思維已經成了復合型財會人才的基本衡量標準之一。通過對基于PBL的“互聯網+會計”MPAcc大數據分析能力培養模型在具體項目中的實踐和探索,發現基于項目的學習能明顯地提高學習效率,使MPAcc研究生迅速地提高大數據分析能力,并間接地培養大數據思維。同時,該能力培養模型也對其他高校培養MPAcc研究生的大數據分析能力以及信息化應用能力具有一定的借鑒意義。

猜你喜歡
可視化文本分析
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
隱蔽失效適航要求符合性驗證分析
基于CGAL和OpenGL的海底地形三維可視化
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
電力系統及其自動化發展趨勢分析
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 国产99在线| 熟女成人国产精品视频| 色男人的天堂久久综合| 亚洲欧美不卡| 97国产成人无码精品久久久| 黄色a一级视频| 九色视频最新网址 | 日本午夜精品一本在线观看| 久精品色妇丰满人妻| 日韩无码视频专区| 99草精品视频| 伊人久久综在合线亚洲91| 欧美亚洲国产精品久久蜜芽| 国产又色又爽又黄| 亚洲色图综合在线| 在线免费观看AV| 久久永久免费人妻精品| av一区二区人妻无码| 激情乱人伦| 国内视频精品| a欧美在线| 永久免费无码成人网站| 啊嗯不日本网站| 91无码网站| 影音先锋亚洲无码| 无码专区在线观看| 98超碰在线观看| 国产毛片片精品天天看视频| 亚洲婷婷在线视频| 亚洲欧美一区在线| 亚洲AⅤ综合在线欧美一区| 免费在线一区| 中文无码日韩精品| 亚洲成av人无码综合在线观看| 人人91人人澡人人妻人人爽 | 一本一本大道香蕉久在线播放| 香蕉色综合| 国产剧情一区二区| 欧美激情视频二区三区| 国产剧情一区二区| 在线精品欧美日韩| 99精品福利视频| 亚洲成在线观看 | 亚洲黄色网站视频| 国产一区亚洲一区| 精品自窥自偷在线看| 日韩国产精品无码一区二区三区 | 日韩高清中文字幕| 色综合a怡红院怡红院首页| 男人的天堂久久精品激情| 久久综合AV免费观看| 久久香蕉国产线看精品| 久久窝窝国产精品午夜看片| 2021国产精品自拍| 爽爽影院十八禁在线观看| 国产毛片久久国产| 欧美成人a∨视频免费观看| 国产成人亚洲毛片| 精品撒尿视频一区二区三区| 中文字幕中文字字幕码一二区| 最新国产午夜精品视频成人| 中文字幕波多野不卡一区| 四虎国产永久在线观看| 亚洲第一区在线| 青青草91视频| 四虎免费视频网站| 精品国产Av电影无码久久久| 亚洲资源站av无码网址| 男女性色大片免费网站| 欧美劲爆第一页| 国产丝袜无码一区二区视频| 欧美亚洲一二三区| 欧美精品在线看| 天天综合网在线| 国产欧美日韩免费| 成人久久精品一区二区三区 | 97久久人人超碰国产精品| 久久精品一品道久久精品| 免费人成网站在线观看欧美| 老司机精品99在线播放| 国产视频久久久久| 国产成人超碰无码|