999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據在學科評估中的應用研究*

2015-11-22 01:23:20胡慶亮
中國教育信息化 2015年7期
關鍵詞:學科

高 亮,胡慶亮

(上海財經大學 信息化辦公室,上海200433)

大數據在學科評估中的應用研究*

高 亮,胡慶亮

(上海財經大學 信息化辦公室,上海200433)

大數據技術有效解決了學科評估中采集數據的困難,通過建立業務指標和評估指標的對應關系保證了評估指標的兼容性和擴展性,使評估指標體系更容易落地,OLAP技術的應用提高了學科評估工作效率。大數據相關技術在學科評估中的運用改變了以往的工作模式,具有創新意義,實踐證明該技術方案使學科評估實施更加快速、有效。

大數據;學科評估;多維分析

一、現狀及問題

學科建設是高等學校發展的核心工作,是衡量一所高校辦學水平的重要評價標準。如何科學、客觀、準確地評價學科狀態,從而更好地規劃資源配置促進各學科均衡發展是多年來各高校及研究機構的重點研究課題。學科評估的兩個關鍵因素是評估指標體系和基礎數據,到目前為止,學科評估重點研究了評估指標體系及評估方法,并已取得了顯著成果,研究人員提出了多種比較成熟、完善的評估指標體系。但是,目前不論使用哪一套評估指標體系開展學科評估工作時都會遇到許多問題,使看起來完美的評估指標體系并不能順利實施。以下是三個典型的問題:

(1)無法準確、全面、及時地獲取各類業務數據,導致評估結果不夠全面、不夠客觀、不夠準確。

(2)評估指標是對高校業務的抽象描述,無法與具體業務數據直接對應,導致無法直接得到與評估指標對應的評估結果,需要將評估指標轉換為業務標準才能與業務數據準確對應。

(3)目前學科評估主要靠人工收集數據、計算評估結果,基于一套比較復雜的評估指標體系采用人工方法去生成評估結果是一件非常困難的事情,如果要同時生成多套不同評估指標體系的評估報告更是一件不太現實的事情。

本文介紹使用大數據技術充分收集高校業務中與學科相關的結構化、半結構化和非結構化數據,并將半結構化和非結構化數據轉化為更容易分析使用的結構化數據,同時確定數據實體及其間的關系,最終將經過清洗的數據按照統一標準進行存儲。基于標準化的業務數據,充分發揮OLAP技術優勢對學科進行多維分析并生成學科評估報表。

二、大數據解決方案

1.系統架構

基于大數據的學科評估系統框架(見圖1)主要包括:數據源層、數據處理層、數據存儲層和數據分析層。

圖1 基于大數據的學科評估系統架構

(1)數據源層

數據源層是學科評估基礎數據的來源,主要包括分布于各業務系統的結構化數據,系統外的半結構化數據和非結構化數據,如TXT、XML等格式的文本文件。

(2)數據處理層

學科評估基礎數據分布于不同的業務系統,而且數據量大,同時還有系統外的半結構化和非結構化數據,傳統的ETL技術已經無法完成處理任務。Hadoop技術能夠對海量數據進行分布式處理,尤其是處理半結構化和非結構化數據具有先天優勢。數據處理層借助大數據技術對原始數據進行抽取、清洗、轉換,完成數據集成,按照存儲層數據模型重新組織數據,形成能夠支持學科評估的標準化數據。

(3)數據存儲層

數據存儲層是學科評估數據的核心,主要包括業務數據庫、業務指標庫和評估指標庫。業務數據是與學科相關的基礎業務數據,業務指標是指描述基礎數據的維度,評估指標是指不同評估體系中的各類指標。數據存儲層采用數據倉庫維度模型存儲業務數據,這樣更有利于應用層的統計分析。數據存儲層會進行數據的標準化,建立統一的編碼規則,去除冗余和不一致。

(4)數據分析層

數據分析層是學科評估應用的核心。通過聯機分析平臺(OLAP)可以快速生成評估報表并進行多維分析,節省人工計算工作量,并以打印輸出、文件輸出、Email輸出、Web發布等多種方式展現。

2.業務數據模型

業務數據采用星型模型進行數據建模,建模的重點是識別業務實體與學科評估相關的最細粒度屬性,作為業務指標維度,它們將構成業務指標庫,這些指標可以綜合反映業務實體屬于哪一個學科評估指標,其他對學科評估不產生影響的實體屬性可選擇性地保留在模型中,方便進行多維分析。

圖2是以科研論文和科研項目為示例的科研業務數據模型。學科維度來標識論文和項目屬于哪一個學科,論文類型、刊物類型、刊物分區、第一作者類型維度是評估科研論文的業務指標,項目經費、負責人類型、項目類別、項目級別、項目子級別是評估科研項目的業務指標。

圖2 科研業務數據模型

3.評估指標模型

由于目前還沒有統一的、標準化的學科評估指標體系,各高校內部以及各權威機構的評估指標體系都不完全相同,而且經常會有變動,如果每次開展學科評估都將基礎數據與評估指標重新對應,然后計算評估結果是一件非常困難的事情。

鑒于高校內部描述業務實體的屬性相對固定,提取這些屬性作為基礎業務指標,將業務指標與學科評估指標作匹配,這樣業務實體就能對應到具體的評估指標。圖3是以科研論文和科研項目為例設計的評估指標模型,設計說明如下:

圖3 評估指標數據模型

(1)同一類業務數據用于學科評估的屬性可能不完全相同,如縱向項目用項目級別和項目子級別屬性來表示評估得分,橫向項目是用項目經費來表示評估得分,所以業務指標庫要最細粒度,保證能唯一標識所有類別的業務數據。

(2)最細粒度的業務指標可以使評估指標粒度更小、更加科學,從而提高評估結果的科學性和準確性,同時可以滿足不同評估指標與業務數據的對應關系,保證了評估指標體系的兼容性和擴展性。如科研論文評估指標和科研項目評估指標都是基于科研論文和科研項目最細粒度業務指標生成。

(3)評估指標類型標識該評估指標是評估哪一業務,如科研論文、師資隊伍、人才培養等。評估指標體系標識該評估指標對應的是哪一種評估標準,如校內評估指標體系、國內某權威機構評估指標體系、國外某權威機構評估指標體系等。

(4)評估指標中的開始年份和結束年份用來標識該指標的適用范圍,支持生成歷史年份的評估報表,可以比較不同年份的評估結果。

(5)評估得分是對評估指標的量化表示,并不是每一個評估指標都有評估得分,有些統計實體數量的就沒有評估得分,如統計教師數量、學生數量等。

4.學科評估

學科評估的核心工作是按評估指標去匯總各類業務數據、計算評估得分,然后通過不同的維度去分析評估結果。業務系統通過數據共享方式將各類業務指標提供給學科評估系統,學科評估系統管理員根據業務指標靈活設置評估指標、得分、指標對應時間段,業務數據根據業務指標就可以關聯查詢到對應的評估指標,進而可以得到評估得分,最終可以自動匯總數據得到評估報表。以科研項目學科評估為例,計算過程偽代碼如下:

SELECT EXTRACT(YEAR FROM T1.立項日期) AS評估年份

,T4.評估指標體系名稱AS評估指標體系名稱

,T5.評估指標類型名稱AS評估指標類型名稱

,T3.評估指標名稱AS評估指標名稱

,T2.二級學科名稱AS二級學科名稱

,T2.一級學科名稱AS一級學科名稱

,T2.學科門類名稱AS學科門類名稱

,COUNT(T1.項目編號)AS項目數量

,SUM(T3.評估指標得分)AS評估得分

FROM科研項目T1

LEFT JOIN學科T2

ONT1.學科=T2.學科編號

LEFT JOIN科研項目評估指標T3

ONT1.負責人類型=T3.作者類型編號

ANDT1.項目類別=T3.項目類別編號

ANDT1.項目級別=T3.項目級別編號

ANDT1.項目子級別=T3.項目子級別編號

ANDEXTRACT(YEAR FROM T1.立項日期)BETWEEN T3.開始年份AND T3.結束年份

LEFT JOIN評估指標體系T4

ONT3.評估指標體系=T4.評估指標體系編號

LEFT JOIN評估指標類型T5

ONT3.評估指標類型=T5.評估指標類型編號

GROUPBYEXTRACT(YEARFROM T1.立項日期)

T4.評估指標體系名稱

T5.評估指標類型名稱

T3.評估指標名稱

T2.二級學科名稱

T2.一級學科名稱

T2.學科門類名稱

該學科評估系統具有如下特點:

(1)快速部署、靈活維護評估指標。只要建立評估指標與業務指標的對應關系,就可以完成業務數據與和評估指標的關聯,從而可以快速生成學科評估報表。

(2)支持多評估指標體系,可以同時生成基于不同評估指標體系的評估報表,比較不同評估指標體系下的評估結果。

(3)評估指標中的時間屬性滿足在不同時間段使用不同的評估指標,達到保留歷史評估結果的目的。

(4)通過聯機分析(OLAP)功能可以快速計算評估得分并進行多維分析。如可以快速生成基于二級學科、一級學科和學科門類的評估報表。

表1 縱向項目評估指標

三、應用實例和應用效果

1.應用實例

本文選取上海財經大學校內評估指標體系中縱向科研項目評估為例,介紹具體應用情況。表1是根據縱向項目業務指標設置的評估指標,每一個縱向項目能找到對應的評估指標。

圖4是使用數據可視化工具Tableau開發的縱向項目學科評估報表,通過篩選器可以查看不同年份、不同評估指標對應的評估結果,通過鉆取功能可以得到學科門類、一級學科、二級學科的評估結果,達到多維分析的目的。如果有多種評估指標體系,可以同時展現在評估報表內,方便橫向比較評估結果。

圖4 縱向項目學科評估報表

2.應用效果

傳統方法做學科評估需要從各個業務部門采集數據,然后分類、設置評估指標、賦值、計算,需要花費大量時間,生成的評估報表會有數據不準確、滯后性、一次性使用等問題。借助大數據技術保證了采集數據的全面性、準確性和及時性,充分發揮大數據技術分布式處理數據的優勢,減少人工采集、整理數據需要的巨大工作量。OLAP技術可以快速生成學科評估報表,完成多維分析,大大提高了學科評估的工作效率和評估結果的準確性。通過該系統校領導、院系領導、業務部門管理人員可以了解每一學科的評估結果,比較不同學科間的評估差異,觀察同一學科評估結果隨時間的變化趨勢,從而為管理決策提供科學依據。使用該系統我校已經完成了校內2013年學科評估報表,同時支持教育部學科評估上報材料。

四、結束語

借助大數據技術可以很好地解決目前學科評估中采集基礎數據存在的困難;通過提取最細粒度業務指標,并將業務指標作為建立評估指標與基礎數據之間關系的橋梁,可以快速部署不同的評估指標,同時滿足評估指標的擴展性。借助OLAP技術可以快速、靈活生成學科評估報表,并實現多維分析。總之,將大數據、數據倉庫和OLAP技術相結合在學科評估中使用具有創新意義,不僅解決了目前學科評估實施中存在的困難,而且可以使學科評估工作快速、有效實施,對高校開展學科評估具有積極推動作用。

[1]鄭凌鶯,胡守忠,劉月波.地方高校學科評價體系構建探析[J].中國高校科技與產業化,2010(11):20-21.

[2]朱允衛,易開剛.對進一步完善我國一級學科評估的若干思考[J].科研管理,2006(1):156-158.

[3]王向前,崔杜武.高校重點學科評估模型的研究與實現[J].計算機工程與應用,2008(8):232-235.

[4]蔣科兵,黃華偉.運用層次分析法構建重點學科評估模型及應用[J].湘潭大學自然科學學報,2012(3):122-126.

[5]黃曉穎,李亞芬,王普.基于數據倉庫的學科建設決策支持系統的設計[J].計算機工程與設計,2010(23):4995-4998.

[6]舒忠梅,屈瓊斐.大數據時代高校信息管理與決策機制研究[J].華南理工大學學報(社會科學版),2013(6):96-101.

[7]高亮.高校數據倉庫建設研究[J].武漢大學學報(理學版),2012(S1):179-184.

(編輯:王天鵬)

G40-058.1

A

1673-8454(2015)07-0013-04

上海財經大學211專項項目“數據倉庫建設”(項目編號:2012330008)。

猜你喜歡
學科
學科新書架
【學科新書導覽】
學科新書導覽
學科新書導覽
【學科新書導覽】
土木工程學科簡介
【學科新書導覽】
學科新書導覽
關注一流學科
“超學科”來啦
主站蜘蛛池模板: 国产真实乱子伦精品视手机观看| 欧美伊人色综合久久天天| 91精品视频在线播放| 精品国产免费观看一区| 91免费在线看| 色精品视频| 最新国产精品鲁鲁免费视频| 精品一区二区三区视频免费观看| 午夜免费视频网站| 97精品国产高清久久久久蜜芽| 狼友视频一区二区三区| 无码高潮喷水在线观看| 亚洲欧洲日韩综合色天使| 97在线国产视频| 国产极品美女在线| 国产亚洲精| 欧美精品H在线播放| 国产网站在线看| 国产色伊人| 少妇精品久久久一区二区三区| 欧美激情二区三区| 久青草网站| 伊人色在线视频| 91麻豆精品国产高清在线| 亚洲欧美天堂网| 午夜精品久久久久久久无码软件| 狠狠ⅴ日韩v欧美v天堂| 澳门av无码| 天堂网亚洲系列亚洲系列| 精品综合久久久久久97超人该 | 亚洲国产看片基地久久1024| 热久久综合这里只有精品电影| 国产精品七七在线播放| 成人毛片免费观看| 国产精品伦视频观看免费| 久久国产精品波多野结衣| 久久中文电影| 成人免费视频一区二区三区| 亚洲精品麻豆| 国产一区二区三区夜色| 免费无码在线观看| 欧美国产另类| 成人va亚洲va欧美天堂| 真人高潮娇喘嗯啊在线观看 | aⅴ免费在线观看| 国产成人一级| 国产国拍精品视频免费看| 99视频国产精品| 不卡无码h在线观看| 国产精品成| 国产国语一级毛片在线视频| 中文成人在线| 国产欧美精品一区二区| 69综合网| 中文成人无码国产亚洲| 激情爆乳一区二区| 永久免费精品视频| 亚洲中文字幕手机在线第一页| 欧美色视频在线| 在线视频精品一区| 国产在线八区| 亚洲伊人电影| 久久久精品无码一二三区| 国产精品无码一区二区桃花视频| 免费观看精品视频999| 黄网站欧美内射| 亚洲天堂精品视频| 国产av一码二码三码无码| 在线欧美日韩国产| 99er精品视频| 91视频首页| 国产又爽又黄无遮挡免费观看| 亚洲精品大秀视频| 色悠久久久久久久综合网伊人| 精品色综合| 在线看片中文字幕| 国产欧美精品专区一区二区| 亚洲AV无码久久天堂| 动漫精品中文字幕无码| 无码专区国产精品一区| 亚洲AV无码乱码在线观看裸奔| 老熟妇喷水一区二区三区|