999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據項目的成本度量

2021-11-05 18:49:00黃小強吳小慶韓珊
中國新通信 2021年18期
關鍵詞:大數據成本

黃小強 吳小慶 韓珊

【摘要】? ? 大數據技術在近年不斷快速發展,由于其不同于一般業務系統軟件的個性化特點,在數據采集、處理、分發、分析以及呈現等關鍵步驟上和傳統業務系統有較大差異。因此在對大數據項目進行成本度量時,需在通用的成本度量方法上,定制設計針對性的補充規則,從而指導大數據項目的成本度量實踐。

【關鍵詞】? ? 大數據? ? 軟件? ? 成本? ? 功能點? ? ?度量

一、大數據項目成本度量

2018年國家發布了國家標準《軟件工程 軟件開發成本度量規范》。但由于大數據項目的開發與傳統流程型項目的開發有較大區別,因此在使用國家標準進行軟件成本度量的過程中,遇到較多的問題。廣東電網針對大數據歷史項目數據的造價特點進行分析,在國家標準的基礎上對度量方法進行研究,致力于研究出適合大數據項目的度量方法。

二、數據項目成本度量規則

本文對收集到的真實發生的大數據歷史項目數據進行分析研究,開發費用基于軟件開發成本度量規范中推薦的NESMA功能點方法,設計出更清晰、更易操作的大數據項目成本度量規則,實施費用則基于實踐經驗,總結分析后得出。設計出具體的度量規則如下。

2.1數據預處理

大數據項目其中一個特點是數據源的多樣性,可以包含各種類型各種版本的數據庫、文本文件、網頁、日志,甚至包含圖片、視頻信息,也可能包括傳感器、軟硬件接口等信息來源。為確保后續工作能夠有一個高質量的數據集,在數據采集時往往會進行必要的預處理。針對數據預處理的相關成本度量規則如下:

開發費:由于預處理工作本身涉及格式轉換、協議解析、圖形識別等計算過程,因此這些功能應該識別為外部輸出EO;每一個預處理場景識別一個外部輸出,而不可依據抓取數據的字段進行識別;從結構化數據中獲取數據,如從數據庫、確定格式的excel、列表文件中獲取數據,不認可預處理功能項;針對一個數據源的同一數據對象,如存在多處需要進行預處理的信息,僅識別一次外部輸出;針對文本、網頁數據預處理調整因子取值1.2;針對圖形、音頻、視頻預處理調整因子取值1.3。

實施費:預處理的相關數據文件每增加一個,增加0.5人天工作量;預處理的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;預處理的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;預處理的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;如預處理與數據采集同時進行,不單獨計算處理預處理的工作量,在數據采集時進行計算。

2.2數據采集

數據采集時如屬于使用非實時方式進行采集,往往使用ETL工具或程序腳本定期采集數據。而流式采集主要用在實時處理的業務場景,數據采集后就像一個水壩一般將上游源源不斷的數據攔截住,然后根據業務場景作對應處理,之后再寫入到對應的數據存儲中。針對數據采集的相關成本度量規則如下:

開發費:采集數據應識別為外部輸入EI;針對不同的數據對象來確定外部輸入;從不同的數據源頭,采集到相同的數據對象,如果數據源頭的數據格式相同,則不重復識別外部輸入;若不相同,則識別為不同的外部輸入;使用工具,通過配置方式進行數據采集時,調整因子取0.5;使用程序腳本進行數據采集時,調整因子取0.8。

實施費:采集的數據文件每增加一個,增加0.5人天工作量;采集的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;采集的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;采集的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;如預處理與數據采集同時進行,不單獨計算處理預處理工作量,在數據采集時進行計算;流式采集數據實時處理完成,不計算額外采集所產生工作量。

2.3數據處理

常見的數據處理包括對數據存儲的常規管理,以及數據清洗、數據歸集、數據轉換、數據規約等過程。 針對數據處理的相關成本度量規則如下:

開發費:用于記錄數據對象的文件信息,如元數據、數據源頭等文件應識別為內部邏輯文件ILF;針對數據對象記錄文件的新增、刪除、修改等改變記錄信息的功能應識別為外部輸入EI;針對數據對象記錄的查詢應識別為外部輸出EO;針對數據對象或元數據的詳情查看應識別為外部查詢EQ;數據的清洗過程,包括缺省值、錯誤值檢測、去重、不一致檢查等,應識別為外部輸入EI;數據歸集的各類方法,包括同名異義、異名同義、單位不統一、容易屬性識別等,應識別為外部輸入EI;對同一數據對象的多種方法處理,不應識別多個外部輸入EI。

實施費:需要處理的數據文件每增加一個,增加0.5人天工作量;處理的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;處理的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;處理的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;實施費用,不可因為分成多次處理,重復多次計費。

2.4數據分發

數據分發主要指數據通過網絡傳遞到不同節點的過程。針對數據分發的相關成本度量規則如下:

開發費:為完成數據分發目的,專門創建的對外發送文件可以識別為內部邏輯文件ILF;為完成數據分發目的,專門開發的程序接口可以識別為EO;通過ETL工具完成數據的分發,識別為EO,調整因子取0.5;如果是用開放數據權限,讓獲取方直接使用數據對象,則在當前應用的角度無需對功能點進行計數,而是應在主動獲取的應用角度計數相關開發功能。

實施費:分發的數據目的地每增加一處,增加0.5人天工作量;分發的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;分發的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;分發的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算。

2.5數據分析挖掘

數據分析挖掘是大數據應用體系中的關鍵支撐環節,是指從大數據中發現潛在未知的信息和模型的分析計算過程。針對數據分析挖掘的相關成本度量規則如下:

開發費:分析建立的模型記錄信息,識別為內部邏輯文件ILF;各類數據分析挖掘算法,包括決策樹分類、K均值聚類、支持向量機分類等算法,使用到每一種算法可以識別為一個外部輸出EO;多個數據對象進行同一個算法分析,不可重復填報算法分析EO。

實施費:數據分析屬于計算機進行的工作,程序調試好后,無需人工參與,不額外計算實施費。

2.6數據呈現

數據呈現類工作,以獲取并處理好的大數據為基礎,通過智能報表、專題報告、BI展示、平臺接口等方式展示應用數據。針對數據呈現的相關成本度量規則如下:

開發費:各類智能報表、專題報告、BI展示、平臺接口等均應該識別為外部輸出EO;針對多個數據對象進行同類的數據呈現,不可重復填報外部輸出EO。

實施費:針對呈現的頂層功能如何使用展開的操作培訓,可根據系統大小及培訓網點數量,按每次培訓0.5`2人天計算實施工作量。

三、驗證結果

基于以上規則的設計,選取本單位3個已發生的大數據歷史項目進行驗證。按照原規則(國家標準《軟件工程 軟件開發成本度量規范》)以及按照新規則(本文新設計的度量規則)評估出的工作量統計,與歷史項目的實際工作量進行比對分析(表1),單位均為人日。

可以看出,按原規則進行評估,其偏差率在-35%~-20%左右。按照本文設計的規則進行評估,更接近實際工作量的數值,偏差率優化為-5%~5%。依據驗證結果可得,本文設計的方法與原規則相比,優化了現有大數據項目成本度量的評估結果,更好地實現大數據項目的項目管理,提升管理的準確性。

四、結語

本文以《軟件工程 軟件開發成本度量規范》為基礎,結合大數據項目特點,設計了大數據項目各主要過程的開發費用、實施費用度量規則,提升了大數據項目成本度量的準確性和有效性,使大數據項目成本度量結果更加符合實際需求。

參? 考? 文? 獻

[1]王元卓, 靳小龍, 程學旗. 網絡大數據:現狀與展望[J]. 計算機學報, 2013(06):3-16.

[2]程學旗,靳小龍,王元卓等. 大數據系統和分析技術綜述[J]. 軟件學報,2014,25(9):1889-1908.

[3]GB/T 36964-2018.軟件過程 軟件開發成本度量規范[S].北京:中國標準出版社.2018.

[4]中國電子技術標準化研究院.2020年中國軟件行業基準數據[R].北京,2020.

[5]李華北. 軟件成本度量及造價分析[M]. 電子工業出版社,2018.

[6]張旸旸.軟件成本度量國家標準實施指南:理論.方法與實踐[M].電子工業出版社,2020.

黃小強(1988.06),男,漢族,廣東廣州,碩士,廣東電網有限責任公司,數字化部主管,高級工程師,研究方向:數字化項目造價管理。

吳小慶(1977.06),男,漢族,廣東廣州,碩士,廣州賽寶認證中心服務有限公司,軟件質量部主任,高級工程師,研究方向:信息化領域成本造價評估、軟件研發成本度量標準等。

韓珊(1991.05),女,漢族,廣東廣州,碩士,廣州賽寶認證中心服務有限公司,軟件質量部技術經理,研究方向:信息化領域成本造價評估。

猜你喜歡
大數據成本
2021年最新酒駕成本清單
河南電力(2021年5期)2021-05-29 02:10:00
溫子仁,你還是適合拍小成本
電影(2018年12期)2018-12-23 02:18:48
鄉愁的成本
特別健康(2018年2期)2018-06-29 06:13:42
“二孩補貼”難抵養娃成本
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
獨聯體各國的勞動力成本
揪出“潛伏”的打印成本
主站蜘蛛池模板: 久久99精品国产麻豆宅宅| 国产好痛疼轻点好爽的视频| 国产在线观看91精品亚瑟| 国产美女一级毛片| 茄子视频毛片免费观看| 色精品视频| 国产精品手机在线播放| 国产精品久久久久鬼色| 男女精品视频| 亚洲国产成人综合精品2020| 99视频免费观看| 高清久久精品亚洲日韩Av| 亚洲精品桃花岛av在线| 国产精品lululu在线观看| 在线欧美一区| 青青久在线视频免费观看| 51国产偷自视频区视频手机观看| 国产91久久久久久| 国产欧美在线视频免费| 国产成人综合欧美精品久久| 国产粉嫩粉嫩的18在线播放91| 亚洲视频在线青青| 波多野结衣久久高清免费| 国产麻豆91网在线看| 亚洲V日韩V无码一区二区| 久草中文网| 成年人免费国产视频| 国产精品久久久久久影院| 欧美国产精品不卡在线观看| 亚洲浓毛av| 手机在线免费不卡一区二| 久久久久人妻一区精品色奶水| 国产欧美综合在线观看第七页| 欧美啪啪精品| 少妇被粗大的猛烈进出免费视频| 国产第八页| 国产一二视频| 久热re国产手机在线观看| a国产精品| 在线免费观看a视频| 亚洲动漫h| 国产精品福利在线观看无码卡| 午夜福利在线观看成人| 91国内外精品自在线播放| 国产精品欧美日本韩免费一区二区三区不卡 | 伊人久久精品无码麻豆精品| 日韩麻豆小视频| 色偷偷综合网| 天天操天天噜| 91偷拍一区| 国产精品亚洲一区二区三区z| 久久无码免费束人妻| 国产成人精品一区二区秒拍1o | 99在线视频精品| 美女被躁出白浆视频播放| 日韩欧美一区在线观看| 精品乱码久久久久久久| 婷婷综合亚洲| 亚洲av成人无码网站在线观看| 在线看片中文字幕| AV熟女乱| av一区二区人妻无码| 欧美日本视频在线观看| 日本黄色a视频| 美女国产在线| 一级做a爰片久久毛片毛片| 国产香蕉在线| 高清无码一本到东京热| 亚洲综合18p| 欧美色综合久久| 永久天堂网Av| 亚洲黄色片免费看| 中文字幕有乳无码| 国产欧美在线观看视频| 亚洲精品波多野结衣| 久久国产免费观看| 免费在线视频a| 91麻豆国产视频| 成人欧美日韩| 中国精品自拍| 欧美在线精品怡红院| 亚洲va视频|