999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于樸素貝葉斯的銀行卡批量業務預測方法

2017-11-29 08:28:29羅鳴中國銀聯股份有限公司上海201201
微型電腦應用 2017年11期

羅鳴(中國銀聯股份有限公司, 上海 201201)

一種基于樸素貝葉斯的銀行卡批量業務預測方法

羅鳴
(中國銀聯股份有限公司, 上海 201201)

目前銀行卡批量業務已成為一種比較常見且重要的金融產品,其交易來源于收單機構以結算文件的形式批量上送,對后臺處理系統的性能要求較高。基于樸素貝葉斯理論提出了銀行卡批量業務日最大TPS(每秒交易筆數)的預測方法。利用生產數據在測試環境的回放,得到測試環境最大TPS與生產實際值的回歸關系,進而在測試環境擬合得到大量樣本數據作為訓練集,并取其中的20%數據作為測試集,實際驗證了該方法具有準確度高、魯棒性強的特點。

樸素貝葉斯; 銀行卡批量業務; 每秒交易筆數最大值預測

0 引言

銀行卡批量業務產品可以實現企事業單位從自身單位結算賬戶向持卡人指定銀行卡賬戶進行款項劃付,用與實現商戶賬戶向其用戶之間不同賬戶的跨行資金實時劃轉。目前銀聯批量業務可廣泛應用于各行業,包括但不限于保險賠付及分紅、農資產品收購、薪資發放、財稅庫銀退稅等領域。

批量業務來源主要為收單機構的交易上送,通過銀行卡轉接系統發送到發卡機構,批量交易存在批處理時短時TPS(每秒交易筆數)較大的特點,對于銀行卡交易轉接系統、發卡機構處理系統均存在短時交易壓力增大,從而對系統處理性能提出了一定要求,故銀行卡批量業務最大TPS預測尤為必要。通過對最大TPS的預測,提出對系統的可預期的性能需求,從而指導系統進行架構設計。

樸素貝葉斯方法作為數據挖掘領域的經典算法,在不同的領域有著廣泛的應用場景[1-3]。本文中利用生產數據在測試環境的回放,得到測試環境最大TPS與生產實際值的回歸關系,進而在測試環境擬合得到大量樣本數據作為訓練集,并取其中的20%數據作為測試集,使用樸素貝葉斯方法進行特征項提取,進而求出不同類別出現的概率,取出現概率最大的類別作為TPS預測結果。

1 系統概述

本系統實現包括

(1)樣本獲取:系統中采用機構每日上送文件明細數作為貝葉斯概率計算中的特征項。輸出類別即為每日生產系統上批量應用達到的最大TPS值。為了提高預測的準確性,需要獲取大量樣本值。為此樣本獲取模塊中采用了生產數據回放方法,即將生產數據獲取到測試環境進行回放測試,獲取不同明細數文件上傳情況下的最大TPS值,并與生產實際TPS值進行線性擬合,從而得到大量樣本數據。

(2)樣本文件制作:取特征項為每日機構及大商戶上送明細數,類別為每日最大TPS值。獲取最近一年的數據作為樣本。

(3)系統訓練及驗證:基于Python語言進行代碼編寫。取樣本數據的80%作為訓練集,20%作為測試集,使用樸素貝葉斯方法進行條件概率計算,進而獲得TPS預測值,通過測試集數據驗證預測精度[5-7]。

2 基于樸素貝葉斯的預測系統實現及驗證

2.1 樸素貝葉斯定理

樸素貝葉斯方法[4]即在滿足指定的特征項條件下,求不同類別出現的概率,然后選擇出現概率最大的類別作為預測結果。

根據貝葉斯定理,對一個分類問題,給定樣本特征X,樣本屬于類別Y的概率是:

樸素貝葉斯分類的正式定義如下:

(1)設:X={a1,a2,…,am}為一個待分類項,而每個a為X的一個特征屬性。

(2)有類別集合

Y={y1,y2,…,yn}

(3)計算

P(y1|x),P(y2|x),…,P(yn|x)

(4)如果

P(yk|x)=max{P(y1|x),P(y2|x),…,P(yn|x)}則x∈yk

2.2 預測系統樣本獲取

本預測系統中設X={a1,a2,…,am}為一個特征項集合,表示收單機構1上傳明細數a1、收單機構2上傳明細數a2……收單機構m上傳明細數am。這里收單機構取每日上送交易筆數為200筆以上的機構,因為每日上送200筆以下的收單機構交易對預測結果總體影響可忽略。

設Y={y1,y2,…,yn}為每日最大TPS值,即將每日最大TPS作為分類項。為概率計算的準確性,這里對yn取范圍值,即100-150作為類別1、150-200作為類別2、200-250作為類別3等。

另外為了預測結果的準確,需要足夠大的數據作為貝葉斯條件概率計算的訓練樣本。為此這里樣本的獲取采用生產數據在測試環境的回放得到,即獲取每日生產上各機構上傳文件明細數據后在測試環境進行回放測試,在測試環境模擬各個機構的文件上傳動作,這里模擬上傳的各個時間段及明細數與生產完全保持一致,測試得到最大每日TPS值,然后與生產TPS值進行擬合。通過在測試環境進行大量模擬測試來獲取大量樣本數據,這樣得到的樣本數據可以涵蓋目前生產已存在的及生產上未發生的場景,使得我們的預測結果更準確。

2.3 條件概率計算

這里我們推導條件概率計算過程。為得到每日最大TPS預測值,即目標是計算P(yk|x)=max{P(y1|x),P(y2|x),…,P(yn|x)}

以計算P(y1|x)為例:

根據2.1節樸素貝葉斯的基本定理,可以得到式(1)

(1)

而每個收單機構每日上送的批量交易明細數是相互獨立的,故得到式(2)。

P(X|y1)P(y1)=P(a1|y1)P(a2|y1)…P(am|y1)P(y1)

(2)

am為前述的X的特征向量值。

P(a1|y1)表示某日達到最大TPS值時,收單機構1上送批量交易明細數為a1的概率。

因特征值服從高斯分布即式(3)。

(3)

因此只要計算出訓練樣本中各個類別中此特征項劃分的各均值和標準差,代入上述公式即可得到需要的估計值。把計算結果代入(2)式中即得到P(X|y1)的值,又因(1)式計算各個特征值的條件概率時分母均相同,所以只要計算出P(X|y1)P(y1),P(X|y2)P(y2),…P(X|yn)P(yn)中的最大值,由此得到的最大值即為樸素貝葉斯預測概率。

2.4 預測系統樣本訓練及驗證

這里取樣本數據的80%作為訓練集進行概率計算,20%作為測試集進行結果驗證。鑒于Python語言已廣泛應用與科學計算領域,且提供了豐富的科學計算第三方包。這里我們基于Python的sklearn包進行代碼編寫,實現基于高斯樸素貝葉斯方法的條件概率計算及預測。為了檢查測試集數據預測精度是否準確,為此使用Python sklearn包的classification_report模塊生成預測報告:

PrecisionRecallF1?Score100?1501.001.001.00150?2000.811.000.89200?2501.001.001.00250?3001.000.850.92…………………………………………950?10001.000.950.97

其中第一列為預測值即當日最大TPS。Precision表示正確預測的比例,Recall表示正確識別的比例或稱為真陽性率,F1-Score為precision和recall的調和平均數。實驗證明,使用樸素貝葉斯的預測方法精度滿足需要。

3 總結

本文使用基于樸素貝葉斯理論提出了一種銀行卡批量業務預測方法,通過對系統最大TPS值的預測,為應用系統架構設計提供了性能參數需求依據。

文中介紹了預測系統的功能及實現過程,重點描述了基于樸素貝葉斯的概率計算過程,通過樣本訓練及測試數據的驗證,證明該方法是確實有效的。

[1] Simonetta Balsamo,Antinisca Di Marco,Paola Inverardi,el a1.Model—Based Performance Prediction in Software Development:A Survey[J].IEEE Transactions on Software Engineering,2004,30(5):295-310.

[2] Pedro Domingos,Miehael Pazzzani.On the Optimality of the Simple Bayesian Classifier under Zero:One Loss[J].Mach ine Learning,1997(29):103-130.

[3] 李靜梅,孫麗華.一種文本處理中的樸素貝葉斯分類器[J].哈爾濱工程大學學報,2003,24(1)

[4] Friedman N.Bayesian network classifiers[J].Machine Learning,1997,29(2.3):131-163.

[5] 林士敏,田鳳占,陸玉昌.用于數據挖掘的貝葉斯分類器研究.計算機科學,2000,27(10):73-76.

[6] 張延松,焦敏,王占偉,等. 海量數據分析的One-size-fits-all OLAP 技術[J]. 計算機學報,2011,34(10):1936-1946.

[7] 羅福星,劉衛國. 一種樸素貝葉斯分類增量學習算法[J].微計算機應用,2008,29(6):107-112.

ABankCardBatchServicePredictionMethodBasedonNativeBayesClassification

Luo Ming
(China UnionPay Co Ltd, Shanghai 201201, China)

The bank card batch service has become a more commom and important financial product. The transaction comes from the acquire institution in the form of batch delivery. So high performance requirements for background processing system are proposed. This paper proposes a bank card batch service max TPS (tranction per second) prediction method. We use the production data to be played back in the test environment. And the training set is collected by the test result, twenty percent of the data is used to be the training set. Native Bayes method is introduced to train the classifier. Experiments show that our method has the characteristics of high accuracy and strong robustness.

Native bayes classification; Bank card batch service; Prediction of max TPS (tranction per second)

羅鳴(1982-),男,碩士研究生,工程師,研究方向:運維自動化,數據分析.

1007-757X(2017)11-0079-02

TP311

A

2017.04.21)

主站蜘蛛池模板: 永久免费无码成人网站| 欧美全免费aaaaaa特黄在线| 国产人成在线观看| 九色视频一区| 国产一级毛片yw| 中文字幕调教一区二区视频| av午夜福利一片免费看| 91日本在线观看亚洲精品| 午夜福利免费视频| 亚洲一级色| 亚洲一区二区精品无码久久久| 国产精品视屏| 国产迷奸在线看| 成年人福利视频| 久久久黄色片| 国产精品护士| 色135综合网| 国产玖玖视频| 日韩一区精品视频一区二区| 秘书高跟黑色丝袜国产91在线| 91系列在线观看| 国产欧美精品一区aⅴ影院| 国产人妖视频一区在线观看| 毛片视频网址| 亚洲天堂在线免费| 天天综合亚洲| 99久久99视频| 天堂va亚洲va欧美va国产| 欧美国产菊爆免费观看 | 成年人国产视频| 99re热精品视频中文字幕不卡| 久久动漫精品| 九九热在线视频| 欧美啪啪一区| 久久精品国产91久久综合麻豆自制| 国产精品精品视频| 无码精品国产dvd在线观看9久 | 国产丰满大乳无码免费播放| 亚洲精品动漫| 色成人亚洲| 国产噜噜噜视频在线观看| 日韩 欧美 小说 综合网 另类| 亚洲码一区二区三区| 午夜国产大片免费观看| 亚洲AV电影不卡在线观看| 萌白酱国产一区二区| 99久久国产综合精品2020| 欧美综合区自拍亚洲综合绿色| 亚洲国产高清精品线久久| 日韩免费毛片| 日韩在线观看网站| 永久在线播放| 亚洲视频三级| 欧美日本在线播放| 亚洲 欧美 日韩综合一区| 欧美日本在线观看| 91丝袜乱伦| 伊在人亞洲香蕉精品區| 亚洲系列中文字幕一区二区| 亚洲一道AV无码午夜福利| 台湾AV国片精品女同性| 白浆视频在线观看| 中文字幕va| 欧美精品黑人粗大| 日韩二区三区| 国产9191精品免费观看| 99久久国产综合精品2023| 免费在线色| 亚洲女同一区二区| 国产区在线看| 亚洲欧美日韩久久精品| 97av视频在线观看| 亚洲美女操| 欧美天堂在线| 永久免费无码成人网站| 最新国产网站| 亚洲欧美自拍视频| 97人人做人人爽香蕉精品| 亚洲日韩精品伊甸| 亚洲欧美国产五月天综合| 国产日本欧美在线观看| 亚洲综合在线最大成人|