張超寧, 張 瑩, 徐應濤
(浙江師范大學 數理與信息工程學院,浙江 金華 321004)
隨著電子商務的迅速發展,傳統消費模式發生了巨大變化,C2C的消費模式已經逐步取代傳統的實體經濟消費模式,電子商務是目前最具有發展前景的商業模式.在線交易憑借便利、自由等優勢,吸引了大批的消費者.然而,不同于傳統消費模式,C2C電子商務消費模式的交易雙方需要在在線信譽評估數據結果和期望的信譽值之間作出衡量,最終決定是否繼續交易或者放棄交易.
因此,信譽評價對在線交易的成功起到了關鍵性的作用.到目前為止,針對基于C2C平臺的信譽評價模型,眾多學者進行了一系列研究與完善.文獻[1]通過對現有信譽評價模型的分析,概述了當前信譽計算的主要方法,同時提出了信托和信譽系統;文獻[2]考慮到在線業務互動的不確定性,通過對定性和定量指標的全面計算處理,結合層次分析和集對分析給出了信譽評估;文獻[3]著重于信譽模型的風險分析,認為個別交易參與者會利用先前累積的高信譽值進行欺詐行為,為了阻止這些不良行為的發生,提出了在信譽計算模型中引入“移動時間窗口”的概念,利用2個時間窗口分別計算交易參與者的平均信譽值和當前信譽值;文獻[4]考慮了交易雙方在相互評分過程中會存在一定情感誤差,增加了E-Spores模型中對交易價值的考慮,有效避免了一些投機用戶通過銷售低價產品獲得累積的高信譽值,進而進行高價交易的詐騙牟利行為.
在眾多相關文獻中,研究者大多側重對信譽系統的定性分析[5],在一定程度上忽略了對信譽系統的定量分析.
針對目前信譽評價的不完整性,本文著力于信譽系統的定量分析,綜合考慮交易者在交易過程中的信譽投入,并對系統模型進行擾動分析,通過引入全變差函數,提出基于離散時間最優控制的系統信譽評價模型,保證系統信譽的穩定性;最后,進一步分析交易雙方各自的信譽比重,提高信譽系統的可信度.

(1)
式(1)中:k代表離散時間點;M為終端時間點;k=0,1,…,M-1;αi∈R,βi∈R(i=1,2)是既給的常數.

(2)
在交易過程中,可能會出現交易一方通過惡意操作產生虛假的高信譽值,對另一方隱含極大的交易風險.簡而言之,在目標函數中,系統信譽為達既定期望,可能會產生極大脈沖能量.為了阻止此類風險的發生,引入最大信譽增幅約束:
(3)
式(3)中,δ(k)代表k時刻系統的增幅上限.通過數據分析可知,當0≤δ(k)≤0.5時,被認為滿足穩定性條件,本文取δ(k)=0.2.
綜合以上分析,可以構建基于離散時間最優控制的在線信譽評價模型.
對于最優控制系統(1),求解最優信譽投入策略u*使之滿足約束條件(3),并且使性能指標(2)達到最優.
由于最優控制系統(1)中全變差項是非光滑的絕對值函數之和,現有優化方法無法直接求取最優解,所以下面將對此模型進行理論分析與求解.
為了求解上述既給模型,首先考慮以下離散時間動態模型:
x(k+1)=f(k,x(k),u(k)),k=0,1,…,M-1,x(0)=x0.
(4)

首先令U={v=(v1,v2,…,vr)∈Rr;αi≤vi≤βi,i=1,2,…,r},U是Rr上的緊凸子集.記u=(u(0)T,u(1)T,…,u(M-1)T)T,其中u(k)∈U,k=0,1,…,M-1,稱這樣的u為容許控制變量,由所有這樣的u組成的集合為容許控制變量集,記為U.在不引起歧義的情況下,將容許控制變量簡稱為控制變量.若序列{x(k|u),k=0,1,…,M-1}滿足系統方程(4),則稱x(k|u)為對應于控制u∈U的系統的解.
定義1令ui(k)代表在時間k下的第i個控制變量分量,ui(k)的變量差表示為
同時,定義u(k)的全變差公式為
(5)
注2由式(5)全變差表達式的定義知,若u為固定常量,則式(5)的值始終不發生改變,說明全變差為0;若控制變量u未固定,則式(5)的值會發生改變,且改變量越大,說明全變差越大;反之,相反.
下面假設該系統滿足以下終端狀態約束:
φj(x(M|u))=0,j=1,2,…,Ne.
(6)
式(6)中:φj(x(M|u))∈Rn(j=1,2,…,Ne,Ne為等式約束個數,1≤Ne≤N)是給定的實值函數,且同時考慮關于狀態和控制變量的all-time-step不等約束
hj(k,x(k|u),u(k))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.
(7)
式(7)中,hj(j=Ne+1,Ne+2,…,N)是已知的Lipschitz可微實值函數.
定義2所有滿足約束條件(6)和(7)的控制變量u∈U記作F,稱F為可行控制集,稱F上的變量為可行控制變量.
下面給出約束條件控制下的離散時間最優控制問題:
問題1選擇可行控制u∈U?F,滿足

(8)
式(8)中:α≥0表示一個加權常量;Φ0:Rn→R是一給定的實值函數;f(k,5,5)在Rn×Rr上是連續可微的,k=0,1,…,M-1.
由于J1中的全變差項是通過一系列非光滑的絕對值函數構成,所以無法使用現有的標準梯度優化算法解決.下面將通過一種新型的轉化方式,將非光滑問題1轉化為等價的光滑問題.

首先,構建如下控制變量轉換函數:
代入原系統方程(4),可得新的系統方程
y(k+1)=f(k,y(k),ψk(ξ)),
(9)
則?ξ∈R(2M-1)r,式(9)有相對應的解y(5|ξ),除此之外,有以下約束:
Φj(y(M|ξ))=0,j=1,2,…,Ne;
(10)
hj(k,y(k|ξ),ψk(ξ))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.
(11)
令X={ξ∈Z|Φj(y(M|ξ))=0,j=1,2…,Ne;hj(k,y(k|ξ),ψk(ξ))≤0,j=Ne+1,Ne+2,…,N,k=0,1,…,M-1},可得新的最優控制問題2:
問題2對于系統方程(9),尋找一個ξ∈X,滿足
同時滿足約束條件(10)和(11).



定理1假設u*=(u(0)*,u(1)*,…,u(M-1)*)T∈F是問題1的最優解,則ξ*是問題2的最優解,其中ξ*=(u(M-1)*,ν0,*,ν1,*,…,νM-2,*,ω0,*,ω1,*,…,ωM-2,*).
(12)

綜合引理2和定理1可知,問題1的最優解是問題2的最優解;反之亦然.有以下推論:
推論1問題1與問題2等價.
由于問題2的目標函數是光滑的,所以相對于問題1更易取得最優解.基于推論1,若要對問題1進行最優分析,則只需對問題2進行求解.針對于問題2,其受限于終端狀態約束及all-time-step不等約束,為了方便梯度的計算,下面對問題2作近似轉換.
對?j=Ne+1,Ne+2,…,N,問題2的不等約束等價為
(13)
考慮到式(13)是非光滑的,故構建如下約束條件的光滑形式[7]:

(14)
顯然,它是光滑的.

問題2′ 尋找一個ξ∈Xε,使得

引理3若ξε是問題2′的可行控制變量,則ξε也是問題2的可行控制變量.
證明 易證.故略.


(15)

(16)

(17)
推導整理式(15)可得
(18)

(19)
根據引理3和定理2,問題2′可看作是問題2的近似問題.當?ε≥0且ε→0 時,問題2′的解就是問題2的解.下面考慮利用罰函數法對問題2′優化求解.對任意ε>0,θ>0,引入罰函數構造問題2′的增廣目標函數
Jε,θ=J2(ξ)+θgj,ε(ξ).
(20)
式(20)中,θ>0代表懲罰因子.
針對上述問題,具體算法如下:
C-E算法:
給定初始數據:θ>0,L>1,k=1和εk>0;ξ=(γ,ν0,ν1,…,νM-2,ω0,ω1,…,ωM-2).
步驟1:利用梯度算法求解Jε,θ的解,記作x*.
步驟2:將x*代入式(20)檢驗是否滿足約束條件.若滿足,則移到步驟3;否則令θ=Lθ,重回步驟1.
步驟3:若εk在既給的邊界內,則停止計算;否則,令εk+1=εk/L,k=k+1,重回步驟1.
最終,通過C-E算法可得非線性規劃問題的最優解.
本文提出的信譽評價模型符合問題1的形式,根據理論分析,可采用相應的算法求解.下面所給算例均在MATLAB R2013b環境中,通過結合C-E算法和DMISER3軟件進行計算分析.
為了提高系統的準確性,考慮淘寶網上大流量店鋪的信譽評價,本文以“Sleepy Bunny瞌睡兔”這一商家為例,整理分析其2012—2015年信譽變化趨勢,利用線性回歸方法,得出了以下系統方程:
k時刻交易完成后賣家和買家的信譽函數如下:

為了防止某些商家為了提高信譽值進行的惡意操作,將最大信譽增幅上限設置為δ(k)=0.20,進而將交易雙方的信譽值代入,得到以下信譽增幅約束條件:
為了擴大約束可行性,通過對大量數據分析,引入擾動因子Δ=0.05,得到最終約束
其中,k=0,1,…,M-1.利用本文提出的方法,可得到關于交易雙方信譽值變化曲線及最優執行策略,如圖1和圖2所示.

賣家信譽函數;買家信譽函數
圖1 交易雙方信譽值變化曲線


圖2 交易雙方信譽投入變化曲線
取M=30,通過C-E算法,當α=0.01時得到系統最優值g0=6.075 294.通過計算及圖形分析,表明本文提出的信譽評價模型能有效抵抗信譽風險,動態體現雙方信譽變化.