摘 ?要:伴隨著互聯網技術的應用,連續雙向拍賣機制在商業世界廣泛運用,引發諸多學者對該機制的研究與探索。本文詳細介紹了連續雙向拍賣機制的研究方法、在連續雙向拍賣機制下的算法策略以及人工交互實驗方法,分析了競價策略研究的發展前景。
關鍵詞:連續雙向拍賣;算法;人機交互
拍賣機制是指根據一系列規則競價決定的價格來決定資源配置的市場機制。經典的拍賣機制多為單向拍賣。近年來隨著互聯網的發展,雙向拍賣制度引起了學術界的廣泛關注。相較于“1對多”的單向拍賣而言,雙向拍賣為“多對多”形式,競價雙方均存在多位參與者,買賣雙方是平等的供給與需求關系。傳統雙向拍賣分為連續雙向拍賣與集和競價。連續雙向拍賣市場中,買賣雙方根據市場規則提交報價,一旦市場中出現可成交價格,便立即達成交易,若未達成交易,買賣雙方可調整報價;集和競價市場中,買賣雙方在開放期內根據市場規則自由競價,開放期結束后,使得市場成交數量達到最大的報價成為市場價。兩種機制各有利弊,互為補充,在現實經濟中經常聯合使用,如股票市場,便采用集和競價啟動市場,連續雙方拍賣運行市場。由于連續雙向拍賣機制的動態性和隨機性,連續雙向拍賣市場的競價策略相較于單向拍賣、集和競價更為復雜,受到學術界更加廣泛的關注。
一、連續雙向拍賣市場最優策略的研究方法
(1)納什均衡求解
Chatterjee和Samuelson將博弈論方法運用于雙向拍賣市場中的均衡競價策略研究中,得到了只包含一個買方、一個賣方和一件商品的簡化雙向拍賣市場中的貝葉斯納什均衡策略。Satterthwaite和Williams等人擴展到多個買賣雙方的情形,并證明隨著買賣雙方參與者人數的不斷增加,市場效率逐步提升,雙方報價更加趨近真實報價。Friedman提出雙向拍賣市場的價格形成模型,將雙向拍賣簡化成貝葉斯更新過程,證明了買賣雙方存在最優簡單策略。
(2)實驗經濟學方法
實驗經濟學在連續雙向拍賣市場中的競價策略研究分為兩種:一是計算機仿真實驗,利用計算機對所設計策略進行模擬實驗,通過不同策略的實驗結果對比,分析策略優劣。二是人機交互實驗,用算法機器人替代部分人類參與者,觀察人類交易者與算法交易者身處同一市場的交易結果。伴隨人工智能的發展,人機交互實驗為連續雙向拍賣的競價策略研究提供了更為契合真實世界的研究方法。
二、經典算法策略簡介
(1)連續雙向拍賣機制設計
大多數連續雙向拍賣市場的研究圍繞Smith的市場協議開展:假定市場中只存在一類同質商品,交易期內,買賣雙方可對商品進行報價,但每次報價只能指定唯一商品。只要市場上的賣方報價與買方報價相互匹配,立即達成交易,交易價格為達成交易的買賣方報價的平均值,交易期間允許雙方修改報價,市場存在多個交易日,每個交易日有多個交易期,每個交易期期初更新商品保留價格。市場出清或實驗預定時間達到即交易結束。同時,Smith開創性的設計了誘導序列以控制實驗環境:在交易期開始階段,分配給買家和賣家一個保留價格序列。買家序列為逐漸降低的價值序列以控制市場的需求曲線;賣家序列為逐漸上升的成本序列以控制賣家的供給曲線。在此假定買方價值為w,賣方成本為c,成交價格為p。那么對應的買方剩余為w-p,賣方剩余為p-c。基于Smith的研究,定義市場分配效率為所有的買方剩余與賣方剩余之和和理論剩余值的比值。
(2)零智能算法
Gode和Sunder提出了兩種零智能算法,分別為ZIU算法和ZIC算法。假設市場允許的最高報價為x,最高報價為z,Vi為第i個算法買方交易員保留價值,Cj為第j個算法賣方交易員保留成本。ZIU算法中買賣雙方策略均為[x,z]的均勻分布隨機值。ZIC算法:買方策略為[x,Vi]的均勻分布隨機值;賣方策略為[Cj,z]的均勻分布隨機值。實驗結果表明:即使是零智能算法策略機器人參與連續雙向拍賣,也能達到資源配置的有效性。證明了連續雙向拍賣機制的有效性依賴其市場規則,與交易者的動機、市場信息和自我學習無關。
(3)增強零智能算法
Cliff和Bruten發現在非對稱市場結構下ZI算法并不能達到高市場效率,并提出增強零智能算法(ZIP算法)。ZIP算法引入自我學習機制,根據市場信息進行簡單的自學習。ZIP算法根據四類市場信息調整利潤率進而修改自身報價:自己的上期報價p是否成交;市場最新報價q;q是買方報價還是賣方報價;報價q是否達成交易。如果自身報價p在市場中達成交易,算法交易員不會降低自身利潤;如果市場中有新的交易達成,那么報價高于等于成交價的買方交易員將提高利潤率,報價低于等于成交價的賣方交易員將提高利潤率;當市場中出現新的買方報價,報價低于最新報價的買方交易員降低利潤率;當市場中出現新的賣方報價,報價高于最新報價的賣方交易員降低利潤率。利用以上擁有簡單自學習能力的ZIP算法交易員進行仿真實驗發現,在更一般的市場供需結構下,ZIP算法相較ZI算法更接近人類在連續雙向拍賣機制下的市場表現。
(4)GD算法
GD算法是Gjerstad和Dickhaut基于啟發式信念學習模型的一種算法,該算法主要包括以下三個核心元素:啟發式信念函數,通過收集市場數據,將過去n期市場所有交易者的出價信息和成交情況整合為歷史數據集,利用數據集求解價格p達成交易的概率;基于信念的期望剩余價值最大化,根據啟發式信念函數,計算以價格p出價的期望剩余價值,根據最大化結果決定出價;決定提交報價的時間。該算法的特點是接近于理性人的決策思維。
(5)AA算法
Vytelingum提出了自主交易代理策略(AA策略),該策略基于長期和短期學習,使得算法可以調整自己的出價,并在各個環境下保持高效。短期學習將根據市場波動調整其“侵略度”,高侵略度意味著其追求更高的成交概率而會主動放棄一些收益。低侵略度則追求更高的收益而損失一些成交的概率。長期學習則基于每次交易后的市場信息調整決定侵略度影響出價的參數。短期學習的核心是對市場波動的即刻反應,長期學習的核心則是適應市場供需變化的長期趨勢。分析AA算法與ZIP算法、GD算法的仿真實驗結果可知:無論是靜態還是動態實驗環境,AA算法均表現更優。
[6]Gjerstad,S.,Dickhaut,J.Price Formation in Double Auctions[J]Games and Econimic Behavior,1998.22:1-29
[7]Vytelingum P,Cliff D,Jennings N R.Strategic bidding in continuous double auctions.Artificial Intelligence,2008.172(14):1700~1729
[8]Yue C,Mabu S,Hirasawa K.A bidding strategy using genetic network programming with adjusting parameters for large-scale continuous double auction.In:2012 IEEE International Conference on Systems,Man,and Cybern etics(SMC),New York: IEEE Press,2012:1896~1902.
[9]Zhan W,Zhang J,Yang J,etal.K-ZI: A general zero-intelligence model in continuous double auction.International Journal of Information Technology & Decision Marketing,2002.1(4):673~691
[10]詹文杰,楊潔.連續雙向拍賣市場中基于馬爾科夫鏈的交易策略研究。中國管理科學,2008.16(1):111~116
[11]詹文杰,白延濤.基于動態 Hurwicz 準則的連續雙向拍賣報價策略研究.管理學報,2014.11(3):
[12]欒海軍,董紅斌,周陽.連續雙向拍賣市場中的一種自適應競價策略研究[J].南京大學學報,2015.51(2)
[13]RAJARSHI DAS,JAMES E HANSON,JEFFREY O KEPHART,et al.Agent-human interactions in the continuous double auction[C]//International Joint Conference on Artificial Intelligence.2001.17:1169–1178.
[14]MARCO DE LUCA,DAVE CLIFF.Human-agent auction interactions: Adaptive-aggressive agents do Minate[C]//Proceedings of the Twenty-Second international joint conference on Artificial Intelligence.2011.1:178–185.
[15]M DE LUCA,C SZOSTEK,J CARTLIDGE,et al.Studies on interactions between human traders and Algorithmic Trading Systems[J].UK Government Foresight Project,2011.
[16]JOHN CARTLIDGE,CHARLOTTE SZOSTEK,MARCO DE LUCA,et al.Too Fast Too Furious Faster Financial-market Trading Agents Can Give Less Efficient Markets[C]//ICAART,(2)2012:126–135.
[17]VERNON L SMITH.An experimental study of competitive market behavior[J].The Journal of Political Economy,1962.70(2):111–137.
[18]VERNON L SMITH.Experimental economics: Induced value theory[J].The American Economic Review,1976.66(2):274–279.
[19]M.He,H.F.Leung,N.R.Jennings,A fuzzy logic based bidding strategy for autonomous agents in continuous double auctions,IEEE Transactions on Knowledge and Data Engineering 15(6)(2003)1345–1363.
[20]J.Nicolaisen,V.Petrov,L.Tesfatsion,Market power and efficiency in a computational electricity market with discriminatory double-auction pricing,IEEE Transactions on Evolutionary Computation 5(5)(2001) 504–523.
[21]S.Phelps,S.Parsons,P.McBurney,An evolutionary game-theoretic comparision of two double auction market designs,in:Proc.Sixth Workshop on Agent Mediated Electronic Commerce,2004,pp.192–198
作者簡介:曹陽,1995,男,漢,四川,碩士,武漢大學,實驗經濟學 4430072。