999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習模型交易中的數據購買量與模型定價

2025-01-21 00:00:00林苗君羊梓敏陳斌
華僑大學學報(自然科學版) 2025年1期

摘要: 基于數據邊界的Shapley值總和構建成本分配問題,采用截斷蒙特卡洛的快速算法計算Shapley值,證明了數據邊界最優解存在性。針對不同版本模型定價場景,定義模型經紀人收入最大化模型的定價問題,并將收入最大化模型的定價問題轉換為等價整數線性規劃問題。運用公共數據集數值驗證文中方法的正確性,同時與已有的4種方法進行實驗對比。實驗結果表明:文中方法可以提高模型經紀人收入和模型買方的購買比例。

關鍵詞: 數據定價;模型定價;Shapley值;整數規劃

中圖分類號: TP 274;F 49文獻標志碼: A 文章編號: 1000-5013(2025)01-0095-09

Data Purchase Volume and Model Pricing in Machine Learning Model Transactions

LIN Miaojun1,YANG Zimin2,CHEN Bin2

(1. Financial Department,Huaqiao University,Quanzhou 362021,China;2. School of Mathematical Science,Huaqiao University,Quanzhou 362021,China)

Abstract: Cost allocation problem based on Shapley value summation on data boundaries is constructed. Using the fast algrithm of the Truncated Monte Carlo,the existence of the optimal solution of the data boundary is proved. Aiming at pricing scenarios of different versions of the models,the pricing problem of the income maximizing model of the model broker is defined,and the pricing problem of the income maximizing model is transformed into an equivalent integer linear programming problem. By public datasets , our proposed method is" validated its correctness,and the experiment is compared with four existing methods,simultaneously. The experimental results show that the proposed method can increase the income of the model broker and the purchase ratio of the model buyer.

Keywords: data pricing;model pricing;Shapley value;integer programming

在大數據時代,數據的流通和共享已是大勢所趨,數據定價與交易方法亦受到了廣泛關注1。隨著數據市場的發展,交易的范疇超越了單純的原始數據買賣,涵蓋了機器學習模型的交易。這一拓展使得據分析能力有限的小微企業和個人用戶能夠便捷地獲取模型服務成果,而不是直接購入并處理原始數據。因此,模型定價成為數據定價研究的重要組成部分2。在數據市場的研究中,將數據視為商品并對其進行交易與定價的策略展現出豐富多樣的面貌。基于數據定價的數據集(如Dawex,Twitter,Bloomberg,Iota和SafeGraph等)允許買家直接訪問數據,允許買家根據數據的特征(信息熵水平3-4、數據質量5-6、新鮮度和實時性7-8及數據集的大小9)進行估值。此外,競爭性數據交易模型10巧妙融合了數據供應商的售賣意向與模型需求方的支付意愿的納什均衡,從而確保各參與者的利潤最優化。盡管如此,這些研究仍具有一定局限性,主要體現在數據價值評估效率的低維度依賴。基于此,本文對機器學習模型交易中的數據購買量與模型定價進行研究。

1 市場交易框架

三方交易系統中,數據提供者將數據記錄提交給專業的模型經紀人。模型經紀人扮演著中介與增值的角色,運用先進的機器學習算法對數據進行深度訓練,從而打造高性能的預測或分析模型。隨后,精心訓練出來的模型以服務的形式被精準對接至有特定需求的模型買方,實現數據價值轉化與商業化。三方模型市場交易框架,如圖1所示。

1) 數據提供者。在數據供應鏈的初始環節,數據提供者提供經過預處理(如數據脫敏)的高質量數據集D,確保所有數據均源自合法途徑,不含侵犯隱私內容,并且滿足市場流通的法定標準。這一環節的合法性與合規性對于維護整個數據市場的健康秩序至關重要。

2) 模型經紀人。模型經紀人扮演著核心中介角色,通過收購數據集D,利用先進的技術手段對其進行深度挖掘,訓練出多樣化精度層次的機器學習模型。模型經紀人的成功取決于精準平衡成本控制與市場需求,通過高效數據利用和差異化模型服務最大化經濟回報。

3) 模型買方。模型買方作為數據交易生態系統的終端用戶,根據業務需求和預算限制,選擇購買或訂閱滿足精度需求的模型服務。模型買方的選擇偏好和反饋信息是推動模型迭代升級和市場動態調整的關鍵驅動力。

模型經紀人在市場初期面臨的核心挑戰可歸結為成本效益的最大化,具體體現兩方面的策略制定:一是高效篩選并購買最具性價比的數據集;二是精準定位市場,推出多樣化精度層次的模型,并設定合理價格體系,以覆蓋更廣泛的用戶需求。

2 最優數據邊界的求解

當前數據市場的定價機制往往比較粗放,用戶在交易中不得不承擔購買完整數據集的成本,實際上,買家僅需利用其中一部分數據實現特定目標。這種定價機制忽略數據使用效用與購買成本之間的精細平衡,未能充分體現數據價值的差異化和用戶的實際需求。在數據交易的決策過程中,過度累積數據并不是最優解,在數據規模與實際效用之間尋求最佳平衡點才是最優解11。只有當邊際收益高于邊際成本時,才有必要購買數據;而相應的購買數據量稱為數據邊界n。在這個場景中,模型經紀人的首要任務是深入分析數據集的特性,識別最具預測價值或能顯著提升模型性能的數據子集。

數據提供者搜集并整理數據記錄,通過一系列預處理步驟(如數據清洗、脫敏處理等)確保數據質量與合規性。完成這些準備后,數據被整合成具有特定主題或應用場景的數據集D,通過計算Shapley值,模型經紀人選擇一個最優的數據邊界n。在確定了所需數據后,模型經紀人利用選購的數據集訓練多種機器學習模型,這些模型覆蓋不同的復雜度和精度,旨在滿足模型買方多樣化的業務需求和預算限制。進入市場交易環節,模型經紀人將這些預訓練好的模型推向市場,向模型買方展示。模型買方根據自身應用場景的具體要求(如預測精度、模型響應速度、成本預算等),選擇最合適的模型進行購買。交易完成后,模型買方向模型經紀人支付模型費用pm,作為模型使用權的交換。

2.1 Fast-TMC Shapley算法

在機器學習中,衡量每個數據點對模型性能的貢獻是一個關鍵問題。Shapley值法是合作博弈論中的一種經典方法12。在機器學習背景下,Shapley值是考慮數據點在所有可能的數據子集中的邊際貢獻的平均值。在實際應用中,通常使用近似方法估計Shapley值,如蒙特卡羅截斷采樣Shapley(TMC-Shapley)算法13。TMC-Shapley算法引入截斷技巧和蒙特卡洛采樣策略,緩解了傳統Shapley值估計的計算復雜性問題。然而,TMC-Shapley算法存在如下3個問題。

1) 計算成本高。盡管TMC-Shapley算法比Shapley值法有所優化,但計算量依然龐大,尤其是在處理大規模數據集時,所需的計算資源和時間可能依舊超出許多實際應用場景的承受范圍。

2) 參數敏感度高。TMC-Shapley算法的性能嚴重依賴截斷閾值的選擇和蒙特卡洛采樣的次數,這兩個參數的設置需要仔細調優。不當的參數設置可能導致評估結果偏差,影響數據價值判斷的準確性。

3) 高維數據處理難。隨著數據維度的增加,數據點之間的相互作用關系變得更加復雜,這直接加劇了TMC-Shapley算法的計算復雜度和內存需求,使其在高維數據集上的應用變得尤為困難。

Fast-TMC Shapley算法,如圖2所示。

Fast-TMC Shapley算法著重解決了Shapley值法在大規模數據集應用中遇到的效率瓶頸。Fast-TMC Shapley算法有4點核心改進。1) 優化采樣策略。Fast-TMC Shapley算法通過更加智能化的采樣方法,減少了對數據子集的盲目探索,確保每次采樣都能有效增加信息量,避免無效或重復的工作,從而在保持評估精度的同時,大幅降低所需的樣本數量。2) 減少模型重訓。通過高效的緩存和復用之前計算結果,即便是面對數據集的微小變化,也能夠迅速定位并僅對必要部分進行重新評估,大大減少了計算資源的浪費。3) 高效存儲與計算。利用高級的數據結構和算法優化,Fast-TMC Shapley算法能夠有效管理計算過程中的中間結果,確保在處理大規模數據時的內存使用效率和計算速度。4) 保證Shapley值估計的準確性。通過精心設計的近似策略和誤差控制機制,即便在減少計算量的情況下,也能保持評估結果的可靠性和準確性。

2.2 數據邊界建模

數據的Shapley值從大到小排序,從第一條數據開始購買,當購買第n條時,累計獲得的總收益大于總成本,再根據模型買方的支付意愿(wTP)構造收益的優化函數,從而找到數據邊界n。

S(svn)表示前n個數據的Shapley總值,用來衡量第n個數據記錄后模型可達到的準確度水平,S(svn)為

式(1)中:svi為購買數據記錄。

假設wTP=η·S(svn),η≥0,效用函數滿足dS(svn)/dngt;0(遞增函數),d2S(svn)/d2n≤0(邊際效用遞減)。由文獻4-5中的式(2),擬合S(svn)和前n個數據記錄之間的關聯,顯然方程滿足效用函數的假設,即

S(svn)=∑n/i=1svi12·exp(-β3·n)。(2)

在估計不同數據集參數時,計算原始數據集的svi,并得到實驗點(n1,S(sv1)),…,(nN,S(svN))。使用非線性最小二乘算法,通過最小化平方誤差之和優化β=(β1,β2,β3),即

min/β1,β2,β3∑N/i=1(S(svi)-(β12·exp(-β3·ni))2。(3)

2.3 最優數據邊界求解

假設w為模型買方的實際支付意愿,w′為模型買方名義支付意愿。實際支付意愿取決于svn,并且有w=w′·svn。其中,w′是一個正的隨機變量,反映了模型買方的異質性。假設概率密度函數為f(w′),針對不同現實情況,提出了w′的兩種分布。

1) 均勻分布。假設W′為模型買方的最大名義支付意愿,W為模型買方的最大的實際支付意愿,則W=W′·svn。對于一組模型買方,其概率密度f(w′)遵循[0,W′]的均勻分布。累積分布函數F(pm)表示W′≤pm的概率。因此,購買概率pr

pr=1-F(pm)=W-pm。(4)

模型經紀人的利潤Π(pm,n)可以表示為

Π(pm,n)=/pm·m·pr-c·n=pm·m·(W-pm)-c·n=/

pm·m·(W·svn-pm)-c·n。(5)

式(5)中:svn=∑s/i=nsvi12·exp(-β3·n),β1,β2,β3≥0;pm·m·pr-c·n=pm·m·(W-pm)為愿意支付不低于pm價格的模型買方帶來的收入;c·n為支付給數據提供者的費用。

為獲得最優的模型費用p*m和數據邊界n,有

max/pm,n Π(pm,n)=pm·m·(W′·S(svn)-pm)-c·n,

s.t. pm≥0, n≥0。(6)

方程(6)的約束條件確保了pm和n的非負解,有

Π(pm,n)/? pm=m·(W′·S(svn)-2pm),Π(pm,n)/?n=pm·m·W′·β2·β3·exp(-β3·n)-c。(7)

當n或pm固定時,Π(pm,n)的二階導數為

?2Π(pm,n)/?2pm=-2mlt;0,?2Π(pm,n)/?2n=-β2·β23·(pm·m·W′)·exp(-β3·n)lt;0。(8)

因此,均勻分布的解是全局最優的。由?Πs(pm,n)/?pm=0和?Π(pm,n)/?n=0,可以得到n*和p*m的解。

2) 由于許多自然現象遵循對數正態分布(LND)14,因此,使用對數正態分布模擬買方支付意愿比較符合實際。定義w′遵循LND分布,其概率密度函數為f(w′)。累積分布函數F(pm)表示W′≤pm的概率。因此,購買概率為

pr=1-F(pm)=1/2-1/2erfln pm-μ/2σS(svn)。(9)

式(9)中:erf(·)為度量理論中使用的誤差函數。

模型經紀人的利潤Π(pm,n)為

Π(pm,n)=/pm·m·pr-c·n=pm·m·1/2-1/2erfln pm-μ/2σ·S(svn)-c·n=/pm·m/21-erfln pm-μ/2σ·S(svn)-c·n。(10)

式(10)中:S(svn)=∑s/i=nsvi12·exp(-β3·n),β1,β2,β3≥0;

pm·m·pr為從支付意愿不低于pm的模型買方處所得到的收入。

通過調整μ和σ,可以靈活使用LND分布,以適應不同情況,假設μ=0和σ=1,優化問題為

max/pm,n Π(pm,n)=pm·m·1/2·1-erfln pm/2·S(svn)-c·n,s.t. pm≥0, n≥0。(11)

式(11)中:約束條件為pm和n的解非負。

通過對Π(pm,n)關于pm和n進行微分,可以得到關于?Π(pm,n)/?pm=0和?Π(pm,n)/?n=0的具體形式。

?Π(pm,n)/?pm=m·S(svn)/2·1-erfln pm/2-2/π·exp-ln2 pm/2,(12)

?Π(pm,n)/?n=pm·m/2·1-erfln pm/2·β2·β3·exp-β3·n-c。(13)

Π(pm,n)關于pm或n的二階導數是固定的且均為非正,即

?2Π(pm,n)/?2pm=-m·S(svn)/2π·pm·(1+ln pm)·exp-ln2 pm/2lt;0,(14)

?2Π(pm,n)/?2n=-(β2β23)pm·m/2·1-erfln pm/2·exp(-β3·n)lt;0。(15)

因此,LND分布的解是全局最優的。通過解?Π(pm,n)/?n=0和?Π(pm,n)/?pm=0,得到n*和p*m的解。

3 模型最優定價求解

3.1 模型定價模型的建模

為了實現促進雙方更高效、互利的交易,需要考慮到的3個關鍵定價因素。1) 基于調研,經紀人獲得模型買方對各版本模型的具體購買意向,包括他們對不同性能指標組合的偏好排序和每個版本的最高支付意愿。2) 根據收集到的信息,經紀人需制定精細的版本控制策略,決定推出哪些精度或功能級別的模型。3) 在構建模型的定價模型(RM)時,經紀人還需考慮無套利原則,即確保市場中不存在利用價格差異進行無風險獲利的機會。這意味著同一模型或相近性能模型之間的定價必須合理銜接,避免買方通過購買低價版本轉售為高價版本,從而賺取差價,維護市場的穩定性和公平性。

模型經紀人使用數據集D,訓練不同版本的模型(v1,v2,…,vN)進行銷售,這些模型按準確度等級從低到高排序。假設模型買方對模型vi感興趣,且其模型價值為uij,模型買方僅在p(vi)≤uij時購買模型,模型經紀人則獲得收入p(vi)。RM可以寫為

式(16)中:p(vi)為整數變量;I(p(vi)≤uij)是指示變量;當p(vi)≤uij時,RM為1,否則為0;約束條件確保了無套利屬性。

3.2 模型最優定價求解

在求解式(16)時,因存在指示函數I(p(vi)≤uij)而難以求解,需要將最大收益問題轉換為等效的整數線性規劃問題。首先,使用0~1整數變量xij1,xij2和新增約束條件把非線性目標函數轉化為了一個二次整數線性規劃問題。即

式(17)中:L為無窮大;p(vi),xij1,xij2都是整數變量;第1,2個約束條件確保了市場的無套利特性,其余約束條件保證指示函數的轉換;uij為模型價值。

當xij1=1,xij2=0時,目標函數變為p(vi),第3個約束條件變為0≤p(vi)≤uij,這意味著模型vi的價格低于其模型價值,模型買方會購買此模型,模型經紀人獲得收入p(vi)。

當xij1=0,xij2=1時,目標函數變為0,第3個約束條件變為uij≤p(vi),這意味著模型vi的價格高于其模型價值,模型買方不會購買。

由于目標函數是0~1整數變量的特性,將二次線性規劃轉換為一次線性規劃問題,即

式(18)中:p(vi),xij1,xij2,yij都是整數變量;前兩個約束條件保障了市場無套利特性,第3~5個約束條件保證指示函數的轉換,而其他約束條件項則負責ILP的轉換。

當xij1=1時,約束條件yij≤xij1·L變為yij≤L,約束條件yij≥p(vi)-L·(1-xij1)變為yij≥p(vi)。同時,約束條件確保yij≤p(vi)。因此,3個約束條件的結合確保了yij=p(vi)。目標函數變為p(vi),模型買方會購買此模型。

當xij1=0時,約束條件yij≤xij1·L變為yij≤0,約束條件yij≥p(vi)-L·(1-xij1)變為yij≥-L。同時,約束條件確保yij≥0。因此,3個約束條件的結合確保了yij=0。目標函數變為0,模型買方不會購買此模型。

以上過程將收入最大化問題轉換為ILP問題(簡稱為RM-ILP),可以獲得提高模型經紀人收入的定價結果。

4 實驗結果與分析

4.1 數據邊界實驗

數據邊界實驗采用糖尿病數據集和臺灣省臺北市房地產數據集兩個公共數據集15。 糖尿病數據集中共有768條數據,每條數據有8個特征和1個對應的標簽。糖尿病數據是標簽數據,首先,使用Fast-TMC Shapley算法計算svi,即第i條數據的Shapley值,然后歸一化svi;接著,從大到小排序svi并累加,獲得S(svi)。用最小均方誤差的非線性最小二乘法進行擬合,擬合系數β1=1.072,β2=1.025和β3=0.034。糖尿病數據集Shapley值,如圖3所示。

房地產估值的市場歷史數據集來自臺灣省新北市新店區,一共有414條數據,每條數據有6個特征和1個對應的單位面積房價。評價函數是R2,R2是衡量模型解釋的變異量的比例,R2在0~1之間,R2越接近1,表示模型的擬合效果越好。最小均方誤差下,非線性最小二乘法擬合系數β1=1.041,β2=0.925和β3=0.073。臺北市房地產數據集Shaple值,如圖4所示。

4.2 模型定價實驗

針對不同的情境和目標,選擇下列4種不同方法進行對比分析16

1) Lin方法。該方法較為簡單直觀,通過確定模型價值的最低點和最高點,構建線性函數,估算價格。該方法適用于價值與價格呈線性關系、且市場對價格敏感度相對穩定的場景。

2) Average方法。該方法通過市場調研收集的數據,計算所有調查樣本中模型價值的平均數作為定價基準。該方法試圖平衡高估與低估的風險,適用于追求穩定和市場接受度優先的場景。

3) DPP方法。該方法是一種更靈活和動態的方法,依據市場反饋、庫存情況、競爭對手價格等多種因素,通過動態規劃算法為不同模型版本設定價格,旨在實現利潤最大化17

4) DPP+方法。作為DPP方法的升級版,DPP+方法在動態規劃的基礎上,進一步擴展了解決方案空間,考慮了更多的變量和組合,以期找到更精準的最優定價策略18

凹性預期價格和正態分布需求下的p(vi),如圖5所示。圖5中:u為正態分布需求。凸性預期價格和正態分布需求下的p(vi),如圖6所示。

凹性預期價格和正態分布需求的收入總值,如圖7所示。圖7中:pt為收入總值。凸性預期價格和正態分布需求的收入總值,如圖8所示。由圖7,8可知:相比于其他4種方法,RM-ILP方法在收入增益方面的表現最為顯著,最高可達6.67倍;RM-ILP方法在凹性預期價格上相比于DPP方法和DPP+方法有更優的表現,模型經紀人收入分別增長了23%和3%;在凸性預期價格上相比于DPP方法和DPP+方法,模型經紀人收入分別增長了1%,3%。

綜上所述,RM-ILP方法在數據市場中的模型定價和策略優化提供更優化的解決方案。其優勢主要體現在以下5個方面。1) 精細化價格設定。RM-ILP方法能夠基于復雜的市場需求模型,精確調整不同模型版本的價格,確保每個版本都能在滿足市場需求的同時,使利潤最大化。這種精細化定價策略優于簡單的線性或平均值定價法,因為它能夠更準確地反映市場細分和買方偏好。2) 優化收入增益通過優化函數。RM-ILP方法能夠綜合考慮各種定價和銷售策略對總收入的影響,包括版本控制策略和市場需求的動態變化,從而實現收入的最大化。這種方法確保了模型經紀人在成本控制和市場需求之間找到最佳平衡點。3) 確保可負擔性比率。在追求利潤最大化的同時,RM-ILP方法還能夠通過優化過程考慮模型買方的支付能力和意愿,確保定價策略不會因為過高而排斥大量潛在買家,維持一個健康的市場可接受度和客戶基礎。4) 適應動態市場環境。面對快速變化的市場環境和買方偏好,RM-ILP方法的動態調整能力至關重要。它能夠及時反應市場信息,調整模型版本的供應、價格,甚至開發新的模型版本,以適應市場需求的變化,展現出了極強的靈活性和適應性。5) 確保遵守市場規則。在構建優化模型時,RM-ILP方法充分考慮了數據市場的特性和規則(如版本控制和無套利原則),確保了定價策略的合法性和市場公平性,防止了市場操縱和不正當競爭行為。

5 結論

1) 精細化數據價值評估。通過先進的Fast-TMC Shapley算法,實現了對數據點貢獻的精細化評估,為數據的定價與交易提供了科學依據。

2) 高效資源分配。數據邊界的確定幫助模型經紀人實現資源的高效配置,避免了不必要的數據購置成本,提高了數據利用效率。

3) 動態定價策略。基于RM-ILP的模型定價優化,不僅考慮了買方的偏好和支付能力,還確保了市場規則的遵守,提高了模型產品的市場競爭力和接受度。對不同真實數據集的數據邊界進行了數值研究,驗證了最優數據邊界的存在性。與其他4種方法相比,RM-ILP方法在模型經紀人收入最大化問題的求解中展現了明顯優勢。

通過應用RM-ILP方法,模型經紀人不僅能夠更深入地理解模型買方的購買偏好和支付意愿,還能制定出更貼合市場需求、更符合買方行為習慣的定價策略,促進了數據市場的健康發展,通過提高數據和模型交易的透明度、效率和公平性,吸引更多參與者,推動數字經濟的繁榮。參考文獻:

[1] SONG Jie,HE Guannan,WANG Jianxiao,et al.Shaping futurelow-carbon energy and transportation systems digital technologies and applications[J].Energy,2022,1(3):285-305.DOI:10.23919/IEN.2022.0040.

[2] PEI Jian.A survey on data pricing: From economics to data science[J].IEEE Transactions on Knowledge and Data Engineering,2022,34(10):4586-4608.DOI:10.1109/TKDE.2020.3045927.

[3] LI Xijun,YAO Jianguo,LIU Xue,et al.A first look at information entropy-based data pricing[C]∥Proceedings of the 37th International Conference on Distributed Computing Systems.Atlanta:IEEE Press,2017:2053-2060.DOI:10.1109/ICDCS.2017.45.

[4] SHEN Yuncheng,GUO Bing,SHEN Yan,et al.A pricing model for big personal data[J].Tsinghua Science and Technology,2016,21(5):482-490.DOI:10.1109/TST.2016.7590317.

[5] YU Haifei,ZHANG Mengxiao.Data pricing strategy based on data quality[J].Computers amp; Industrial Engineering,2017,112:1-10.DOI:10.1016/j.cie.2017.08.008.

[6] YANG Jian,ZHAO Chongchong,XING Chunxiao,et al.Big data market optimization pricing model based on data quality[J].Complexity,2019(2):1-10.DOI:10.1155/2019/5964068.

[7] ZHANG Meng,ARAFA A,HUANG Jianwei,et al.Pricing fresh data[J].IEEE Journal on Selected Areas in Communications,2021,39(5):1211-1225.DOI:10.1109/JSAC.2021.3065088.

[8] ZHANG Meng,ARAFA A,HUANG Jianwei,et al. How to price fresh data[C]∥ Proceedings of the 2019 International Symposium on Modeling and Optimization in Mobile,Ad Hoc,and Wireless Networks.Avignon:IEEE Press,2019:1-8.DOI:10.23919/WiOPT47501.2019.9144091.

[9] NIYATO D,ALSHEIKH M A,WANG Ping,et al.Market model and optimal pricing scheme of big data and internet of things (IoT)[C]∥Proceedings of the 2016 IEEE International Conference on Communications.Malaysia:IEEE Press,2016:1-6.DOI:10.1109/ICC.2016.7510922.

[10] OH H,PARK S,LEE G,et al.Competitive data trading model with privacy valuation for multiple stakeholders in IoT data markets[J].IEEE Internet of Things Journal,2020,7(4):3623-3639.DOI:10.1109/JIOT.2020.2973662.

[11] TIAN Yingjie,DING Yurong,FU Saiji,et al.Data boundary and data pricing based on the shapley value[J].IEEE Access,2022,10:14288-14300.DOI:10.1109/ACCESS.2022.3147799.

[12] GHORBANI A,ZOU J.Data shapley: Equitable valuation of data for machine learning[C]∥Proceedings of the 36th International Conference on Machine Learning.California:PMLR Press,2019:2242-2251.DOI:10.48550/arXiv.1904.02868.

[13] CHEN Lingjiao,KOUTRIS P,KUMAR A.Towards model-based pricing for machine learningin a data marketplace[C]∥ Proceedings of the 2019 International Conference on Management of Data.Amsterdam:ACM Press,2019:1535-1552.DOI:10.1145/3299869.3300078.

[14] ALBERINI A.Efficiency vsbias of willingness-to-pay estimates: Bivariate and interval-data models[J].Journal of Environmental Economics and Management,1995,29(2):169-180.DOI:10.1006/jeem.1995.1039.

[15] YEH I,HSU T.Building real estate valuation models with comparative approach through case-based reasoning[J].Applied Soft Computing,2018,65:260-271.DOI:10.1016/j.asoc.2018.01.029.

[16] DONG Xin,SAHA B,SRIVASTAVA D.Less is more: Selecting sources wisely for integration[J].VLDB Endowment,2012,6(2):37-48.DOI:10.14778/2535568.2448938.

[17] LIU Jinfei,LOU Jian,LIU Junxu,et al.Dealer: An end-to-end model marketplace with differential privacy[J].VLDB Endowment,2021,14(6):957-969.DOI:10.14778/ 3447689.3447700.

[18] JIA Ruoxi,DAO D,WANG Boxin,et al.Efficient task-specific data valuation for nearest neighbor algorithms[J].VLDB Endowment,2019,12(11):1610-1623.DOI:10.14778/3342263.3342637.

(責任編輯:陳志賢 英文審校:黃心中)

主站蜘蛛池模板: 婷婷亚洲天堂| 国产在线八区| 狠狠色综合网| 免费国产在线精品一区| 永久免费无码日韩视频| 欧美日本在线观看| 国产一级妓女av网站| 国产福利微拍精品一区二区| 2020最新国产精品视频| 在线看免费无码av天堂的| 激情综合婷婷丁香五月尤物| 国产精品无码翘臀在线看纯欲| 99精品福利视频| 欧美人与性动交a欧美精品| 亚洲成a人片| 国产在线精品香蕉麻豆| 老色鬼久久亚洲AV综合| 一边摸一边做爽的视频17国产| 伊人久久大香线蕉aⅴ色| 青青青国产视频手机| 国产一级毛片yw| 亚洲最新网址| 国产高潮视频在线观看| a亚洲天堂| 亚洲视频在线青青| 亚洲男人的天堂在线| hezyo加勒比一区二区三区| 2021最新国产精品网站| 国产欧美视频综合二区| 国产成人福利在线视老湿机| 久久久精品无码一二三区| 亚洲中文字幕在线精品一区| 久草中文网| 国产高清在线精品一区二区三区 | 91在线中文| 亚洲青涩在线| 国产一级在线播放| 午夜无码一区二区三区| 亚洲欧美精品在线| 亚洲愉拍一区二区精品| 成人综合在线观看| 日韩a级毛片| 精品欧美视频| 日本精品αv中文字幕| 日本91视频| 久久91精品牛牛| 亚洲第一色视频| 精品成人一区二区| 动漫精品中文字幕无码| 色噜噜在线观看| 免费观看男人免费桶女人视频| 午夜精品影院| 色网在线视频| 国产青榴视频在线观看网站| 亚洲国产精品一区二区第一页免| 精品视频在线观看你懂的一区| 亚洲啪啪网| 麻豆精品在线视频| 亚洲免费三区| 欧美啪啪网| 精品久久人人爽人人玩人人妻| 熟女成人国产精品视频| 国产另类视频| 在线观看国产精品一区| a天堂视频| 久久综合九九亚洲一区| 91麻豆国产视频| 国产导航在线| 欧美在线网| 黄色免费在线网址| 亚洲AV电影不卡在线观看| 97国产精品视频人人做人人爱| 91人人妻人人做人人爽男同 | 久久免费观看视频| 免费无码在线观看| 99手机在线视频| 国产成人乱无码视频| 国产美女在线观看| 国产亚洲视频播放9000| 波多野结衣一区二区三视频| 鲁鲁鲁爽爽爽在线视频观看| 中文字幕中文字字幕码一二区|