丁曉麗



摘 要: 海量信息中的模糊數據具有特征不確定性和發散性,對其準確定位的難度較大,因此提出基于支持向量機二次規劃的海量信息中模糊數據定位數學模型設計方法。在凸空間內構造模糊數據定位的高階線性微分方程,求得模糊數據定位的極大線性無關組,采用支持向量機模型求得數據定位的聚類中心,以聚類中心的鄰域數據集為訓練模板集,通過凸組合二次規劃方法進行Lyapunove泛函,實現模糊數據定位。數據測試結果表明,采用該方法進行數據定位的精度較高,收斂性較好。
關鍵詞: 海量信息; 數據定位; 數學模型; 微分方程
中圖分類號: TN911.1?34; O29 文獻標識碼: A 文章編號: 1004?373X(2017)16?0026?03
Abstract: The fuzzy data in vast amounts of information has the characteristics of uncertainty and divergence, and its accurate positioning is difficult. Therefore, a design method of positioning mathematical model for fuzzy data in mass information is put forward in this paper, which is based on quadratic programming of support vector machine. The high?order linear differential equations for fuzzy data location are constructed in convex spaces to obtain the maximum linearly independent group for fuzzy data location. The support vector machine model is used to obtain the clustering center of data location. The neighborhood data set of the clustering center is taken as the training. The quadratic programming method for convex combination is adopted for Lyapunove functional to realize fuzzy data positioning. The data test results show that the this method has high accuracy for data positioning and perfect convergence.
Keywords: mass information; data location; mathematical model; differential equation
0 引 言
在云計算平臺中,隨著大數據信息的增長,大量的數據集合之間存在模糊性。數據集之間的差異性特征嚴重影響了數據的有效分類和定位識別。為了提高對大數據背景下海量信息中模糊數據的準確定位識別能力,需要構建模糊數據定位的數學模型,建立模糊數據定位的微分方程,對微分方程進行穩定解分析和收斂性判斷[1]。高階線性微分方程模型在應對大規模海量數據集的處理和訓練上,有其獨特的優勢。制約高階線性微分方程運算的一個重要難題是解決線性模型約束下隨機泛函微分方程的超線性收斂性問題。在線性模型約束下運用高階線性微分方程進行海量模糊數據定位,把海量模糊數據的定位問題轉化為一個超線性收斂性問題[2],優化海量數據分類和模式識別,研究數據定位的數學模型就是研究高階線性微分方程的極大線性無關組收斂性問題。對此,本文提出一種基于支持向量機二次規劃的海量信息中模糊數據定位數學模型設計方法,通過數學模型設計和數據測試分析,展示了本文設計的數據定位數學模型的優越性能。
1 數學模型構建
1.1 高階線性微分方程分析
為了實現對海量信息中模糊數據定位數學模型的優化設計,首先進行大數據信息流擬合的特征聚類分析[3]。在凸空間內構造模糊數據定位的高階線性微分方程。模糊數據定位和識別是建立在對數據信息流的時間序列分析的基礎上的,通過對大數據信息流的特征參量提取,進行數據聚類的屬性特征選擇和搜索,計算數據聚類中心,實現數據的自動定位和識別,在Laplace凸優化空間內,構建模糊數據定位的高階線性微分方程組合模型,表示為:
3 仿真試驗分析
對海量信息模糊數據定位的仿真試驗采用C++和Matlab 7混合編程設計,海量信息數據庫使用MySQL。對海量數據的采樣時間間隔為1.25 s,時間窗口系數[τ]為0.28,自適應參數[ε1=0.1],迭代步長設定為24。根據上述試驗參數設定,進行模糊數據定位分析,采用不同方法進行對比,得到數據定位的誤差收斂曲線如圖1所示。分析圖1結果得知,采用本文方法進行海量信息的模糊數據定位的誤差較小,收斂性較好,性能優于傳統模型。
4 結 語
本文研究了海量信息中的模糊數據定位問題,由于模糊數據存在特征不確定性和發散性,對其準確定位的難度較大,本文提出一種基于支持向量機二次規劃的海量信息中模糊數據定位數學模型設計方法。在凸空間內構造模糊數據定位的高階線性微分方程,求得模糊數據定位的極大線性無關組,采用支持向量機模型求得數據定位的聚類中心,以聚類中心的鄰域數據集為訓練模板集,通過凸組合二次規劃方法進行Lyapunove泛函,實現模糊數據定位。數據測試結果表明,采用該方法進行數據定位的精度較高,收斂性較好,具有較好的應用價值。
參考文獻
[1] KAREEM I A, DUAIMI M G. Improved accuracy for decision tree algorithm based on unsupervised discretization [J]. International journal of computer science and mobile computing, 2014, 3(6): 176?183.
[2] 尚朝軒,王品,韓壯志,等.基于類決策樹分類的特征層融合識別算法[J].控制與決策,2016,31(6):1009?1014.
[3] 余曉東,雷英杰,岳韶華,等.基于粒子群優化的直覺模糊核聚類算法研究[J].通信學報,2015(5):74?80.
[4] 孫力娟,陳小東,韓崇,等.一種新的數據流模糊聚類方法[J].電子與信息學報,2015,37(7):1620?1625.
[5] 林楠,史葦杭.基于多層空間模糊減法聚類算法的Web數據庫安全索引[J].計算機科學,2014,41(10):216?219.
[6] 蔣本立,張小平.大數據網絡的均衡調度平臺設計與改進[J].現代電子技術,2016,39(6):62?65.endprint