姚 瑞,唐 泉
(新疆師范大學 數學科學學院,烏魯木齊 830017)
統計學習,也稱為統計機器學習,在計算機及其應用領域中具有重要意義.統計學習[1]的主要方法是基于數據建立統計模型來預測和分析數據,由監督學習、非監督學習、半監督學習和強化學習組成,包括k近鄰法、樸素貝葉斯方法、支持向量機等方法.半監督學習是一種同時兼顧標簽樣本和無標簽樣本的學習方法,利用標記樣本的優點來精確描述單個樣本,同時使用大量無標記數據來進一步提高分類器的性能[2].半監督支持向量機(S3VM)最初應用于文本分類[3],主要有梯度下降法(Gradient descent)[4]、確定性退火方法(Deterministic annealing)[5]和半正定規劃方法(Semi-definite programming)[6]等研究方法.模糊支持向量機在傳統支持向量機基礎上提出,分類精度和回歸精度更高,查翔等[7]提出了一種基于多區域劃分的模糊支持向量機方法;譚萍等[8]結合模糊C-均值與FSVM 提出了一種多級的模糊支持向量機對說話人進行語音識別;Muscat R 等[9]提出了分層模糊支持向量機模型.本文討論支持向量機模型,對支持向量機模型的基本思想、發展完善及應用情況進行概述,并深入探討一種通過識別誤分類點來構造半監督的模糊支持向量機模型及算法實現.
對于模糊訓練集

模糊約束規劃為:

其中,λ(0 ≤λ≤1)為置信區間.
其對偶問題為:


Step4:計算ω*和b*,如式(4);
Step5:構造最優分類超平面(ω*·x)+b*=0,得到最優分類函數式(5).
對于模糊非線性問題,引入變換……p>