摘 要:模糊法則歸納法(Fuzzy Rule Induction using GMDH,簡(jiǎn)稱FRI方法)是近年來(lái)興起的非參數(shù)數(shù)據(jù)挖掘技術(shù),它將模糊建模技術(shù)和自組織數(shù)據(jù)挖掘建模技術(shù)相結(jié)合,在金融、經(jīng)濟(jì)等領(lǐng)域已經(jīng)得到了成功運(yùn)用。文章分析了陜西省西安市和寶雞市兩地移動(dòng)長(zhǎng)話市場(chǎng)的消費(fèi)者特征,在傳統(tǒng)市場(chǎng)調(diào)查分析方法評(píng)述的基礎(chǔ)上,進(jìn)行了FRI方法運(yùn)用于市場(chǎng)營(yíng)銷領(lǐng)域的嘗試性研究。研究發(fā)現(xiàn),F(xiàn)RI方法適用細(xì)分市場(chǎng)的特征,即適用于差異比較明顯的細(xì)分市場(chǎng)特征的提取。
關(guān)鍵詞:模糊法則歸納法;市場(chǎng)調(diào)查;數(shù)據(jù)分析
中圖分類號(hào):F272
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào):1003-7217(2007)03-0106-05
一、引言
市場(chǎng)調(diào)查的一個(gè)重要環(huán)節(jié)是調(diào)查數(shù)據(jù)分析。顧客感覺如何,怎樣看待企業(yè)的競(jìng)爭(zhēng)對(duì)手及其產(chǎn)品與服務(wù),通過市場(chǎng)調(diào)查數(shù)據(jù)進(jìn)行分析,有利于提升企業(yè)競(jìng)爭(zhēng)力。市場(chǎng)調(diào)查數(shù)據(jù)分析常用統(tǒng)計(jì)方法,其中描述性分析是調(diào)查公司最常使用的方法,它操作簡(jiǎn)單,通過百分比計(jì)算比較分析以發(fā)現(xiàn)市場(chǎng)特征。由于得到的結(jié)果要借助于分析人員的相關(guān)專業(yè)理論知識(shí)和經(jīng)驗(yàn)才能翻譯成有信息價(jià)值的語(yǔ)言,該方法主觀性較強(qiáng)。此外,其它統(tǒng)計(jì)分析方法,如參數(shù)檢驗(yàn)、回歸分析、因子分析和主成分分析等也常用于市場(chǎng)調(diào)查數(shù)據(jù)分析。這些方法各具特色,但使用它們或者需要假定數(shù)據(jù)總體符合一定的分布,或者要求數(shù)據(jù)有較強(qiáng)的相關(guān)性。由于市場(chǎng)調(diào)查多采用問卷調(diào)查形式,它的數(shù)據(jù)常呈現(xiàn)小樣本、噪聲大的特點(diǎn),且定性數(shù)據(jù)多,難以找出數(shù)據(jù)的統(tǒng)計(jì)分布規(guī)律,因而使用這些統(tǒng)計(jì)方法的前提條件很難保證。
數(shù)據(jù)分組處理方法(Group Method of Data Handling,簡(jiǎn)稱GMDH)是一種新興的數(shù)據(jù)挖掘方法,它由烏克蘭科學(xué)院A.G.Ivakhnenko院士于1969年提出[1]。GMDH建立在人類生存歷史中最古老、最富有成效的試探法則選擇學(xué)說(shuō)基礎(chǔ)之上,它將黑箱思想、生物神經(jīng)元方法、歸納法和Gdel的數(shù)理邏輯方法有機(jī)地結(jié)合起來(lái)。GMDH具有揭示經(jīng)濟(jì)對(duì)象構(gòu)成因素的功能,能從眾多對(duì)經(jīng)濟(jì)對(duì)象有影響的因素中篩選出有重要影響的因素;對(duì)于有噪聲的小樣本數(shù)據(jù),它通過建立非物理模型,能給出較準(zhǔn)確的擬合與過程預(yù)測(cè)。上世紀(jì)90年代,德國(guó)學(xué)者J.A.Mueller和軟件專家L.Frank將GMDH的基本思想用于其它數(shù)據(jù)挖掘方法,建立了非參數(shù)GMDH,并編制了功能強(qiáng)大的Knowledge Miner軟件,使GMDH從理論、方法和應(yīng)用諸方面上了一個(gè)新的平臺(tái)[2]。非參數(shù)GMDH由GMDH的思想運(yùn)用于其它數(shù)據(jù)挖掘方法構(gòu)成,它包括:自組織模糊規(guī)則歸納(Self-Fuzzy Rule Induction using GMDH ,簡(jiǎn)稱FRI)、客觀聚類分析(Objective Cluster Analysis,簡(jiǎn)稱OCA)、相似體合成(Analog Complexing ,簡(jiǎn)稱AC)[3]。非參數(shù)GMDH既保持了GMDH的適于有噪聲的小樣本數(shù)據(jù)分析建模預(yù)測(cè)的優(yōu)點(diǎn),又具有相應(yīng)的數(shù)據(jù)挖掘方法的功能,它用于經(jīng)濟(jì)、金融、生態(tài)等復(fù)雜系統(tǒng)領(lǐng)域的建模分析已有許多成功實(shí)例,但未見有用于市場(chǎng)調(diào)查數(shù)據(jù)分析的研究。市場(chǎng)調(diào)查數(shù)據(jù)具有小樣本、有噪聲且定性數(shù)據(jù)多的特點(diǎn),正好適宜使用非參數(shù)GMDH方法。因此,以下研究擬將FRI方法用于企業(yè)市場(chǎng)調(diào)查數(shù)據(jù)分析,以期給市場(chǎng)調(diào)查數(shù)據(jù)分析提供一條新的有效途徑。
二、FRI方法在市場(chǎng)調(diào)查中的運(yùn)用
FRI本質(zhì)上是一種規(guī)則歸納的方法,應(yīng)用對(duì)象特點(diǎn)是輸入輸出變量模糊化具有實(shí)際意義,其用于市場(chǎng)調(diào)查數(shù)據(jù)分析主要是通過算法提取市場(chǎng)中不同消費(fèi)者的特征規(guī)則。用這一特征規(guī)則來(lái)作為消費(fèi)者特征的描述,它的應(yīng)用分為以下幾個(gè)步驟:
1.?dāng)?shù)據(jù)的預(yù)處理。市場(chǎng)調(diào)查的數(shù)據(jù)一般是通過調(diào)查問卷的形式取得,原始數(shù)據(jù)都是問題的選項(xiàng),不能直接用于建模,必須進(jìn)行預(yù)處理。首先從調(diào)查問卷中選取企業(yè)關(guān)心的問題和因素,將這些問題轉(zhuǎn)化為變量,并將每個(gè)消費(fèi)者(樣本)對(duì)于問題的選擇轉(zhuǎn)化為對(duì)應(yīng)的變量值。調(diào)查問卷的問題一般包含三種形式:選擇題(包括單選和多選);填空題;打分和排序。對(duì)于單選題每一個(gè)選項(xiàng)轉(zhuǎn)換為一個(gè)0-1二值變量。被調(diào)查者選擇了哪一項(xiàng),則對(duì)應(yīng)的變量值為1,其余項(xiàng)對(duì)應(yīng)的變量值均為0。如果多選和打分,則每個(gè)問題轉(zhuǎn)化一個(gè)變量,前者的值是被調(diào)查者選項(xiàng)的序號(hào),后者則是打分的值。對(duì)于填空題,則直接將所填數(shù)值作為變量值。
2. 消費(fèi)者群體的劃分和研究對(duì)象的選定。這由FRI算法本身的特點(diǎn)所決定的,F(xiàn)RI 算法是一種規(guī)則歸納的方法,它是通過不同群體的對(duì)比找出某一群體的主要特征,如果沒有群體的劃分,算法就不可能實(shí)現(xiàn)。在細(xì)分消費(fèi)者群體后,可以根據(jù)實(shí)際情況選擇感興趣的群體進(jìn)行研究。
3.?dāng)?shù)據(jù)的模糊化。這里需要分別對(duì)輸入變量和輸出變量進(jìn)行模糊化。一般將所要研究的消費(fèi)者特征屬性對(duì)應(yīng)的變量作為輸入變量,而以類別標(biāo)志變量作為輸出變量。對(duì)于輸出變量一般構(gòu)造二三個(gè)等級(jí)的模糊子集進(jìn)行模糊化,比如對(duì)于某一因素的評(píng)價(jià)值對(duì)應(yīng)的三個(gè)等級(jí)模糊子集為{重要}、{一般}和{不重要}。對(duì)于輸出變量 對(duì)應(yīng)的模糊向量 可以通過第二步中的消費(fèi)者群體的劃分得到,對(duì)于第t個(gè)樣本的輸出變量yt對(duì)應(yīng)于一個(gè)m維的模糊向量( m表示劃分的消費(fèi)者群體的數(shù)量,其中 表示樣本對(duì)于第j類群體的隸屬度。在實(shí)際的運(yùn)用中,一般都簡(jiǎn)單地取為0或1,即如果第t個(gè)樣本劃分到了第j個(gè)群體中,則 。
4.規(guī)則的提取及分析驗(yàn)證。數(shù)據(jù)經(jīng)過模糊化以后,就可以運(yùn)用FRI算法提取規(guī)則,分析消費(fèi)者特征。假設(shè)將消費(fèi)者細(xì)分為a和b兩類群體,通過算法得到規(guī)則:
IF
mn or h
THEN
a
這里可將邏輯符號(hào)OR連接的各部分分別稱為一個(gè)子規(guī)則,比如在上面提取的這個(gè)規(guī)則中,財(cái)經(jīng)理論與實(shí)踐(雙月刊)2007年第3期2007年第3期(總第147期)谷月東,鄭明翠:模糊法則歸納法在市場(chǎng)調(diào)查分析中的應(yīng)用研究就分別有mn和h兩個(gè)子規(guī)則。這里需要引入一個(gè)支持度(S)的概念,它代表規(guī)則的顯著程度。一般的數(shù)據(jù)挖掘中將支持度定義為:如果有規(guī)則AB,則支持度S是A∪B的事務(wù)占所有事物的百分比。這里將支持度定義為:對(duì)于子規(guī)則k,它的支持度Sk為一類樣本中符合規(guī)則k的樣本數(shù)占該類樣本總數(shù)的百分比[4]。之所以要引入這一概念是因?yàn)樵趯?shí)際的市場(chǎng)分析中,如果支持度較低,則說(shuō)明具有該種規(guī)則特點(diǎn)的消費(fèi)者占總體的很小一部分,因而對(duì)這部分消費(fèi)者進(jìn)行研究就沒有多大意義。在計(jì)算出每個(gè)子規(guī)則的支持度后,這里假設(shè)子規(guī)則mn的支持度為α%,子規(guī)則h的支持度為β%,則a類消費(fèi)者的特征可以這樣闡述:α%的a類消費(fèi)者具有mn的特點(diǎn),β%的a類消費(fèi)者具有h的特點(diǎn)。同時(shí)需要強(qiáng)調(diào)的是運(yùn)用FRI分析得出的消費(fèi)者的特征是關(guān)鍵性特征,即在所研究的消費(fèi)者群體中比較明顯而在其它消費(fèi)者群體中不太明顯,而對(duì)于不同的消費(fèi)者中間共同特征,該算法在規(guī)則提取的過程中已經(jīng)舍去,這點(diǎn)與其它的數(shù)據(jù)挖掘方法是有區(qū)別的,需要注意。
5.相關(guān)建議的提出。進(jìn)行市場(chǎng)調(diào)查的目的就是為企業(yè)的決策提供建議。因此,對(duì)于數(shù)據(jù)的分析最終還是要落實(shí)到為決策者提供關(guān)于市場(chǎng)和消費(fèi)者的相關(guān)信息和有價(jià)值的建議。
三、移動(dòng)長(zhǎng)話市場(chǎng)實(shí)證分析
通過移動(dòng)長(zhǎng)話的實(shí)證分析可以發(fā)現(xiàn),對(duì)于在細(xì)分市場(chǎng)差異比較明顯時(shí), FRI方法可以有效提取出不同細(xì)分市場(chǎng)各自獨(dú)有的特征。為了增強(qiáng)實(shí)證分析的說(shuō)服力,選用了兩個(gè)具有代表性的市場(chǎng)進(jìn)行分析。
(一)西安市手機(jī)長(zhǎng)話細(xì)分市場(chǎng)特征分析
以西安市手機(jī)長(zhǎng)話市場(chǎng)調(diào)查數(shù)據(jù)為基礎(chǔ)得到23個(gè)方面的問題形成35個(gè)輸入屬性變量。有140個(gè)樣本數(shù)據(jù),其中有103個(gè)是直撥的消費(fèi)者和37個(gè)是使用IP卡的消費(fèi)者。根據(jù)上述信息提取西安市市場(chǎng)直撥消費(fèi)者和使用IP卡的消費(fèi)者的特征信息,以供企業(yè)作營(yíng)銷決策。
隨機(jī)選取120個(gè)樣本作為學(xué)習(xí)集,20個(gè)樣本作為驗(yàn)證集 根據(jù)上述的步驟,運(yùn)用軟件Knowledge Miner提取規(guī)則得到以下IP卡消費(fèi)者和直撥消費(fèi)者的特征規(guī)則。
對(duì)于規(guī)則(1)在學(xué)習(xí)集中17個(gè)分類錯(cuò)誤,正確率為85.44%,在驗(yàn)證集中3個(gè)分類錯(cuò)誤,正確率為85%,可以用來(lái)描述IP卡使用者的特征。
規(guī)則(1)的解釋為:對(duì)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用比較了解(N—X1)并且對(duì)手機(jī)國(guó)內(nèi)漫游的費(fèi)用組成比較了解的消費(fèi)者(N—X2)或是認(rèn)為使用IP卡相對(duì)于座機(jī)打長(zhǎng)話便宜的消費(fèi)者(P—X4)或文化程度較高(P—X10)、經(jīng)常使用短信減少話費(fèi)(N—X6)、認(rèn)為使用IP卡相對(duì)座機(jī)打長(zhǎng)途方便(N—X5)的年輕消費(fèi)者(N—X9)是IP卡的使用者。
規(guī)則(1)歸納出IP卡使用者的三種特征。通過市場(chǎng)調(diào)查數(shù)據(jù)得出具有這三種特征的消費(fèi)者占IP卡的使用者的構(gòu)成為:48.64%的消費(fèi)者對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用(N—X1)和國(guó)內(nèi)漫游的費(fèi)用(N—X2)組成比較了解;10.81%的消費(fèi)者認(rèn)為使用IP卡相對(duì)于座機(jī)打長(zhǎng)話便宜(P—X4);51.35%消費(fèi)者是文化程度較高(P—X10)、經(jīng)常使用短信減少話費(fèi)(N—X6)、認(rèn)為使用IP卡相對(duì)座機(jī)打長(zhǎng)途查撥號(hào)方便(N—X5)的年輕人(N—X9)。
2. 直撥消費(fèi)者的特征規(guī)則
IF ZO—X9
OR
P—X1 N—X4
THEN N—Y
(2)
對(duì)于規(guī)則(2)在學(xué)習(xí)集中24個(gè)分類錯(cuò)誤,正確率為80%,在驗(yàn)證集中3個(gè)分類錯(cuò)誤,正確率為85%,模型精確度比較高,說(shuō)明用模型提取的規(guī)則來(lái)解釋直撥消費(fèi)者的特征是可行的。
規(guī)則(2)解釋為:中年消費(fèi)者(ZO—X9)或是對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1)并且認(rèn)為直撥相對(duì)座機(jī)打長(zhǎng)途比較方便的消費(fèi)者(N—X4)是直撥消費(fèi)者。由此可歸納出直撥業(yè)務(wù)的使用者的兩種特征。通過已有的市場(chǎng)調(diào)查數(shù)據(jù)得出具有這兩種特征的消費(fèi)者占直撥消費(fèi)者的構(gòu)成為: 46.60%消費(fèi)者屬于中年人(ZO—X9);77.67%消費(fèi)者對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1)并且認(rèn)為直撥相對(duì)座機(jī)打長(zhǎng)途比較方便(N—X4)。
由(1)和(2)可以分析出,在西安市移動(dòng)長(zhǎng)話業(yè)務(wù)市場(chǎng)的消費(fèi)者中,使用直撥的消費(fèi)者和使用IP卡的消費(fèi)者的特征是不同的:其一,使用IP卡消費(fèi)者多數(shù)是文化層次較高的年輕人,使用IP卡主要是為了節(jié)省話費(fèi)(占IP卡使用者的51.35%)。如果陜西省電信公司想要爭(zhēng)奪這部分消費(fèi)者,則應(yīng)在該群體的集中地,例如高校開展?fàn)I銷活動(dòng),同時(shí)推出相應(yīng)的業(yè)務(wù)時(shí)應(yīng)該把價(jià)格放在首位,并在撥打的方便性上做文章。其二,對(duì)于直撥的消費(fèi)者來(lái)說(shuō),這個(gè)群體主要是中年人(占直撥消費(fèi)者的46.60%),并且由規(guī)則可知,中年人一般都使用直撥。他們考慮的主要是方便性,對(duì)于價(jià)格或是不太在意,或是不太了解(占直撥消費(fèi)者的77.67%)。如果電信想進(jìn)入這個(gè)消費(fèi)群體,則應(yīng)該著重在提高服務(wù)質(zhì)量、增加消費(fèi)者的使用方便性方面下工夫。(二)寶雞市長(zhǎng)話市場(chǎng)分析
以寶雞市手機(jī)長(zhǎng)話市場(chǎng)調(diào)查數(shù)據(jù)為基礎(chǔ)得到23個(gè)方面的問題形成35個(gè)輸入屬性變量,有140個(gè)樣本數(shù)據(jù),其中有103個(gè)是直撥的消費(fèi)者和37個(gè)是使用IP卡的消費(fèi)者。根據(jù)上述信息提取寶雞市市場(chǎng)直撥消費(fèi)者和使用IP卡的消費(fèi)者的特征信息,以供企業(yè)作營(yíng)銷決策。
隨機(jī)選取60個(gè)樣本作為學(xué)習(xí)集,27個(gè)樣本作為驗(yàn)證集(NL=60,Nv=27),運(yùn)用軟件Knowledge Miner提取規(guī)則得到IP卡消費(fèi)者和直撥消費(fèi)者的特征規(guī)則。
1. IP卡消費(fèi)者的特征規(guī)則
IF P—X5
OR
N—X3 N—X81 N—X9
THEN P—Y
(3)
對(duì)于規(guī)則(3)在學(xué)習(xí)集中6個(gè)分類錯(cuò)誤,正確率為90%,在驗(yàn)證集中5個(gè)分類錯(cuò)誤,正確率為81.48%,模型精確度比較高,說(shuō)明用模型提取的規(guī)則來(lái)解釋IP卡消費(fèi)者的特征是可行的。
對(duì)于規(guī)則(3)的解釋為:認(rèn)為使用IP卡相對(duì)座機(jī)打長(zhǎng)途不太方便(N—X5)的消費(fèi)者或是認(rèn)為固定電話撥打與手機(jī)長(zhǎng)話撥打相比通話質(zhì)量較好(N—X3),對(duì)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用比較了解(N—X1)的年輕消費(fèi)者(N—X9)是IP卡的使用者。
規(guī)則(3)歸納出IP卡使用者的兩種特征,通過調(diào)查數(shù)據(jù)得出具有這兩種特征的消費(fèi)者占IP卡的使用者的構(gòu)成為:1)4.76%的消費(fèi)者認(rèn)為使用手機(jī)IP卡打長(zhǎng)途不如使用座機(jī)方便(N—X5);2)66.67%%的消費(fèi)者認(rèn)為固定電話撥打長(zhǎng)話比手機(jī)撥打通話質(zhì)量好(N—X3),對(duì)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用比較了解(N—X1)的年輕人(N—X9)。
對(duì)于特征1)來(lái)說(shuō),具有這種特征的消費(fèi)者比例較小,可以將它忽略,因而寶雞市的IP卡消費(fèi)者主要是具有特征2)所描述的特征。
2. 直撥消費(fèi)者的特征規(guī)則
IF P—X3
OR
P—X1 P—X8 OR
ZO_X9
OR
P—X1 N—X7
THEN N—Y
(4)
對(duì)于規(guī)則(4)在學(xué)習(xí)集中有5個(gè)分類錯(cuò)誤,正確率為91.67%,在驗(yàn)證集中5個(gè)分類錯(cuò)誤,正確率為81.48%,模型精確度也比較高,可以用來(lái)描述IP卡使用者的特征。
規(guī)則(4)解釋為:認(rèn)為固定電話撥打與手機(jī)長(zhǎng)話撥打相比通話質(zhì)量較差的消費(fèi)者(P—X3),或是對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1),并且使用手機(jī)的同時(shí)不用小靈通(P—X8)的消費(fèi)者或是中年消費(fèi)者(ZO—X9),或是離開本地到異地時(shí)仍然使用手機(jī)撥打或接聽電話(N—X7)并對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1)的消費(fèi)者是直撥消費(fèi)者。規(guī)則(4)歸納出直撥業(yè)務(wù)的使用者四種特征,通過市場(chǎng)調(diào)查數(shù)據(jù)得出具有這四種特征的消費(fèi)者占直撥消費(fèi)者的構(gòu)成為: 1)3.03%的消費(fèi)者認(rèn)為固話撥打與手機(jī)長(zhǎng)話撥打相比通話質(zhì)量較差(P—X3);2)72.73%消費(fèi)者對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1),并且使用手機(jī)的同時(shí)不用小靈通(P—X8);3)52.42%的消費(fèi)者屬于中年人(ZO—X9);4)78.79%的消費(fèi)者離開本地到異地時(shí)仍然使用手機(jī)撥打或接聽電話(N—X7)并對(duì)于手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用不了解(P—X1)。
對(duì)于特征1)來(lái)說(shuō),具有這種特征的消費(fèi)者比例較小,可以將它忽略,因而寶雞市的直撥消費(fèi)者主要是具有2)3)4)所描述的特征。
由(3)和(4)可以分析出,在寶雞市移動(dòng)長(zhǎng)話業(yè)務(wù)的消費(fèi)者中,使用直撥的消費(fèi)者和使用IP卡的消費(fèi)者各自的特征大體上與西安市一致。使用IP卡消費(fèi)者多數(shù)是年輕人,使用IP卡主要是為了節(jié)省話費(fèi)(占IP卡使用者的66.67%)。對(duì)于直撥的消費(fèi)者來(lái)說(shuō),主要仍是中年人(占直撥消費(fèi)者的52.42%)。稍有不同的IP卡的使用者中有66.67%的消費(fèi)者認(rèn)為手機(jī)IP卡通話質(zhì)量不如座機(jī),因而電信如要爭(zhēng)奪寶雞市的這個(gè)消費(fèi)群體,則可以大力宣傳座機(jī)打長(zhǎng)途的通話質(zhì)量。而對(duì)于直撥消費(fèi)者也發(fā)現(xiàn)了兩個(gè)新的特征,78.79% 的消費(fèi)者離開本地到異地時(shí)仍然使用手機(jī)撥打或接聽電話,72.73%的消費(fèi)者使用手機(jī)的同時(shí)不使用小靈通,說(shuō)明寶雞市的這類消費(fèi)者是手機(jī)的堅(jiān)定使用者,陜西省電信公司通過推出小靈通進(jìn)入這個(gè)細(xì)分市場(chǎng)非常困難。
四、結(jié) 論
通過上面對(duì)西安市和寶雞市電信長(zhǎng)話市場(chǎng)用FRI方法提取規(guī)則的分析,可以得出兩個(gè)消費(fèi)者群體特點(diǎn):直撥消費(fèi)者以中年人為主,IP卡的消費(fèi)者以年輕人為主。用FRI方法建立的模型精確度較高(在學(xué)習(xí)集和驗(yàn)證集上的分類精度都達(dá)到80%以上)。FRI方法提取了直撥消費(fèi)者以中年人為主,IP卡的消費(fèi)者以年輕人為主等特征(在IP卡的消費(fèi)者中,年輕人所占比例為西安市81.08%,寶雞市90.47% ,在直撥消費(fèi)者中,中年人所占比例為西安市46.60%,寶雞市52.42%)。這些特征在直撥和IP 卡兩個(gè)細(xì)分市場(chǎng)的差異是明顯的,說(shuō)明如果不同的消費(fèi)群體特征差異明顯,可以很好地利用FRI方法來(lái)提取各個(gè)群體消費(fèi)者的特征。
參考文獻(xiàn):
[1]劉普寅, 吳孟達(dá). 模糊理論及其應(yīng)用[M].長(zhǎng)沙: 國(guó)防科技大學(xué)出版社,1998.
[2]張永生.廠商規(guī)模無(wú)關(guān)論理論與經(jīng)驗(yàn)證據(jù)[M].北京:中國(guó)人民大學(xué)出版社,2003.
[3]何躍. 模糊法則歸納法及GDP主要影響因素研究[J]. 電子科技大學(xué)學(xué)報(bào),2002,31(1).
[4]鄭明翠, 賀昌政.自組織數(shù)據(jù)挖掘與回歸分析方法的比較研究[J].系統(tǒng)工程與電子技術(shù),2005,27(10).
附錄1:
X1-.是否知道手機(jī)用IP卡撥打國(guó)內(nèi)長(zhǎng)途的費(fèi)用組成:
1……知道
2……不知道
X2-.是否知道目前手機(jī)國(guó)內(nèi)漫游的費(fèi)用組成:
1……知道
2……不知道
X3-.固話撥打與手機(jī)長(zhǎng)話撥打相比:
1……通話質(zhì)量較好
2……通話質(zhì)量較差
X4-.手機(jī)長(zhǎng)話撥打與固話撥打相比:
1……話費(fèi)較貴
2……話費(fèi)較便宜
X5-.手機(jī)長(zhǎng)話撥打與固話撥打相比:
1……查撥號(hào)方便
2……查撥號(hào)不方便
X6-.經(jīng)常用手機(jī)短信方式來(lái)避免或減少手機(jī)長(zhǎng)話:
1……是
2……偶爾用
3……不用
X7-.離開本地到異地時(shí),是否使用手機(jī)撥打或接聽電話:
1……是
2……否
X8-.使用手機(jī)的同時(shí),是否也使用小靈通呢:
1……是
2……沒有
X9-.被訪者的年齡:
1…青年人(35歲以下)
2…中年人(35-50歲)
3…中年人(50歲以上)
X10-.受教育程度:
1…初中以下
2…高中(中專/技校/職高)
3…大專以上
The Study on the Application of Fuzzy Rule Induction in the
Market Research Analysis GU Yuedong1,ZHEN Mingcui2
(1.The School of Economics and Finance, Xi'an Jiaotong University, Xi'an,Shanxi 710100,China;
2.The School of Management, Sichuan University, Chengdu,Sichuan 610000,China)Abstract:Fuzzy Rule Induction (FRI) is an advanced new tool in data mining. It combines fuzzy modeling technique and selforganising data mining technique, and has been successfully used in many fields such as finance, economic, etc. On the basis of reviewing traditional market research analysis method, FRI is applied to data analysis in marketing field as consumer features of mobile longdistance telephone market at Xi'an and Baoji in Shanxi province. The findings show that FRI can be applied to abstract the characteristics of the subdivided markets with obvious differences.
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文 ?!?/p>