999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K均值聚類的壯語潛在使用者分析

2020-04-29 09:23:00賀梓涵許靜王智文
魅力中國 2020年49期

賀梓涵 許靜 王智文

(廣西科技大學,廣西 柳州 545001)

語言具有非常重要的經濟價值,各個學界對語言經濟關注最多的就是像英語、漢語這樣的通用語言,不過,在我國這個56個民族共同發展的國家,中華文化博大精深,但是國內目前對少數民族語言的關注還是甚少。開發和研究少數民族語言的經濟價值是社會文化和區域經濟發展的需要,目前國內的一些學者對語言資源和語言經濟的研究也取得了一系列的研究成果。李現樂、劉芳在《開發少數民族語言經濟價值的意義與途徑》中,從語言生活、語言權利和語言問題等多個角度研究分析了開發少數民族語言的意義,不僅僅只包含了經濟意義,該文章以少數民族地區旅游業為例,研究分析了少數民族語言在民族地區旅游業發展過程中所遇到的挑戰和機遇,提出了開發少數民族語言經濟的諸多途徑。張靜的《漢語作為第二語言需求研究的語言經濟及規劃意義分析》在語言經濟理論和需求分析理論指導下,具體探討了漢語作為第二語言的語言需求分析研究在擴大漢語需求、促進語言消費與就業、帶動漢語文化產業、發展語言經濟以及制定國家語言政策等方面的重要意義。

廣西壯族自治區地理位置優越,南邊臨近北部灣,與東南亞相通,西南方向毗鄰越南,東鄰粵、港、澳地區,北連我國華中地區。廣西壯族自治區是我國西南地區最方便快捷的一個出海通道,廣西在我國與東南亞的經濟交流中占著非常重要的比例。而壯語作為我國跨境語言之一,壯語與泰語、老撾語、緬甸語等語言有很多相似的地方,由于歷史文化傳統有著共同的來源,這也是廣西壯族自治區域與東南亞國家之間溝通更容易的原因,所以說壯語這門語言是具有不可替代的理論意義和經濟價值。通過對壯語的研究,可以全面地掌握廣西地區壯語的使用情況和流傳現狀,有助于對于壯語幾乎失傳現狀做出一些改變。壯語作為跨境語言,完全可能在未來的社會和經濟發展中起到至關重要的紐帶作用。針對壯語逐漸失傳的現狀,本文將通過一系列調查分析,尋找最可行的壯語開發與傳承的方式。

一、壯語潛在用戶的聚類分析

(一)k-means算法簡介

k-means算法是一種聚類算法,即根據相似性原則,將具有較高相似度的數據對象劃分至同一類簇,將具有較高相異度的數據對象劃分至不同類簇。“類”,顧名思義指的是具有一定相似性的集合,聚類過程是將數據集劃分為若干類,使得各個類之內的數據具有極高的相似度,而類與類之間的相似度盡可能地低,類與類之間的差別大。

K-Means算法是聚類算法的一種,它屬于迭代型算法,該算法的相似指標選取為距離,通常采用歐氏距離,數據集中的K個類先給定,聚類之后的每一個類有一個中心,每個類中所有數據的均值就是這個中心,稱為聚類中心。簡言之,先給定的一個數據集X以及目標聚類的類別個數K,似指標本文選取歐氏距離來計算相似度,聚類目標為最小化,也就意味著實施的K個類的聚類平方和最小。k-means算法以距離作為數據對象間相似性度量的標準,通常采用歐氏距離來計算數據對象間的距離,可以用式(1)來計算歐氏距離。

其中,K表示數據對象的屬性個數。

k-means算法聚類過程中,每次迭代對應的類簇中心需要重新計算。對應類簇中所有數據對象的均值,即為更新后該類簇的類簇中心。定義第k個類簇的類簇中心為Centerk,則類簇中心可以用式(2)來計算。

其中,Ck表示第k個類簇,|Ck|表示第k個類簇中數據對象的個數,求和是指類簇Ck中所有元素在每列屬性上的和,因此,Centerk也是一個含有K個屬性的向量,表示為CenterK=(Centerk,1,Centerk,2,...,Centerk,K)。

k-means算法需要不斷地通過迭代來重新劃分類簇,并更新類簇中心。一般情況,有兩種方法來終止迭代:一種方法是設定迭代次數T,當到達第T次迭代,則終止迭代,此時所得類簇即為最終聚類結果;另一種方法是采用誤差平方和準則函數,函數模型可用式(3)來定義。

其中,K表示類簇個數。當兩次迭代J的差值小于某一閾值時,即 ΔJ<δth時,則終止迭代,此時所得類簇即為最終聚類結果。

(二)k-means聚類分析

K-Means聚類屬于劃分聚類方法[6-8],在研究中將數據集分成 k個簇,并且每個簇存在一個中心,這個中心是這個簇中所有樣本點的均值,將這個中心稱為質心,也叫聚類中心。k均值聚類算法的工作原理如下:第一步,在原始數據集中,隨機選擇k個數據點作為初始質心,即初始聚類中心。第二步:將每個數據點劃分給距離最近的初始質心,衡量兩個樣本數據點的距離有多種不同的方法,最常用的是歐氏距離。第三步:重新計算每個簇的質心作為新的聚類中心,使其總的平方距離和達到最小。接下來反復執行上述的步驟,停止的標志是看數據集是否收斂。

(三)聚類因子的選取

在進行聚類之前,本文研究先進行了市場調查,將所收集的322份數據,經過一系列數據預處理并通過了信度分析以及效度分析檢驗,篩選了對壯語有一定興趣的被調查用戶,保有242個有效樣本,并從調查問卷的調查項目中選取了性別、民族、年齡、壯語掌握程度、感興趣程度、參加活動意愿這六個具有代表意義的因子,由于本研究目的是對壯語感興趣潛在用戶進行研究分析,因此先選取對壯語感興趣的用戶數據,篩掉對壯語不感興趣的用戶數據。

通過調查發現,在問卷中有五個變量(性別、年齡、民族、是否會說壯語、對壯語的興趣)與被調查者是否能夠成為壯語語言潛在使用者之間有著非常大的關聯。除此之外,根據問卷中針對壯語文化活動的問題,本文可以挖掘潛在壯語使用者參加壯語文化活動的意愿。被調查者中,對壯語感興趣,但并未參加過壯語活動且愿意參加壯語活動,那么該調查者參加壯語文化活動的意愿就越大且成為壯語潛在使用者的可能性就更大。本文將性別為女生的被調查者標注為“0”,男生則記為“1”;民族為壯族的被調查者標注為“1”,漢族的記為“2”,其他民族的被調查者則標記為“3”;年齡段分四個階段,18歲以下賦值為“1”,年齡大于十八歲小于三十的調查者標記為“2”,年齡在三十一歲到五十歲之間的被調查者標注為“3”,大于五十歲的被調查者標記為“4”;對于壯語的掌握程度可以分別表示為以下兩種情況,會說壯語標注為“1”,不會說壯語標記為“0”;對于壯語的感興趣程度可以分為三種程度,對壯語非常感興趣的被調查者標記為“2”,對壯語的感興趣程度一般的被調查者標記為“1”,對壯語不感興趣的被調查者標記為“0”,由于本文是對于壯語潛在使用者的研究,故本研究將對壯語不感興趣的被調查者并不納入分析的范圍,最后一個指標即參加壯語文化活動的相應程度,將愿意參加壯語文化活動的人賦值為“1”,不愿意參加者賦值為“0”。

最終確定進行聚類分析的指標有以下六個:S(Sex),N(Nation),A(Age),L(Level of language proficiency),D(Degree of interest),W(Willingness to participate in activities)對應因子分別為:性別、民族、年齡、壯語掌握程度、感興趣程度、參加活動意愿。這六個指標分別用 S、N、A、L、D、W表示作為識別壯語潛在使用者的指標。

表1 潛在壯語使用者指標含義表

二、潛在壯語使用者聚類結果及分析

本文采用了k均值聚類的方法,對242個有效壯語潛在使用者樣本進行群分,242個樣本聚類為四大類,這四大類中依次分別包含了136,100,5,1個樣本,具體聚類結果如下表2所示。由聚類結果ANOVA方差分析表3可知,性別這一因子的p值大于0.05所有性別S這一因子是不顯著的,因此,我們在研究被調查者對壯語文化活動的感興趣程度并挖掘潛在壯語使用者時,男女調查者的人數不均并不會對研究結果造成很大的影響。

表2 潛在壯語使用者類型聚類中心表

表3 ANOVA方差分析表

據潛在壯語使用者類型聚類中心表和特征分析圖(如圖1所示)說明每個不同的壯語潛在使用者都有顯著不同的表現特征,基于該特征描述,本文將潛在用戶分成四個類別:重要潛在壯語活動參加者(II)、重要發展壯語使用者(III)、次要潛在壯語使用者(I)、低價值潛在壯語活動參加者(IV)。其中每種類別的特征如下:

重要潛在壯語活動參加者(II):這類壯語使用者是第 II類潛在壯語活動參加者,是特征分析圖中為橘色線代表,性別為“0”表示為女性,民族為“1”表示該類人群為壯族人,壯語感興趣程度為“2”代表該類壯語使用者對壯語非常感興趣,綜上這類群體主要是女性,年齡在18-30歲之間,是會說壯語且長期居住在柳州的壯族人,已經對壯語有了一定的掌握程度,并且她們對壯語很感興趣在參加壯語文化活動方面非常愿意。結合這類人的問卷分析,這一類人是非常重要的潛在壯語活動參加者,在未來最有可能參加眾多壯語文化活動的人群之一。

重要發展壯語使用者(III):在特征分析圖中灰色圖線代表該類人群,性別為“1”表示為男性,民族為“1”表示該類人群為壯族人,年齡為“3”代表類人群年齡在31到50歲之間,壯語感興趣程度為“2”代表該類壯語使用者對壯語非常感興趣,該類壯語使用者是年齡在31-50歲之間長期居住與柳州的壯族男性,由于這類壯語使用者的家庭成員已擁有一定的壯語聽說能力,因此,這類男性自身對壯語也有一定的掌握,這類壯語使用者對壯語很感興趣,也很樂意參加壯語文化活動。針對這一人群,由于這類壯語使用者的年齡稍微偏大,更多的會關注于壯語文化活動的意義,因此,可以為這類人群可以推薦一些性價比極高的壯語文化活動。

次要潛在壯語使用者(I):這類人群為第I類,在特征分析圖中為藍色線條,第I類主要是年齡在18-30歲的女性群體,這類壯語潛在使用者是居住于柳州的漢族女性,這類壯語潛在使用者中大部分沒有過壯語學習經驗,對壯語的掌握程度幾乎為零。這類人群對壯語感興趣,但是感興趣程度不高,這類群體對參加壯語文化活動具有極高的意愿,這類壯語潛在使用者愿意參加壯語文化活動,因此,很有必要發展該群體,壯語文化活動可以適當針對這類壯語使用者的特點,增大壯語文化短視頻在該類群體的投放量,來刺激這類人群的壯語學習欲望,進而參加壯語文化活動。

低價值潛在壯語活動參加者(IV):這類低價值潛在壯語活動參與者為第IV類,是特征分析圖中淡黃色線條所代表的一類人群,該類人群最為特殊,是長居住于柳州且為其他民族年齡大于50歲的女性,這類人群自身會說壯語,但是對壯語的感興趣程度一般,該類的壯語使用者也不愿意參加壯語文化活動,對壯語文化活動沒有特別強烈的意愿和關注,因此這類壯語使用者相對于壯語文化活動研究的價值不大。

三、結論

基于整個調查過程中的問題及分析的結果來看,對于壯語這門語言,大多數人對壯語的掌握程度為零,漢族人幾乎沒有人會說壯語,在被調查的壯族人中有百分之七十四的壯族人是對壯語有一定的掌握的,但是大多數對壯語有一定掌握的壯語使用者使用壯語的頻率極低。大多數壯語使用者的壯語學習與家庭成員對壯語的掌握程度息息相關,大部分壯語使用者還是通過家庭成員祖代相傳學習得到了壯語,大部分對壯語感興趣的壯語潛在使用者尚未參加過壯語文化活動,大部分壯語潛在使用者愿意參加壯語文化活動,幾乎所有的壯語潛在使用者非常支持壯語以短視頻自媒體形式傳播,大家對傳承壯語文化,鄉村振興,美麗壯族新農村建設都十分的支持。因此,提出以下幾個方面觀點:

(一)擴大壯語學習輔導機構的規模

經過調查,在對壯語有一定掌握程度的壯語使用者中,祖代相傳的比例最高且為28.92%,而通過課程學習的比例最少且為0.30%,除了家人祖代相傳,耳濡目染,學習壯語的方式還需要打開市場的大門。因此,在壯語學習課程這方面,還需要教育機構擴大規模,將相關課程推薦給對壯語有極高興趣但是從沒學習過的壯語潛在使用者,進而擴大壯語輔導課程的市場規模。

(二)增大壯語自媒體傳播的范圍

在自媒體蓬勃發展的時代,大家享受快餐式的數據輸入,大部分人都喜歡幾分鐘能夠吸引人眼球的短視頻例如抖音,快手等。在壯語通過短視頻自媒體傳播的調查中,持反對意見的用戶占調查總人數的2%,因此,要增加壯語自媒體的傳播范圍,加大視頻投放量,短視頻的內容層出不窮,從壯語單詞語法趣味教學視頻,到大眾一起唱壯語山歌的文藝短視頻,再到以壯語來宣傳特色農產品的直播短視頻,只有讓更多的人們看到壯語的價值,才會有更多的壯語潛在使用者參與其中,繼續弘揚壯族文化,開發傳統壯語。

(三)優化壯語文化旅游服務

廣西是一個風景優美,四季宜人的省份,旅游業也是廣西的發展重要途徑之一,經調查,大部分壯語潛在使用者對文化旅游活動有著參加的意愿,本文建議可以在旅游業中加入壯語特色文化,在各旅游景點優化旅游服務,引入“壯語解說”,“壯語山歌大舞臺”等,加大對旅游業和文化結合探索,開發文化旅游新模式,不僅是山美水美人美,更是壯語美文化美,美美與共。同時,在不同的景區建立更多的壯語文化紀念館,提供給游客們參觀學習;開展家家說壯語的農家樂活動,讓游客在旅游的同時,也感受到更加淳樸的壯族文化,來吸引更多的游客,增加游客的體驗感和滿足感,為壯族旅游代言。

(四)深化以壯語文化為基礎的鄉村振興改革

經過調查,認為會帶動經濟發展的用戶占調查總人數的82%。大多數壯語潛在使用者也愿意參加壯語文化活動,根據大家的積極性,十分推薦壯語文化義演走進各大鄉村,讓大家不忘初心,不忘自己本民族的文化,各村建立起壯語文化學習室,將傳統語言文化傳承下去,并在現有的基礎上開發創新更多的新時代壯語文化。除此之外,在經濟方面,各村的農產品可以在營銷模式上加入壯語短視頻的創新營銷方式,打開壯族特色農產品通過自媒體走出壯族的市場大門。

主站蜘蛛池模板: 国产精品大白天新婚身材| 曰韩免费无码AV一区二区| 久久人午夜亚洲精品无码区| 爆操波多野结衣| а∨天堂一区中文字幕| 国产在线精彩视频论坛| 蝴蝶伊人久久中文娱乐网| 中文字幕久久精品波多野结| 一本色道久久88| 国产第四页| 亚洲精品人成网线在线| 天天干天天色综合网| 日韩专区欧美| 88av在线| 风韵丰满熟妇啪啪区老熟熟女| 一级香蕉视频在线观看| 99视频国产精品| 亚洲中文字幕23页在线| 国语少妇高潮| 手机成人午夜在线视频| a毛片免费观看| 99r在线精品视频在线播放| 精品视频第一页| 亚洲视频一区| 青青草国产精品久久久久| 久草美女视频| www.狠狠| 色婷婷成人| 国产无码性爱一区二区三区| 日本午夜精品一本在线观看| 成人午夜视频免费看欧美| 久久国产精品77777| 美女被操黄色视频网站| 国产亚卅精品无码| 国产真实乱人视频| 亚洲无码91视频| 一级福利视频| 黄色片中文字幕| 老司机午夜精品网站在线观看 | 色香蕉影院| 欧洲高清无码在线| 蜜芽国产尤物av尤物在线看| 亚洲 成人国产| 日韩经典精品无码一区二区| 天天视频在线91频| 99资源在线| 无码一区中文字幕| 国产最新无码专区在线| 国产小视频在线高清播放 | 国产精品女人呻吟在线观看| 99精品在线看| yjizz国产在线视频网| 欧美五月婷婷| 伊人久久大香线蕉影院| 亚洲视频四区| 国产午夜福利在线小视频| 亚洲人精品亚洲人成在线| 亚洲日韩高清在线亚洲专区| 久久99热66这里只有精品一| 国产尤物在线播放| 亚洲第一综合天堂另类专| 再看日本中文字幕在线观看| 影音先锋丝袜制服| 亚洲成人网在线播放| 日日碰狠狠添天天爽| 亚洲AV免费一区二区三区| 国产日韩欧美在线视频免费观看| 91啪在线| 国外欧美一区另类中文字幕| 毛片在线播放a| 欧美精品黑人粗大| 欧美激情福利| 无码人妻免费| 不卡午夜视频| 久久成人国产精品免费软件 | 亚洲Av激情网五月天| 国产原创自拍不卡第一页| 国产jizzjizz视频| 亚洲天堂久久新| 亚洲Aⅴ无码专区在线观看q| 亚洲一级色| 91区国产福利在线观看午夜|