999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于元胞自動機的世界語言發(fā)展趨勢研究

2019-09-10 07:22:44王雪蕊侯為根陳旬旬

王雪蕊 侯為根 陳旬旬

摘要:為了預(yù)測未來世界語言的發(fā)展趨勢,將基于時間仿真模型與元胞自動機模型結(jié)合,進行時間和空間兩個維度的預(yù)測.首先進行指標(biāo)選取,將算法與BP網(wǎng)絡(luò)結(jié)合,獲得關(guān)鍵參數(shù),最后進行模型擴展,以獲得更大時間跨度的研究內(nèi)容.在此基礎(chǔ)上,構(gòu)建元胞自動機模型,將大地坐標(biāo)系轉(zhuǎn)化成笛卡爾坐標(biāo)系,模擬離散空間變量,并使用維基百科提供的數(shù)據(jù),用Matlab軟件模擬得出結(jié)果.模擬結(jié)果表明,50年后,目前世界排名前十的語言中有四種語言將被替換.語言作為人類交流工具,與經(jīng)濟發(fā)展、文化交流等有密切聯(lián)系,研究結(jié)果可用于預(yù)測未來經(jīng)濟和文化發(fā)展趨勢.

關(guān)鍵詞:時間仿真模型;元胞自動機;語言發(fā)展

中圖分類號:TP391? 文獻標(biāo)識碼:A? 文章編號:1673-260X(2019)07-0065-05

語言是人類交流的工具,目前世界上約有6900種語言,隨著全球化進程的不斷加快,語言也在不斷發(fā)展.語言交際與經(jīng)濟貿(mào)易、國際政治活動有著密切關(guān)系[1],因此準(zhǔn)確預(yù)測未來語言發(fā)展有著重大意義.人們研究語言往往是從它的起源開始研究,涉及的影響因素有地理、歷史、文化等,由感性研究得出的結(jié)論,往往缺少客觀性,得出的結(jié)論準(zhǔn)確度不高.還存在一些方法,例如元胞自動機[2]的方法,支持向量機[3]的方法,均是只從空間角度來預(yù)測語言發(fā)展趨勢.本文除了運用元胞自動機的方法,還增加了時間仿真模型,將時間和空間兩個維度結(jié)合起來,基于BP網(wǎng)絡(luò)和Matlab仿真,引入?yún)?shù)推導(dǎo)出算法,更準(zhǔn)確地預(yù)測了未來語言發(fā)展趨勢.

現(xiàn)今世界語言的分布不僅受到地區(qū)經(jīng)濟發(fā)展?fàn)顩r、歷史因素及人口遷移的影響,還與一個國家的政策開放程度等因素有關(guān).人口出生和死亡必將影響各語言使用者總數(shù),由于戰(zhàn)爭、移民等導(dǎo)致的人口遷入和遷出也是影響因素,因為現(xiàn)代經(jīng)濟發(fā)展的需求,各國人口在將本國語言作為母語的同時,還可能掌握一種或多種語言作為第二語言,所以語言之間的轉(zhuǎn)換現(xiàn)如今也成了影響因素之一.

時間仿真模型認為不同語言使用者的數(shù)量可以相互傳遞,語言使用者的總數(shù)只與出生率,死亡率,遷入率,遷出率和轉(zhuǎn)換率有關(guān).語言使用者總數(shù)隨時間變化,隨著時間的推移獲得各種語言使用者的數(shù)量.元胞自動機模型將地球表面劃分為[-89,89]×[0,359]細胞,這與經(jīng)度和緯度一致.在語言的初始值被選中后,它將遵循本文定義的規(guī)則.在模擬中,我們將得到每種語言在地理上的分布.本本文的模型使用維基百科提供的當(dāng)前各種語言使用者數(shù)量[4]進行驗證.兩種模型模擬了2016年的數(shù)據(jù),并且得出的結(jié)果顯示了與2017年世界語言分布較為一致.因此,在此基礎(chǔ)上的擴展模型可以用來研究50年內(nèi)的語言發(fā)展趨勢.

1 指標(biāo)選取和解釋

本文選取了出生率、死亡率、遷入率、遷出率、語言轉(zhuǎn)換率五個指標(biāo)作為影響因素,下面對它們做出詳細解釋.

1.1 出生率和死亡率

很顯然,出生和死亡帶來人口數(shù)量的變化,隨之帶來語言使用者數(shù)量的變化,

一般地,出生率有以下計算公式:

這里,S指的是各國人口出生總?cè)藬?shù),M為世界總?cè)丝跀?shù),但由于地理環(huán)境、生活習(xí)慣、國家政策的不同,世界195個國家的出生率?琢和死亡率?茁也不盡相同,因此本文的?琢和?茁的計算均采用平均值計算公式:

在此,出生率和死亡率將是一個恒定的平均值,并且指的是日出生率和日死亡率,k=1,…,195指的是國家數(shù),?琢k指的是各國人口出生率,?茁k指的是各國人口死亡率,mk指的是各國人口數(shù),M指的是世界總?cè)丝跀?shù).

1.2 遷入率和遷出率

毫無疑問,遷入人口對第二語言的沖擊力最大,由于遷入人口在遷入國的生存壓力或環(huán)境影響下將被迫或主動掌握該國家的語言,形成第二語言,且隨著時間的發(fā)展,遷入人口的后代將以極大概率把遷入國語言轉(zhuǎn)變?yōu)槟刚Z使用,因此,遷入人口的增加勢必會增加遷入國語言使用者的數(shù)量.因種族、文化、信仰、政策的不同,遷入率?酌和遷出率?啄也同樣會因為國家的不同而不同,所以本文對遷入率和遷出率同樣采用平均值算法:

在此,遷入率和遷出率將是一個恒定的平均值,并且指的是日遷入率和日遷出率,k=1,…,195指的是國家數(shù),?酌k指的是各國人口遷入率,?啄k指的是各國人口遷出率,mk指的是各國人口數(shù),M指的是世界總?cè)丝跀?shù).

1.3 語言轉(zhuǎn)換率

語言轉(zhuǎn)換率為一種語言使用者學(xué)習(xí)另外一種語言,從而忘記其母語語言的概率.當(dāng)一種語言很少被使用時,或者該語言本身較難學(xué)習(xí)時,一般而言會增加該國大部分人放棄學(xué)習(xí)該國語言的概率,并選擇學(xué)習(xí)一種較為簡單通用的語言以供交流,例如拉丁語[5]就是一種日常口語已經(jīng)消亡的西方古典語言,今天一般只作為文獻語言以供研究.此外如果一個人很少說他的母語,那么他有很大可能不會與另一個說同樣語言的人結(jié)婚,因此,人們普遍認為,他們之間的對話將基于一種常用語言,他的孩子也將學(xué)習(xí)這種通用語言,那么一代代發(fā)展下去,此人的母語有很大可能被遺忘,例如長期生活在漢族地區(qū)的少數(shù)民族的人,他們將很大可能同漢族人結(jié)為夫妻,由于生活、工作和學(xué)習(xí)的原因,他們以及他們的后代將會使用漢語而不是少數(shù)民族語言.此外,當(dāng)發(fā)生戰(zhàn)爭或信仰入侵,也會使語言之間互相轉(zhuǎn)換.社會壓力,政府推動以及文化群體的同化等也會導(dǎo)致語言之間發(fā)生轉(zhuǎn)換.

∈ij表示從語言i到j(luò)的轉(zhuǎn)換率.一般來說,它可以定義為:

這里,tij指的是語言i轉(zhuǎn)化為語言j的人數(shù),mi指的是語言i的使用者總數(shù),事實上,很難找到有多少人學(xué)習(xí)新語言并且忘記他們的母語,因此,我們決定將本文設(shè)計的算法與BP(背景傳播)神經(jīng)網(wǎng)絡(luò)結(jié)合起來.根據(jù)聯(lián)合國教科文組織最新發(fā)布的世界瀕危語言圖譜[6]可知,全世界大約有7000種語言,其中一半以上的語言將在21世紀(jì)末消亡,80%—90%則在未來的200年內(nèi)滅絕,基于語言的影響力,本文只選取當(dāng)今世界排名前26名的語言進行研究,這26種語言分別是:漢語普通話、英語、印度語、西班牙語、阿拉伯語、馬來語、俄語、孟加拉語、法語、葡萄牙語、豪薩語、旁遮普語、日語、德語、波斯語、斯瓦希里語、泰盧固語、爪哇語、吳語、韓語、泰米爾語、馬拉提語、粵語、土耳其語、越南語、意大利語.將2016年語言排名前26的使用者人數(shù)作為初值,即p0,與2017年維基百科的數(shù)據(jù)形成鮮明對比.因此得到26輸入和26輸出的權(quán)重矩陣[7].圖1為BP網(wǎng)絡(luò)圖.

在此,p0指的是語言使用者數(shù)量初值,權(quán)重矩陣是∈ij矩陣.在網(wǎng)絡(luò)[8]中,有26個隱藏層和26個神經(jīng)細胞.2016年各種語言的總使用者是輸入,而2017年各種語言的總使用者是輸出.在訓(xùn)練網(wǎng)絡(luò)后,我們得到了∈矩陣.如圖2所示.

2 時間仿真模型

2.1 基本模型

在時間仿真模型中,將整個世界視為一個整體,分別考慮每種語言.而對于每種語言,使用者的總數(shù)只與出生率,死亡率和每種語言之間的轉(zhuǎn)換率有關(guān),在這里,因為考慮的是時間維度,所以忽視遷入率和遷出率,偏向于出生率、死亡率和語言轉(zhuǎn)換率.關(guān)系如圖3所示.首先,我們只考慮兩種語言.在這個基本模型中,n表示天數(shù),從1月1日開始統(tǒng)計.

3 時空元胞自動機模型

由于世界各語言在不同地理位置上的分布是不同的,因而在考慮時間的同時,還應(yīng)考慮空間因素,為此建立元胞自動機模型.該模型基于時間仿真模型,但更加復(fù)雜.元胞自動機(CA)是一種時間和空間都離散的動力系統(tǒng),其整體行為是在個體行為共同作用下實現(xiàn).本文在研究中采用二維CA,將整個笛卡爾坐標(biāo)系平面看成是一張二維的規(guī)則格網(wǎng),每一格網(wǎng)代表一個元胞,且在任意時刻都有自己的狀態(tài)值,即任意時刻的各語言使用者人數(shù),狀態(tài)的更新依賴于轉(zhuǎn)換規(guī)則函數(shù),即公式(1)(2)(3)(4)(5)(11),元胞下一時刻的狀態(tài)值是由上一時刻該元胞及其鄰域元胞狀態(tài)綜合決定的.

首先,我們將大地坐標(biāo)系轉(zhuǎn)換[9]為笛卡爾坐標(biāo)系.值得注意的是經(jīng)度∈[-180,180],這意味著西經(jīng)180°,東經(jīng)180°.緯度∈[-90,90],這意味著南緯90°,北緯90°.另一個需要注意的是,坐標(biāo)(4,88)并不表示它的經(jīng)度是4°,緯度是88°.實際上,它表示該位置對應(yīng)經(jīng)度軸上的第4元胞和緯度軸上第88元胞.坐標(biāo)(lo,la)代表元胞自動機在每一個小方格的位置,lo表示經(jīng)度軸方向的坐標(biāo),la表示緯度軸方向的坐標(biāo).

圖5闡述了該模型的工作原理:

元胞自動機中每一個格子中的人數(shù)會隨著時間的推移(時間仿真模型)而改變,每個時間步長為一天.元胞自動機模型中,與時間仿真模型不同,此處進行的是空間分布研究,因此會更加關(guān)注遷入率?酌和遷出率?啄.

這里只考慮了3種語言,下面是具體實現(xiàn)過程:

(1)遷移方向和距離:對于每個元胞自動機,它只有四個方向可以遷移:向上,向下,向左和向右.在初始模型[10]中,遷移距離一次不應(yīng)超過10個元胞自動機.由于每個元胞自動機只能移動一次,因此我們需要一種算法來確定方向和距離.實際上,我們定義任何方向具有相同的概率,即:

4 預(yù)測分析

4.1 第一部分

P0為26種語言使用者初值(單位:百萬):

P0=[1090 983 544? 527 422 281 267 261 229 229 150 148 129 129 121 107 92 84 80 77 75 74 72 71 68 66]

首先進行1年內(nèi)26種語言的母語使用人數(shù)的預(yù)測,利用Matlab軟件[11]模擬,模擬365天后,我們得到了以下結(jié)果(單位:百萬):

在此,P0指的是語言使用者總數(shù),根據(jù)結(jié)果,第9種語言(葡萄牙語)成為第10種語言,而第10種語言(法語)成為第9種語言,并且漢語普通話[12]總數(shù)略有下降而英語使用者有所增加,但總體變化幅度不大.

4.2 第二部分

接下來繼續(xù)用matlab來執(zhí)行模擬,時間改為50年,即365×50天,得到以下結(jié)果,P0同上.

由圖8可見,50年的時間跨度內(nèi),語言發(fā)展趨勢變化明顯.觀察可得:(1)上升趨勢明顯型:英語、法語、吳語(上海話).(2)上升趨勢緩慢型:馬來語、日語、德語.(3)變化趨勢平穩(wěn)型:英語、西班牙語、阿拉伯語.(4)波動性下降較為顯著型:漢語普通話、阿拉伯語、俄語.另外,50年后,目前排名前十的名單中有四種語言被替換,它們分別是:西班牙語、俄語、孟加拉語和葡萄牙語,新進入排名前十的四種語言分別是:豪薩語、日語、德語和吳語(上海話).表2是現(xiàn)在世界排名前十的語言以及建模得出的五十年后世界排名前十的語言.

5 結(jié)語

世界在發(fā)展,語言也在不斷發(fā)展,通過建立時間仿真模型和元胞自動機模型,將時間和空間維度相結(jié)合,推算關(guān)鍵參數(shù)和算法,引入BP網(wǎng)絡(luò),并運用Matlab仿真,得出以下結(jié)論.

5.1 50年后,目前排名前十的名單中有四種語言被替換,它們分別是西班牙語、俄語、孟加拉語和葡萄牙語,新進入排名前十的四種語言分別是豪薩語、日語、德語和吳語(上海話).

5.2 英語在50年后將會排名第一,其次是印度語,漢語當(dāng)中有普通話和吳語兩種語言都在前十之列.即具有強烈影響力的語言,大多數(shù)國家更希望選擇它作為他們的第二語言,并且會更快地增加并且更廣泛地使用,這與世界經(jīng)濟發(fā)展?fàn)顩r有關(guān).

本文使用的建模方法還可用于時間跨度更長的語言發(fā)展趨勢研究.但在參數(shù)選取方面,本文假設(shè)未來50年內(nèi)世界處于平穩(wěn)發(fā)展?fàn)顟B(tài),因此將一些參數(shù)考慮為恒定值,若考慮其為動態(tài)可變的,會使得結(jié)果準(zhǔn)確度進一步提高.

參考文獻:

〔1〕袁俏玲.語言與經(jīng)濟的關(guān)系探微[J].湖南科技學(xué)院學(xué)報,2007,28(5):107-109.

〔2〕汪榆淋.基于元胞自動機各語言人口分布分析[J].信息記錄材料,2018,19(10):56-57.

〔3〕佟凱文,汪超,劉超.基于支持向量機的世界語言發(fā)展趨勢研究[J].中國高新區(qū),2018,41(13):58-59.

〔4〕Wikipedia,the free encyclopedia.List of languages by number of native speakers[OL].2018.https://en.wikipedia.org/wiki/List_of_languages _by_number_of_native_speakers.

〔5〕羅建平.西方古文明與拉丁語的興亡——政治與語言的關(guān)系研究[J].海外英語,2011,9(3):204-205.

〔6〕聯(lián)合國教科文組織.全球瀕危語言地圖[OL].2018.360百科:https://baike.so.com /doc/668 6574-6900477.html.

〔7〕任謝楠.基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化研究及MATLAB仿真[D].天津:天津師范大學(xué)計算機與信息工程學(xué)院,2014.

〔8〕熊少康,王凌川,章家?guī)r,郭許林,馮旭剛.基于BP神經(jīng)網(wǎng)絡(luò)的車輛動態(tài)稱重技術(shù)[J].安徽工業(yè)大學(xué)學(xué)報,2014,31(1):76~79.

〔9〕張龍,汪新慶,劉岳,常力恒.一種MapGIS向ArcGIS地圖數(shù)據(jù)轉(zhuǎn)換的方法[J].測繪科學(xué),2014,39(7):146-149.

〔10〕Jay Belanger et.al. Mathematical Modeling for the MCM/ICM Contests[J].Higher Education Press,2015,Volume 1:1-20.

〔11〕張志涌,楊祖櫻.Matlab教程[M].北京:航空航天大學(xué)出版社,2015.

〔12〕李娟,龍四古.人類語言發(fā)展與制度調(diào)適——兼評中國現(xiàn)行外語教育制度[J].太原師范學(xué)院學(xué)報,2007,6(1):43-46.

主站蜘蛛池模板: 国产v精品成人免费视频71pao| 欧美一级高清片欧美国产欧美| 999国产精品永久免费视频精品久久 | 青青操视频免费观看| 亚洲无码日韩一区| 伊大人香蕉久久网欧美| 欧美午夜视频| 婷婷伊人久久| 亚洲黄网视频| 免费中文字幕一级毛片| 国产在线观看99| 日韩不卡免费视频| 日本人真淫视频一区二区三区| 91日本在线观看亚洲精品| 久996视频精品免费观看| 欧美日本在线| 成人在线不卡| 欧美精品v| 秋霞午夜国产精品成人片| 国产尤物在线播放| 午夜久久影院| 亚洲中文精品人人永久免费| 国产视频 第一页| 99re在线视频观看| 国产精品视频第一专区| 欧美日韩中文国产va另类| 欧美亚洲第一页| 香蕉国产精品视频| 亚洲国模精品一区| 国产综合网站| 亚洲成在人线av品善网好看| 一本大道香蕉久中文在线播放| 国产91透明丝袜美腿在线| 国产精品熟女亚洲AV麻豆| 欧美 国产 人人视频| 免费女人18毛片a级毛片视频| 欧美人与动牲交a欧美精品| 日韩在线视频网站| 日本亚洲国产一区二区三区| 亚洲综合色婷婷中文字幕| 国产真实乱子伦视频播放| 亚洲中文字幕日产无码2021| 亚洲欧美精品一中文字幕| 伊人激情综合网| 久久精品国产免费观看频道| 亚洲一区二区精品无码久久久| 国产精品视频观看裸模| 99re视频在线| 成人午夜视频免费看欧美| 亚洲欧州色色免费AV| 欧洲日本亚洲中文字幕| 2021国产精品自拍| 亚洲色无码专线精品观看| 国产香蕉97碰碰视频VA碰碰看| 狠狠亚洲婷婷综合色香| 精品视频一区二区三区在线播| 亚洲熟女中文字幕男人总站| 在线精品欧美日韩| 免费啪啪网址| 欧美高清国产| 女人18毛片一级毛片在线 | 亚洲品质国产精品无码| 国产精品爆乳99久久| 欧美激情网址| 日韩亚洲综合在线| 国产丰满大乳无码免费播放 | 无码内射中文字幕岛国片| 最新痴汉在线无码AV| 免费人成网站在线高清| 婷婷亚洲综合五月天在线| 91年精品国产福利线观看久久| 国产va免费精品观看| 国产网站免费| 午夜无码一区二区三区| 国产精品999在线| 亚洲精品高清视频| 亚洲第一中文字幕| 精品视频一区二区三区在线播| 亚欧美国产综合| 日本91视频| 亚洲天堂久久久| 专干老肥熟女视频网站|