唐智杰
1958年,計(jì)算科學(xué)家Rosenblatt提出了由兩層神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)。他給它起了一個(gè)名字--“感知器”(Perceptron),感知器是當(dāng)時(shí)首個(gè)可以學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)。Rosenblatt現(xiàn)場(chǎng)演示了其學(xué)習(xí)識(shí)別簡(jiǎn)單圖像的過(guò)程,在當(dāng)時(shí)的社會(huì)引起了轟動(dòng)。
人們認(rèn)為已經(jīng)發(fā)現(xiàn)了智能的奧秘,許多學(xué)者和科研機(jī)構(gòu)紛紛投入到神經(jīng)網(wǎng)絡(luò)的研究中。美國(guó)軍方大力資助了神經(jīng)網(wǎng)絡(luò)的研究,并認(rèn)為神經(jīng)網(wǎng)絡(luò)比“原子彈工程”更重要。這段時(shí)間直到1969年才結(jié)束,這個(gè)時(shí)期可以看作神經(jīng)網(wǎng)絡(luò)的第一次高潮。
時(shí)至今日,大數(shù)據(jù)技術(shù)已進(jìn)入人們地生活,作為一項(xiàng)發(fā)展前景廣闊地技術(shù),其實(shí)還有很多作用有待挖掘,比如為人們地生活帶來(lái)方便,為企業(yè)帶來(lái)更多利益等。在大數(shù)據(jù)的時(shí)代背景下,數(shù)據(jù)的處理與分析就成了一個(gè)被提上日程的問(wèn)題,而大數(shù)據(jù)與人工智能的緊密相關(guān)性決定了數(shù)據(jù)的發(fā)展模式必定是大數(shù)據(jù)+人工智能的模式。因?yàn)槿斯ぶ悄芩惴ǖ挠?xùn)練與調(diào)優(yōu)離不開(kāi)大量數(shù)據(jù)員,就需要使用大數(shù)據(jù)分析技術(shù)來(lái)對(duì)數(shù)據(jù)源做出歸類(lèi)與過(guò)濾,以提供優(yōu)質(zhì)的數(shù)據(jù)。人工智能的出現(xiàn)于發(fā)展具有重大的意義。
生物神經(jīng)網(wǎng)絡(luò)主要是指人腦的神經(jīng)網(wǎng)絡(luò),它是人工神經(jīng)網(wǎng)絡(luò)的技術(shù)原型。人腦是人類(lèi)思維的物質(zhì)基礎(chǔ),思維的功能定位在大腦皮層,后者含有大約1011個(gè)神經(jīng)元,每個(gè)神經(jīng)元又通過(guò)神經(jīng)突觸與大約103個(gè)其它神經(jīng)元相連,形成一個(gè)高度復(fù)雜高度靈活的動(dòng)態(tài)網(wǎng)絡(luò)。作為一門(mén)學(xué)科,生物神經(jīng)網(wǎng)絡(luò)主要研究人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、功能及其工作機(jī)制,意在探索人腦思維和智能活動(dòng)的規(guī)律。
人工神經(jīng)網(wǎng)絡(luò)是生物神經(jīng)網(wǎng)絡(luò)在某種簡(jiǎn)化意義下的技術(shù)復(fù)現(xiàn),作為一門(mén)學(xué)科,它的主要任務(wù)是根據(jù)生物神經(jīng)網(wǎng)絡(luò)的原理和實(shí)際應(yīng)用的需要建造實(shí)用的人工神經(jīng)網(wǎng)絡(luò)模型,設(shè)計(jì)相應(yīng)的學(xué)習(xí)算法,模擬人腦的某種智能活動(dòng),然后在技術(shù)上實(shí)現(xiàn)出來(lái)用以解決實(shí)際問(wèn)題。因此,生物神經(jīng)網(wǎng)絡(luò)主要研究智能的機(jī)理;人工神經(jīng)網(wǎng)絡(luò)主要研究智能機(jī)理的實(shí)現(xiàn),兩者相輔相成。
多少年以來(lái),人們從醫(yī)學(xué)、生物學(xué)、生理學(xué)、哲學(xué)、信息學(xué)、計(jì)算機(jī)科學(xué)、認(rèn)知學(xué)、組織協(xié)同學(xué)等各個(gè)角度企圖認(rèn)識(shí)并解答上述問(wèn)題。在尋找上述問(wèn)題答案的研究過(guò)程中,逐漸形成了一個(gè)新興的多學(xué)科交叉技術(shù)領(lǐng)域,稱之為“神經(jīng)網(wǎng)絡(luò)”。神經(jīng)網(wǎng)絡(luò)的研究涉及眾多學(xué)科領(lǐng)域,這些領(lǐng)域互相結(jié)合、相互滲透并相互推動(dòng)。不同領(lǐng)域的科學(xué)家又從各自學(xué)科的興趣與特色出發(fā),提出不同的問(wèn)題,從不同的角度進(jìn)行研究
當(dāng)人類(lèi)首次發(fā)明計(jì)算機(jī)時(shí),就已經(jīng)開(kāi)始思考如何讓計(jì)算機(jī)變得智能。如今,人工智能(artificial intelligence)已經(jīng)成為一個(gè)非常火熱的領(lǐng)域,并且具有眾多活躍的研究課題以及惠及生活方方面面的實(shí)際應(yīng)用。這個(gè)領(lǐng)域目前正在以幾何倍的速度增長(zhǎng)著,并且未來(lái)也將持續(xù)健康發(fā)展。人們希望可以借助人工智能自動(dòng)地處理一些主觀的,非規(guī)范性的事物,如識(shí)別圖像等。
在人工智能發(fā)展初期,計(jì)算機(jī)很容易處理一些人類(lèi)很難甚至是無(wú)法解決的問(wèn)題,這些問(wèn)題可以用一種形式化的數(shù)學(xué)規(guī)律來(lái)描述。人工智能真正面臨的任務(wù)是那些很難用形式化符號(hào)描述的任務(wù),當(dāng)然對(duì)于人類(lèi)來(lái)說(shuō)很容易執(zhí)行。舉個(gè)例子,人們能夠輕松識(shí)別對(duì)方說(shuō)的話,也能夠輕易識(shí)別圖像中的物體。對(duì)于這類(lèi)問(wèn)題,計(jì)算機(jī)卻無(wú)法給出自己的判斷。
計(jì)算機(jī)很擅長(zhǎng)助理抽象和形式化的任務(wù),但是人類(lèi)卻覺(jué)得這是很困難的腦力勞動(dòng)。早在上個(gè)世紀(jì),計(jì)算機(jī)就在國(guó)際象棋方面戰(zhàn)勝了人類(lèi)選手。但一直到最近幾年,計(jì)算機(jī)才在語(yǔ)音和圖像識(shí)別任務(wù)中達(dá)到人類(lèi)一般水平。通常一個(gè)人的思維發(fā)育需要海量有關(guān)外界的知識(shí)。相當(dāng)一部分領(lǐng)域的知識(shí)是主觀的,并且很難用形式化的結(jié)構(gòu)表示清楚。同人類(lèi)一樣,計(jì)算機(jī)也要獲得同樣數(shù)量級(jí)的知識(shí)才能表現(xiàn)得智能化。因此,對(duì)于研究人工智能領(lǐng)域的學(xué)者來(lái)說(shuō),關(guān)鍵的挑戰(zhàn)就是如何將這些主觀的、非形式化的知識(shí)教會(huì)計(jì)算機(jī)來(lái)學(xué)習(xí)。
早期的研究項(xiàng)目有一些基于知識(shí)庫(kù)方法,這種方法用近似于窮舉的方式將知識(shí)用結(jié)構(gòu)化的符號(hào)進(jìn)行存儲(chǔ),然后設(shè)計(jì)相應(yīng)的邏輯規(guī)則讓計(jì)算機(jī)來(lái)理解這些符號(hào)的聲明。可想而知,這樣的工程耗時(shí)又費(fèi)力,失敗也是意料之中的。究其原因,這些結(jié)構(gòu)化符號(hào)和聲明是由人類(lèi)主觀選取的,人類(lèi)尚無(wú)法構(gòu)造出可以精確地描述世界的算法規(guī)則。
人工神經(jīng)網(wǎng)絡(luò)為人工智能的研究帶來(lái)了前所未有的期望。人工神經(jīng)網(wǎng)絡(luò)并不是近代的產(chǎn)物,上世紀(jì)50年代就驗(yàn)證了其可行性,為什么直到最近幾年才被普遍接受?這也是研究深度網(wǎng)絡(luò)算法的意義之所在。首先日俱增的數(shù)據(jù)量得以存儲(chǔ),出現(xiàn)了很多專門(mén)用于研究神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集,這些數(shù)據(jù)集越來(lái)越大并且質(zhì)量都很高,如圖1-1所示。人們迫切希望有一種算法能從海量數(shù)據(jù)中發(fā)現(xiàn)事物的本質(zhì)。其次是大規(guī)模的模型已經(jīng)出現(xiàn),經(jīng)過(guò)近幾十年的發(fā)展,模型中神經(jīng)元的連接數(shù)已經(jīng)達(dá)到了數(shù)十億級(jí),逐漸接近人類(lèi)大腦的連接數(shù)。科學(xué)家預(yù)計(jì)這種增長(zhǎng)勢(shì)頭將穩(wěn)定持續(xù)到未來(lái)若干年。最后人工神經(jīng)網(wǎng)絡(luò)模型做決策的能力一直在提高,各大數(shù)據(jù)集上的準(zhǔn)確率不斷被刷新。深度學(xué)習(xí)發(fā)展迅速,但仍然很年輕,還有很多未知領(lǐng)域的研究和實(shí)際應(yīng)用等著人類(lèi)去發(fā)掘。