——吉姆·格雷是否真的提出過新摩爾定律?"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代數據總量增長的新摩爾定律辨析
——吉姆·格雷是否真的提出過新摩爾定律?

2022-09-22 06:00:24辛冬播李廷軍
軟件導刊 2022年9期

辛冬播,李廷軍

(江漢大學教育學院,湖北武漢 430056)

0 引言

1965年4月,《電子》雜志(Electronics)發表了一篇只有3 頁的論文——Cramming more components onto integrated circuits(《集成電路里正塞入更多的元件》)[1]。文章作者戈登·摩爾(Gordon Moore)當時就職于仙童攝影器材公司的子公司仙童半導體(Fairchild Semiconductor),其在文中指出:隨著成本曲線的降低,集成電路上可以封裝的元件數目迅速增加,并預測到1970 年,一個集成電路上可以集成1 000個元件,每個元件的生產成本將是1965年的1/10,并且集成電路的集成程度每年將以2 倍速增長,以公式表示即為:(f(Δtn)=Q2n)。據此測算,1975年最低成本下單位集成電路封裝的元件數目可以達到65 000個,具體如圖1所示。

Fig.1 Cost curve(left),component integration(right)圖1 成本曲線(左)、元件集成度(右)

1968 年,戈登·摩爾離開仙童公司并創立了英特爾(Intel),他繼續將上述觀察和推測作為芯片研發工作的指引,而后集成電路的不斷發展印證了他的預測,于是有人將其命名為摩爾定律[2]。計算機科學家卡弗·米德(Carver Mead)在很多場合談到過摩爾定律,促進了其傳播,曾被認為是其命名者,但實際情況已難以考證[3]。1975 年,戈登·摩爾認為集成電路增長速度會有所放緩,遂將摩爾定律中的速度修改為每2 年翻一番。雖然此后實際狀況基本上是按每18 個月翻一番的速度發展的,但戈登·摩爾并沒有再修改其定律[4]。

摩爾定律原指單位集成電路封裝的元件數目增加及單位成本相應下降的趨勢隨時間發展的一種規律,但在傳播過程中出現了很多版本,主要有以下幾種:①集成電路芯片上所集成電路的數目每隔18 個月就翻一番;②微處理器的性能每隔18 個月提高一倍,而價格下降一半[5];③IC 芯片上可容納的晶體管數目每隔約18 個月便會增加一倍,計算機性能也將提升一倍[6]。嚴格來說,摩爾定律并不是定律,而只是一種觀察和推測。經過50 多年的發展,戈登·摩爾認為集成電路技術的發展速度會減慢,摩爾定律可能會逐步退出歷史舞臺。

隨著信息技術的發展,人們開始將摩爾定律套用到各種指數式發展的技術和產品上,于是安放在吉姆·格雷(Jim Gray)名下的新摩爾定律便橫空出世了,即每18 個月全球新增信息量是計算機有史以來全部信息量的總和。吉姆·格雷是當代最杰出的數據庫大師,是數據庫和交換處理系統領域的領頭人,是美國國家工程院院士、美國計算機協會(ACM)院士、微軟公司高級研究員,曾獲得1994年美國技術研究院大獎,以及號稱計算機行業諾貝爾獎的圖靈獎(1998 年)[7]。遺憾的是,他在2007 年出海后失蹤[8]。與戈登·摩爾專注基礎技術半導體工業不同,吉姆·格雷是數據庫及處理系統方面的專家,如果他真的提出過關于數據量增長的新摩爾定律,以其背景而言似乎水到渠成,理所當然。然而,筆者認為所謂的吉姆·格雷新摩爾定律的表述有些問題。計算機有史以來全部信息量總和是否為固定值并不明確。如果按固定值來看,以Q 表示計算機有史以來全部信息量總和,那么再過18 個月全球新增信息量f(Δt1)=f(t2) -f(t1)=Q,而36 個月之后f(Δt2)=f(t3) -f(t2)=Q,其總量增速如圖2 所示,這是一種減速遞增關系,簡單計算能得出其倍數將依次為2、1.5、1.33、1.25……。而摩爾定律是一段周期翻一番的2 倍指數倍遞增關系(f(Δtn)=Q2n),二者相差甚遠。如果計算機有史以來全部信息量總和不是固定值,即也包括了每18 個月的信息量,那么就會造成邏輯混亂。筆者深感困惑,于是追溯相關文獻,探究吉姆·格雷是否真的提出過新摩爾定律。

Fig.2 The information quantity increment relationship圖2 信息量增量關系

1 新摩爾定律文獻統計與相關表述

1.1 新摩爾定律文獻統計

在知網以“新摩爾定律”為關鍵詞進行主題搜索,整理得到65 篇中文文獻,如圖3 所示。文獻發表年度跨度為1999-2020 年,其中以2009 年發表的文獻數量最多,2000年次之,2015年再次之。

采用Citespace 軟件分析關鍵詞共現情況,結果如圖4所示。可以看出,各關鍵詞之間離散程度較大,但新摩爾定律與大數據、摩爾定律的關聯性在圖中仍有所體現。

關鍵詞突現分析結果如圖5 所示,新摩爾定律作為關鍵詞于2006 年首次出現。以下將對相關文獻表述進行具體分析。

Fig.3 Annual trends of published Chinese literatures about"New Moore's Law"圖3 新摩爾定律相關中文文獻發表年度趨勢

Fig.4 Key words co-occurrence圖4 關鍵詞共現

Fig.5 Key words with the strongest citation bursts圖5 關鍵詞突現

在Web of Science 中以“data(數據)”和“Moore’s Law(摩爾定律)”為關鍵詞進行主題搜索,共查詢到171 篇相關英文文獻。同時,在這171 篇文獻中再以“Gray”為關鍵詞進行搜索,文獻結果為0,這說明相關英文文獻的標題、摘要、關鍵詞中沒有關于吉姆·格雷新摩爾定律的表述。據此初步推測,吉姆·格雷并未提出過新摩爾定律,之所以中文文獻中出現相關表述,應是國內學者對吉姆·格雷某些觀點的誤讀。

1.2 新摩爾定律相關表述

檢索到的中文文獻中關于新摩爾定律的表述主要有以下幾種:1999 年,侯自強[9]提出:“我們不妨稱因特網流量每半年翻一番的估計為網絡發展的新摩爾定律。”2006年,王克朝[10]在其碩士學位論文的摘要中提到:“圖靈獎獲得者Jim Gray 提出了一個新的經驗定律:網絡環境下每18個月產生的數據量等于有史以來數據量之和。”2007 年,謝長生等[11]提到:“信息時代的到來意味著數字信息量的不斷增長。1998 年圖靈獎獲得者Jim Gray 曾說過:‘從現在起,每18 個月新增存儲量等于有史以來存儲量之和。’”2008 年,孟小峰[12]提到:“圖靈獎獲得者Jim Gray 曾在1998 年的獲獎演說中對未來數據量急劇增長的規律做過這樣的預言:未來每18 個月產生的數據量等于有史以來的數據量之和!”2011 年,羅東健[13]提到:“互聯網環境下,每18 個月新產生的數據量等于有史以來數據量之和。”2013 年,楊寅[14]提出:“圖靈獎獲獎者James Gray 總結并提出在當今網絡應用環境下,每18 個月新產生和增加的數據存儲總量等于有史以來所有數據存儲量之和的經驗定律。”2013 年及2015 年,劉鵬等[15-16]提到:“1998 年圖靈獎獲得者杰姆·格雷(Jim Gray)提出著名的新摩爾定律:每18個月全球新增信息量是計算機有史以來全部信息量的總和。”2018年,周蘭[17]指出:“圖靈獎獲得者Jim Gray 更是提出新摩爾定律,即每18 個月全球新增信息量是計算機有史以來全部信息量的總和。”2020 年,董凱[18]提到:“圖靈獎獲得者杰姆·格雷提出的著名的新摩爾定律:每18 個月全球新增信息量是計算機有史以來全部信息量的總和。”

需要指出的是,相關學者引用所謂的新摩爾定律時并未辨析來源,也沒有結合統計數據加以驗證,這也正是令人困惑之處。

2 新摩爾定律的源流及辨析

追溯相關文獻可以發現,1999 年侯自強首先提出了新摩爾定律的說法,但只是個人經驗總結,并沒有具名吉姆·格雷,其所提出的是網絡流量每半年翻一番與18 個月的時間間隔也不一樣。最早完整提出吉姆·格雷新摩爾定律的應是2006 年王克朝的碩士論文,其明確認定該定律是吉姆·格雷的經驗定律,并提出“18 個月”和“數據量”等關鍵詞。2007 年謝長生的表述中雖然用到的詞是存儲量,但其緊隨在“數字信息量的不斷增長”表述之后,極易使人將該存儲量誤解為數據量,之后相關文獻中關鍵詞采用的是數據量、信息量之類的表述。此外,孟小峰關于“圖靈獎獲得者Jim Gray 曾在1998 年的獲獎演說中……”的表述是不嚴謹的。吉姆·格雷是為1998 年度獎項作的報告,但是在1999 年演講的,與謝長石“1998 年圖靈獎獲得者Jim Gray 曾說過”的表述相比,孟小峰的表述會使人誤以為是在1998 年發表的演講。2013 年,劉鵬等將此類表述單獨冠以新摩爾定律的稱謂,之后其他文獻的表述與其一致,但均未注明出處。

以上提到新摩爾定律的文獻中,只有2008年孟小峰教授的引用注明了出處:What next?A dozen informationtechnology research goals,J.Gray,ACM Turing Award Lecture,June 1999,MS-TR-99-50[19]。該文獻發表于2003年,為吉姆·格雷圖靈獎獲獎演說的精簡版,文中有3 處提到摩爾定律,分別為:①Prices are falling faster than Moore’s law——storage will likely be a hundred times cheaper in ten years(價格下跌速度比摩爾定律快——10 年后儲存器價格可能會便宜100 倍);②Moore’s law predicts a doubling every 18 months.This means that,in the next 18 months,there will be as much new storage as all storage ever built,as much new processing as all the processors ever built.The area under the curve in the next 18 months equals the area under the curve for all human history(摩爾定律預測每18 個月就會翻一番。這意味著,18 個月后新增的存儲器(數量)將與現在已有的存儲器一樣多,18 個月后新增的處理能力將與現在已有的處理器一樣大。未來18 個月曲線下面積等于現在為止所有人類歷史曲線下的面積);③As I said at the beginning,progress appears to be accelerating;the base-technology progress,in the next 18 months,will equal all previous progress,if Moore’s law holds(正如我在一開始所說的,進展似乎正在加速;如果摩爾定律成立,未來18 個月基礎技術的進展將等于到現在為止的所有進展)。

為進一步驗證,根據2003 年這篇文獻的腳注搜索到1999 年版本的原文[20],文中對應的3 處表述,與上文完全一致。吉姆·格雷在這份獲獎發言中主要闡述了12 個長期系統研究問題:①可擴展性(Scalability)。設計一個可擴展到106倍的軟件和硬件體系結構,僅通過添加更多資源,應用程序的存儲和處理容量可以自動增加100 萬倍,工作速度更快(加速106倍)或同時做106倍的工作;②圖靈測試(The Turing Test)。建立一個計算機系統,模仿游戲的勝率至少達到30%;③語音文本(Speech to Text)。水平如同母語者;④文本語音(Text to Speech)。水平如同母語者;⑤視覺如人一樣(See as Well as a Person)。能識別物體和運動;⑥個人記憶擴展器(Personal Memex)。記錄一個人看到和聽到的一切,并根據需要迅速檢索到;⑦世界備忘錄(World Memex)。建立一個給定文本語料庫系統,可以回答有關文本的問題,并像該領域的人類專家一樣準確、快速地總結文本,這個系統也能適用于音樂、圖像、藝術和電影;⑧遠程臨場(Tele Presence)。模擬其他地方,使你作為觀察者(遠程觀察),就如同一位在現場的人一樣能聽到和看到;模擬作為參與者出席另一地點的活動(遠程臨場)。與他人和環境互動,就好像你真的在那里一樣;⑨無故障的系統(Trouble-free Systems)。建立一個每天被數百萬人使用的系統,而它只需要一個兼職人員管理;⑩安全系統(Secure System)。確保問題⑨的系統僅服務授權用戶,服務不能被未經授權者中斷,信息也不能被竊取(需驗證);?隨時可用(Always Up)。確保系統每百年故障不到1s,即有99.999 999%的可靠性(需驗證);?自動編程(Automatic Programmer)。設計一種規范語言或用戶界面,可使人們更容易表述設計(更容易1 000 倍),使計算機可直接編譯,并可描述所有應用程序(已完成)。系統應能質疑應用程序,對例外情況和規范完整性提出疑問,但使用起來不應很繁瑣。

通過分析全文可以發現,吉姆·格雷闡述的增長是指存儲(Storage)和處理器(Processor),而非數據量或信息量,其在文中提到的摩爾定律也只是舊摩爾定律,并未就數據量增長提出類似的說法。此外,吉姆·格雷沒有將摩爾定律作為這篇文獻的關鍵詞之一,也間接證明了這一點。

進一步搜索關于吉姆·格雷的信息,在Web of Science核心合集發現其有3 篇以“Gray J”署名的文獻,包含在其ACM 作者檔案[21]中所列的112 篇出版文獻中,其中就有What next?A dozen information-technology research goals(1999 年及2003 年)。此外,微軟公司eScience 研究組(Microsoft Research′s eScience Group)在吉姆·格雷主頁[22]整理了其未完結的項目,在這些文獻篇名、關鍵詞、摘要等中均未出現Moore’s Law(摩爾定律)這一關鍵詞,因此無法證實吉姆·格雷提出過新摩爾定律。

針對漸有流行趨勢的吉姆·格雷新摩爾定律,首先經文獻分析發現大多數中文文獻中未注明引用出處,也沒有結合統計數據加以驗證;其次進一步追根溯源,分析各文獻表述,理清了國內有關新摩爾定律的各種來由;最后辨析各中文文獻原文,查證相關英文文獻,未找到吉姆·格雷提出新摩爾定律的直接證據。結合邏輯分析,以及全球數據量增長的相關統計,所謂的吉姆·格雷新摩爾定律表述本身也有明顯漏洞。據此推測,吉姆·格雷并沒有提出過新摩爾定律,該定律應是國內學者對吉姆·格雷某些觀點的誤讀。當然,吉姆·格雷也許在其他地方確實提出過類似觀點,受限于文獻查找范圍沒有被發現。

3 大數據時代信息總量增長規律

所謂的吉姆·格雷新摩爾定律一直強調計算機有史以來全部信息量,而人類自公元前3000 年開始書寫后就在不斷創造和保存數據信息,而且人類歷史上技術進步促進數據和信息量大幅增長的情況也曾發生過,例如15 世紀印刷術發明后以及19 世紀后期出版成本下降時。計算機及互聯網的相繼問世使數據增長速度今非昔比,如今進入大數據時代,全球數據量更是飛速增長。根據Statista 的統計和預測,2020 年全球數據產生量預計達到47ZB(1ZB 即1012GB),而到2035 年,這一數字將達到2 142ZB。信息技術在未來較長時期內將保持漸進式發展態勢,其中數據處理能力遠落后于指數級增長的數據體量。圖6 為全球每年產生數據量估算圖,這一指數級增長速率,即年均增速平均為1.3 倍,也就是約每3 年翻一番,這與國際數據公司(IDC)預測的2020-2024 年數據增長的年復合增長率(CAGR)26%基本一致。

Fig.6 Global annual data volume estimation圖6 全球每年產生數據量估算

4 結語

全球數據總量飛速增長的趨勢已是共識,其增長規律預測的可信度與是否為吉姆·格雷所提出并無直接關系。將全球數據總量指數級的增長規律命名為新摩爾定律無可厚非,但也完全沒有必要無中生有地拉吉姆·格雷來為其站臺。根據前文提到的相關統計及預測,大數據時代數據總量增長的新摩爾定律應該表述為全球數據總量每3年將翻一番。同樣的,這個新摩爾定律也只是一種觀察和推測,并不是一個真正的定律,今后完全可以根據數據總量增長的實際情況進行修正。

主站蜘蛛池模板: 2020精品极品国产色在线观看 | 国产精品网曝门免费视频| 国产精品一区在线麻豆| 国产99在线| 国产亚洲欧美在线人成aaaa| 国产主播在线观看| 日本高清免费一本在线观看| 亚洲aaa视频| 国产精品成人久久| 午夜福利免费视频| 午夜精品一区二区蜜桃| 免费人成视网站在线不卡| 亚洲VA中文字幕| 97在线观看视频免费| 欧美午夜网站| 成人一区在线| 一级全黄毛片| 亚洲中文字幕久久无码精品A| 最新亚洲av女人的天堂| 国产成人精品高清在线| 白浆免费视频国产精品视频| 久久黄色免费电影| 红杏AV在线无码| 亚洲国内精品自在自线官| 毛片一区二区在线看| 亚洲天堂久久久| 亚洲a级毛片| 九色视频线上播放| 亚洲精品卡2卡3卡4卡5卡区| 中文无码精品A∨在线观看不卡 | 无码'专区第一页| 亚洲国产天堂在线观看| 一区二区三区国产| 国产欧美日韩91| a毛片在线| 国产精品19p| 97人妻精品专区久久久久| 九九久久99精品| 日韩专区第一页| 亚洲欧美综合另类图片小说区| 久久国产精品77777| 日本道综合一本久久久88| 国产成人亚洲毛片| 精品国产免费观看一区| 美女啪啪无遮挡| 亚洲综合色婷婷| 色妞永久免费视频| 亚洲AV免费一区二区三区| 亚洲αv毛片| 爆乳熟妇一区二区三区| 国产精品亚洲综合久久小说| 激情国产精品一区| 精品久久久无码专区中文字幕| 国产中文一区二区苍井空| 99无码中文字幕视频| 久久久久国产一级毛片高清板| 亚洲无码A视频在线| 国产毛片不卡| 99视频精品在线观看| 精品久久香蕉国产线看观看gif| 亚洲欧美自拍视频| 亚洲视频a| 亚洲无码视频一区二区三区| 日韩精品无码免费专网站| 在线观看亚洲成人| 成年女人a毛片免费视频| 午夜毛片免费观看视频 | 无遮挡一级毛片呦女视频| 91成人在线免费观看| 欧美三級片黃色三級片黃色1| 欧美视频在线第一页| jizz亚洲高清在线观看| 国产精品永久在线| jijzzizz老师出水喷水喷出| 亚洲天堂首页| 97精品久久久大香线焦| 国产精品自在在线午夜区app| 精品91在线| 四虎精品黑人视频| 日本欧美精品| 欧美激情第一欧美在线| 久久综合干|