姚秦川
當(dāng)年,美國《紐約時(shí)報(bào)》為了便于報(bào)紙以后的管理,方便讀者查閱,決定將那些已經(jīng)出版并保存了幾十年的舊報(bào)紙全部電子化。不過,這項(xiàng)工作到底該如何操作,卻讓工作人員頗感頭疼。
最簡單可行的辦法就是掃描那些舊報(bào)紙,進(jìn)行光學(xué)字符識(shí)別。不過,因?yàn)槟切┡f報(bào)紙有油墨的痕跡和折疊的印記,并且顏色發(fā)黃變暗,再加上幾十年前的字體與現(xiàn)在的字體有很大的區(qū)別,所以辨識(shí)起來極為費(fèi)勁。除此之外,更令人擔(dān)心的是,由于那些報(bào)紙保存的時(shí)間久遠(yuǎn),紙張變得非常脆弱,稍有不甚,就會(huì)損壞整張報(bào)紙。當(dāng)時(shí),《紐約時(shí)報(bào)》的工作人員就關(guān)于要不要用掃描的辦法來完成這項(xiàng)工作進(jìn)行了多次會(huì)議,會(huì)議上大家各執(zhí)一詞,沒有一個(gè)統(tǒng)一的結(jié)果。最終,報(bào)社高層領(lǐng)導(dǎo)決定,基于保護(hù)報(bào)紙的考慮,他們不打算采用掃描的辦法,同時(shí)為了盡快找到簡單可行的辦法,報(bào)社在報(bào)紙上刊登了啟事,希望廣大市民能獻(xiàn)計(jì)獻(xiàn)策,解決這個(gè)棘手的問題。
啟事發(fā)出去后,很快便有市民來到報(bào)社,說他想到了一個(gè)主意,不過是一種笨辦法,那就是報(bào)社派出專門的打字員,逐字逐句地重新敲打報(bào)紙上的內(nèi)容。然后,報(bào)社安排專職人員進(jìn)行校對(duì)。這個(gè)辦法雖然行得通,但實(shí)際操作起來并不容易,不僅進(jìn)展速度非常緩慢,而且效果也不理想。最終,這個(gè)辦法被報(bào)社否定了,但他們還是對(duì)這位市民給予了獎(jiǎng)勵(lì)——免費(fèi)贈(zèng)閱半年的《紐約時(shí)報(bào)》。時(shí)間一天天過去,就在報(bào)社領(lǐng)導(dǎo)都對(duì)解決這個(gè)問題失去信心時(shí),卡內(nèi)基梅隆大學(xué)的博士生路易斯·馮·安得知了此事,他打電話給報(bào)社,主動(dòng)將此難題包攬了過來。……