魏忠
先說(shuō)一道經(jīng)常用于公司開(kāi)發(fā)人員筆試的數(shù)學(xué)題:有一種傳染病有萬(wàn)分之一的發(fā)病率,有一種試紙有99%的準(zhǔn)確性,一個(gè)被測(cè)人員用試紙檢測(cè)顯示陽(yáng)性,請(qǐng)問(wèn)這個(gè)人真正被感染的幾率是多少?
這是一道條件概率題,正確的解題思路是這樣的:99%的準(zhǔn)確性,一萬(wàn)人中不準(zhǔn)確的人就是100人,那么1萬(wàn)人中有多少病人呢?1個(gè)。100個(gè)被誤診的傳染病加上一個(gè)真正的傳染病人是被測(cè)出來(lái)的,其真正的感染率1%量級(jí)才對(duì)。如果提高試紙的精度為萬(wàn)分之9999的準(zhǔn)確性,一萬(wàn)個(gè)人中就有1個(gè)被誤診的,再加上一個(gè)真正得病的,如果被這種精確的試紙?jiān)\斷出來(lái)的病的話,還有一半是錯(cuò)誤的診斷。那么繼續(xù)升高試紙的精度,達(dá)到十萬(wàn)分之99999,一萬(wàn)個(gè)人中就只有0.1人是錯(cuò)誤的,那么加上一個(gè)正確的,如果被檢測(cè)到了,就基本是靠譜的了。也就是說(shuō),你若希望診斷出一種偶發(fā)的現(xiàn)象,要想得到靠譜的結(jié)論的話,基本上是要比“偶發(fā)”高一個(gè)數(shù)量級(jí)的測(cè)量精度才行。
1985年,我就讀一所省著名高中的二年級(jí)。當(dāng)時(shí)學(xué)校連續(xù)兩年從500人中選拔20人和30人去學(xué)習(xí)計(jì)算機(jī)程序,我都報(bào)了名,卻都被刷下來(lái)了。原因很簡(jiǎn)單,我的成績(jī)還不夠優(yōu)秀。第二年的期中考試,我用一種極限的方法去證明一個(gè)等腰三角形的命題,考試又得到了比較差的分?jǐn)?shù)。一天晚自習(xí),數(shù)學(xué)老師走到我身邊,問(wèn)我為什么會(huì)用代數(shù)問(wèn)題去解幾何題?當(dāng)時(shí)我說(shuō)出理由并表示根本不服考試的批改時(shí),老師沉默了半晌對(duì)我說(shuō):“你知道嗎?我找你就是為了這件事。我知道你申請(qǐng)計(jì)算機(jī)程序班兩次都落選了,我不懂計(jì)算機(jī),但我查了很多資料,你用代數(shù)方法解那道幾何題的方法就是計(jì)算機(jī)方法,沒(méi)有錯(cuò),你今后如果能從事計(jì)算機(jī)行當(dāng)會(huì)有出息的,但是首先要考上大學(xué),考上好大學(xué)。”
后面30年的事情驗(yàn)證了老師的看法。我雖然沒(méi)有進(jìn)入計(jì)算機(jī)專業(yè),卻進(jìn)入到計(jì)算機(jī)教研室做畢業(yè)論文,當(dāng)初被選上計(jì)算機(jī)程序班的同學(xué)后來(lái)一個(gè)也沒(méi)有從事計(jì)算機(jī)行業(yè),我倒是誤打誤撞進(jìn)入到了計(jì)算機(jī)行業(yè)。
上個(gè)月,我被一個(gè)省級(jí)的科技部門(mén)作為專家,受邀參與這個(gè)省的“技能型大師工作室”評(píng)審。看完評(píng)審標(biāo)準(zhǔn),我似乎回到了多年前的那個(gè)晚自習(xí),不過(guò)今天被評(píng)審的大師不會(huì)有我當(dāng)初那么幸運(yùn),因?yàn)樵u(píng)審標(biāo)準(zhǔn)是:獲得省部級(jí)科技進(jìn)步獎(jiǎng)、獲得專利、發(fā)表核心期刊文章、職稱正高級(jí)、學(xué)歷碩士還是博士……這些考核大學(xué)教授的指標(biāo)竟然一點(diǎn)不改地用在了評(píng)價(jià)和測(cè)試創(chuàng)新性技能大師的身上,結(jié)果可想而知。
最近受邀各省市少年編程思維、人工智能等活動(dòng),作為專家進(jìn)行咨詢,我發(fā)現(xiàn)有一些非常值得關(guān)注的測(cè)試精度問(wèn)題,以下誤區(qū)是值得警覺(jué)的:①少兒人工智能、少兒編程思維,是適合少兒年齡特點(diǎn)的訓(xùn)練,但絕不是玩具訓(xùn)練。②多數(shù)廠商驅(qū)動(dòng)和產(chǎn)品驅(qū)動(dòng)的此類實(shí)驗(yàn)室或者活動(dòng),起點(diǎn)堪憂。多數(shù)從事這個(gè)行業(yè)教育或者標(biāo)準(zhǔn)的人本身就不是行業(yè)高手,甚至東抄西湊。③數(shù)學(xué)與邏輯訓(xùn)練是核心,人工智能的核心算法是深度學(xué)習(xí),是矩陣運(yùn)算,而多數(shù)人工智能已經(jīng)偏離了方向。④圍繞創(chuàng)客和電子類的肌肉訓(xùn)練越早越好,但玩具化和成品化傾向并不利于篩選和培養(yǎng)真正的天才和普通孩子的真實(shí)興趣。⑤藝術(shù)與文學(xué)的離散思維對(duì)創(chuàng)新至關(guān)重要,然而無(wú)論是“詩(shī)詞大會(huì)”類大賽,還是名著閱讀類的訓(xùn)練,如果指征不是創(chuàng)作而是背誦和成績(jī),那么往往訓(xùn)練越多,腦筋越死。
文章最后說(shuō)說(shuō)文章開(kāi)頭的那類問(wèn)題,為了避免誤判,我情愿相信用類似邏輯題目的數(shù)學(xué)題來(lái)篩選適合開(kāi)發(fā)的工程師,而不是靠經(jīng)驗(yàn)和成績(jī),這方面數(shù)學(xué)的試紙往往更準(zhǔn)。