胡瀾
在過去的一年里,ChatGPT所代表的人工智能當(dāng)之無愧地成為互聯(lián)網(wǎng)頂流,無數(shù)人為之歡呼沸騰。同樣激動的還有學(xué)生,因為他們發(fā)現(xiàn)寫作業(yè)這件事可以交給ChatGPT代勞了!老師們卻為此大感頭疼,因為他們很難分辨出學(xué)生交上來的作業(yè)到底是辛苦勞作的結(jié)果,還是人工智能的敷衍。
就在這時,一個名叫愛德華(Edward?Tian)的年輕人推出了一款反擊ChatGPT的應(yīng)用——“GPTZero”,它可以檢測出文本的來源到底是人工智能還是真人所為。在這款新軟件面前,看似無所不能的ChatGPT的蹤跡變得無所遁形。而愛德華——這位來自普林斯頓大學(xué)的大四學(xué)生,也成為無數(shù)學(xué)生眼中“最可惡的人”。
向人工智能發(fā)起挑戰(zhàn)
2022年11月,校園里,幾乎所有人都在感嘆ChatGPT的出色之處。當(dāng)時的愛德華在驚喜之余,產(chǎn)生了一些擔(dān)憂。
這種擔(dān)憂與愛德華的研究方向和經(jīng)歷密切相關(guān)。愛德華在普林斯頓大學(xué)主修計算機(jī)科學(xué)專業(yè),大學(xué)期間一直在研究ChatGPT的前身——GPT-3,這同樣是由ChatGPT的母公司OpenAI研發(fā)的AI系統(tǒng),不過由于技術(shù)還不夠成熟,并不為眾人所熟知。
而就在ChatGPT發(fā)布的這個秋季學(xué)期,愛德華正在普林斯頓大學(xué)的自然語言處理實驗室研究如何對AI系統(tǒng)編寫的文本做檢測和判斷。在研究中,愛德華深刻地認(rèn)識到AI技術(shù)的一體兩面:它既可以幫助人類更好更快地完成工作,也有可能由于過快的發(fā)展速度而失控。
愛德華同時還輔修了認(rèn)知科學(xué)和新聞學(xué),并且有過在BBC的實習(xí)經(jīng)歷,主要負(fù)責(zé)核實新聞的真實性。他還曾是開源情報網(wǎng)站Bellingcat的研究員,做過被微軟收購的反恐初創(chuàng)公司Miburo?Solutions的分析師。在這些公司,他的工作主要是監(jiān)測虛假信息和對機(jī)器人進(jìn)行檢測。“所有的這些經(jīng)歷,都是我研發(fā)GPTZero的動力。”
于是愛德華用寒假的空閑時間編寫了一個應(yīng)用程序,并命名為“GPTZero”。這款軟件的使用方法和ChatGPT一樣簡單:你只需要把文本信息復(fù)制粘貼到對話框里,點擊即可開始評估。然后程序會根據(jù)文本的復(fù)雜性、創(chuàng)造性和可變性,打出一個分?jǐn)?shù),并給出分析結(jié)果:該信息是由AI編寫,還是來自人類的創(chuàng)作。
2023年1月2日,愛德華在網(wǎng)上發(fā)布了GPTZero,正式向ChatGPT發(fā)起了挑戰(zhàn)。
一夜火爆
愛德華沒有想到,這款應(yīng)用竟然一夜暴火。發(fā)布后的幾個小時內(nèi),就有超過2000人測試了GPTZero初始版本。上線僅僅一天,GPTZero吸引了超過700萬人觀看,應(yīng)用一度因為訪問流量過大而陷入崩潰。
第二天早上,愛德華的手機(jī)被無數(shù)條短信、郵件、私信瘋狂轟炸了。這些信息大多來自網(wǎng)友和記者以及他的同齡人。前者多是出于好奇而詢問,后者中則有許多沒有那么禮貌——許多在校生發(fā)私信來咒罵他,因為老師以后可以用這款應(yīng)用發(fā)現(xiàn)他們的作業(yè)是從AI那兒抄來的。愛德華因此成為了“學(xué)生公敵”。
GPTZero發(fā)布之初,最直觀的受益者就是學(xué)校和教師。他們終于有了幫手,可以幫助判定學(xué)生上交的文本中,AI是“零參與還是大量參與”。
或許是教師以及有類似困擾的用戶的熱情推動了GPTZero的暴火。1月5日,也就是GPTZero發(fā)布后的第三天,用戶量達(dá)到了1萬。一周之后,訪問用戶超過3萬人,截至2023年5月,這個數(shù)字達(dá)到了120萬。
愛德華對GPTZero的火爆感到震驚,但同時他也意識到了GPTZero的真正價值所在——它不僅是幫助教師識別學(xué)生作業(yè)真實性的幫手,更是人類思想和文明的護(hù)衛(wèi)者。
愛德華很快就成為了風(fēng)投界的紅人,a16z、?Menlo?Ventures?和?Red?Swan?等知名風(fēng)投紛紛朝他拋出橄欖枝。愛德華拿到了350萬美元的種子資金,并創(chuàng)辦了與軟件同名的公司?GPTZero。
不過這些并沒有讓愛德華沖昏頭腦,在面對投資者的時候他仍然保持著謹(jǐn)慎和冷靜。他表示,GPTZero仍然是一款需要持續(xù)被開發(fā)的軟件,并且為了保護(hù)他口中人類寫作的“美好”,他目前沒有收費(fèi)的打算。
用AI對抗AI
打敗ChatGPT聽上去有些不可思議,GPTZero到底是怎么做到的?
一個有趣的事實是:愛德華使用了一個叫做GitHub?CoPilot的軟件來幫助自己編寫GPTZero,而對這一軟件提供支持的正是GPTZero的對手ChatGPT的前身——GPT-3。在GPT-3的幫助下,愛德華僅用了3天時間就搭建起了軟件,足以說明AI在軟件開發(fā)上的高效和強(qiáng)大。而打敗這一強(qiáng)大的對手的方法,正是“以子之矛攻子之盾”。
GPTZero的原理其實很簡單,就是用AI對抗AI。
GPTZero根據(jù)“困惑性”(Perplexity)和“突發(fā)性”(Burstiness)這兩項指標(biāo)來對文本進(jìn)行打分,然后根據(jù)分?jǐn)?shù)的統(tǒng)計學(xué)特征來判斷文本是出自人類還是AI之手。所謂的“困惑性”是指語言的隨機(jī)性,這一指標(biāo)可以衡量詞語使用的隨機(jī)程度,以及詞語的搭配方式是否讓GPTZero感到困惑。而“突發(fā)性”則主要是衡量語句結(jié)構(gòu)變化上的復(fù)雜度,如果文本較長,則還可以衡量每個句子在變化程度上的一致性。
之所以選擇“困惑性”和“突發(fā)性”這兩項指標(biāo)作為判斷標(biāo)準(zhǔn),是因為人類和AI創(chuàng)作的文本在這兩點上有很大的區(qū)別。人工智能生成文本的來源是既有的數(shù)據(jù)庫,因此它生成的語句會較為恒定,特別是選詞的可預(yù)測性更高;而人類創(chuàng)作的文本則沒有這種可預(yù)測性,真人的想法總是更為隨機(jī)和跳脫,容易出乎AI的“預(yù)料”,也更容易令A(yù)I感到“困惑”。
同理,人工智能更傾向于使用前后一致的結(jié)構(gòu)來生成的句子和段落,句式較為相近,也較少出現(xiàn)前后復(fù)雜度相差很大的句子。而人類創(chuàng)作的句式則更為多樣,前后的復(fù)雜程度也不一致,復(fù)雜的長句和簡單的短句會在人類創(chuàng)作的文本中交錯出現(xiàn),這種文本結(jié)構(gòu)參差不齊的“突發(fā)性”也就得以成為判別是否為人類創(chuàng)作的重要指標(biāo)之一。
GPTZero對用戶給出的文本進(jìn)行“文字總困惑度”“所有句子的平均困惑度”“每個句子的困惑度”的計算,GPTZero越對這些文本感到“熟悉”,得出的結(jié)果數(shù)值就越低,越說明這段文本有可能是GPTZero的同類——AI生成的。相反,當(dāng)這個分?jǐn)?shù)大于85時,則說明詞語的隨機(jī)性和句子的困惑度令GPTZero感到“陌生”,更可能是人類的創(chuàng)作。從這種“以己為鏡”的檢測方法來看,把GPTZero說成是AI界的“臥底”也不為過。
GPTZero宣稱對AI文本識別的準(zhǔn)確率為85%,對人類文本的準(zhǔn)確率則高達(dá)99%。在愛德華發(fā)布的一段演示視頻中,他將《紐約客》一篇文章和ChatGPT在領(lǐng)英(LinkedIn)上發(fā)表的一篇文章放在GPTZero上進(jìn)行檢測,GPTZero成功地做出了正確的選擇。
不過,GPTZero還不完美。正如測試期許多用戶反饋的那樣,GPTZero也會有搞混的時候。特別是對于那些經(jīng)過人工編輯的AI文本,GPTZero暫時還不具備檢測能力。于是,這給了那些對GPTZero的出現(xiàn)心生不滿的人們一絲可乘之機(jī)。
永無止盡的攻防戰(zhàn)
AI檢測一經(jīng)面世,反AI檢測也如影隨形般粉墨登場。GPTZero剛剛發(fā)布不久,就有人發(fā)現(xiàn)了軟件在識別上的漏洞:只需要用西里爾字母替換掉英文字母,就可以把GPTZero騙過去。一個來自TikTok的用戶為此專門寫了一個程序,用來幫助一些心懷不滿的學(xué)生繞過GPTZero檢測。
愛德華很快就修補(bǔ)了這個漏洞,但是這遠(yuǎn)遠(yuǎn)不夠。在互聯(lián)網(wǎng)這個沒有硝煙的戰(zhàn)場上,一場圍繞著AI檢測和反AI檢測的攻防戰(zhàn)開啟了。
一個名叫Joseph?Semrai的斯坦福大學(xué)學(xué)生開發(fā)了一款名為“WorkNinja”的應(yīng)用,這款應(yīng)用上有一個顯眼的“Rephrase(修改措辭)”按鍵,如果你的文本被GPTZero判定為“AI生成”,你只需要把這段文本“Rephrase”一下,應(yīng)用就會自動對文本進(jìn)行同義詞替換等改寫工作,再生成的文本,就會被GPTZero識別為人類創(chuàng)作了。
還有人在推特上告訴學(xué)生們,只要在ChatGPT?生成文本的每個“e”之前插入一個零寬度空格,也可以把GPTZero糊弄過去。還有人利用寫作潤色工具QuillBot來修改自己的人工智能文本,同樣也能起到改頭換面的作用。
為了應(yīng)對這些花招,愛德華不得不不停地更新補(bǔ)丁,但他也清楚,這絕非長久之計。遲早有一天,會有人像愛德華當(dāng)初開發(fā)AI檢測工具一樣,開發(fā)出一款無懈可擊的反AI檢測軟件。只要AI技術(shù)仍然存在,AI檢測與反AI檢測的攻防戰(zhàn)就不會停止。
同樣對GPTZero虎視眈眈的還有它的同行。GPTZero發(fā)布不到一個月,ChatGPT的母公司OpenAI就推出了自己的檢測工具;2023年4月,論文查重網(wǎng)站Turnitin也推出了自己的AI檢測器;還有號稱是“最適合教育領(lǐng)域的AI內(nèi)容檢測器”Winston?AI橫空出世,據(jù)稱準(zhǔn)確率達(dá)到99.6%。
在強(qiáng)手如云的互聯(lián)網(wǎng)領(lǐng)域,愛德華想要保證GPTZero在江湖上的一席之地,就必須不斷地更新迭代,并且推出更貼合市場需求的產(chǎn)品。在由GPTZero掀起的AI檢測浪潮中,愛德華意識到,比起判斷學(xué)生的作業(yè)是否抄襲,或許告知用戶文本的“可信度”是一個更具廣闊前景的實用功能。
于是,2023年5月,GPTZero團(tuán)隊發(fā)布了一款名為“Origin”的插件,這款插件可以跟蹤學(xué)生在瀏覽器和Word中的寫作過程,然后生成一個覆蓋整個寫作周期的報告,用以向老師證明該文本是學(xué)生獨立寫作而成。
同時,愛德華也認(rèn)識到,AI是無法被徹底打敗的,唯一的出路是合作。他的團(tuán)隊正在開發(fā)一個叫做HumanPrint的新寫作平臺,這個平臺可以檢測出“含AI生成”段落,提示用戶用自己的語言對這些段落進(jìn)行重寫,以達(dá)到改進(jìn)文本的目的——用愛德華的話來說,這不是幫助用戶逃避AI檢測,而是“檢測的自然延伸”。
責(zé)任編輯:陳思