王超 佟昕瑀


本文系國家社會科學基金一般項目“全民信息素養框架構建與提升策略研究”(項目編號:20BTQ022)的研究成果之一。
摘 要:在ChatGPT應用熱潮中,信息素養對于如何正確理解和使用ChatGPT至關重要。文章首先介紹ChatGPT的語言生成邏輯及缺陷,并結合信息素養三大場景設計了ChatGPT的場景化應用實例,通過對ChatGPT輸出的回答進行甄別與分析,討論其應用過程中的潛在風險,最終提出信息素養視角下規避與化解ChatGPT風險的主要策略,以期幫助用戶更好地應對人工智能技術沖擊下的機遇與挑戰。
關鍵詞:信息素養;ChatGPT;人工智能生成內容;信息甄別;場景化應用
中圖分類號:G250文獻標識碼:A
A Study on Scenario Applications of ChatGPT from an Information Literacy Perspective and Risk Aversion Strategies
Abstract Amid the ChatGPT revolution, information literacy plays a pivotal role in understanding and utilizing ChatGPT correctly. This article begins by introducing the language generation logic and limitations of ChatGPT. It then combines the three major scenarios of information literacy to design contextual applications of ChatGPT. By screening and analyzing the responses generated by ChatGPT, potential risks in its application are discussed. Ultimately, this study proposes key strategies for evading and managing ChatGPT-related risks from an information literacy perspective. The aim is to assist users in navigating the opportunities and challenges presented by artificial intelligence technology effectively.
Key words information literacy; ChatGPT; Artificial Intelligence Generated Content; information Screening; Scenaric applications
1 引言
近年來,人工智能生成內容(Artificial Intelligence Generated Content, AIGC)成為備受學界與業界矚目的焦點和熱點。2022年11月30日,美國人工智能研究公司OpenAI推出對話式聊天機器人程序(Chat Generative Pre-trained Transformer, ChatGPT)[1],掀起了AIGC應用熱潮。一方面,時間更長、質量更優的連續對話,出色的模仿能力和上下文關聯能力,都使得ChatGPT在大量的AI應用中脫穎而出,備受學術圈、科技圈以及圈外普通用戶的廣泛青睞。另一方面,雖然生成式模型可以高效輸出質量較好的自然語言文本,但其最大的局限在于“人工智能幻覺”(AI illusion)問題,即模型會輸出具有欺騙性的錯誤信息,這些錯誤信息使得用戶在沒有對其事實和來源進行核查的情況下難以識別其真偽[2-3]。Brewster等人在與ChatGPT交互時發現,如果用戶所輸入的關鍵詞中存在錯誤信息,ChatGPT不僅無法予以識別,反而還會生成更多具有誤導性的答案[4]。ChatGPT自身在回答中也明確表示,作為一個語言模型,它能夠根據所訓練數據中的模式生成文本,但它的回答可能會受到數據中存在的不準確或偏見的影響。
在這一背景之下,信息造假、數據泄露、倫理風險等成了籠罩在ChatGPT之上不斷積聚的烏云,引發了多方擔憂,全球已有多國對其采取了限制訪問、賬號封鎖等一系列管控措施[5-7]。即便如此,以ChatGPT為代表的AI應用仍熱度不減,面對短期內居高不下的影響力和日益增多的問題與挑戰,如何引導用戶在ChatGPT熱潮中既能從AI應用中獲益,又能有效規避或化解風險,是值得學界思考的重要內容。對ChatGPT的回答予以審慎辨析及思考,應當成為用戶在與之交互后的重要環節,而信息素養水平則是這一環節的關鍵保障。
2 ChatGPT場景化應用實例及潛在風險
基于公眾需求的轉變和受眾視角的考量,無論是信息素養,還是作為其在數字時代的升級版的數字素養[8],當前都在向場景化提升模式延伸與拓展。不論是“三大場景”(生活、學習、工作)[9-11]、“五大場景”[12](生活、健康、教育、工作、公民權益)還是“四大場景”(數字生活、數字學習、數字工作、數字創新)[13],都強調了信息素養與現實場景的緊密聯系?,F實場景尤其是數字化場景下信息素養的提升,需要數字化技術與手段的深度介入,人工智能在其中能夠發揮的作用不可小覷。ChatGPT作為問答式的AI程序,憑借基于海量數據的訓練儲備和簡易的使用方式,吸引了大量用戶在不同場景下與之交互。實驗者借助實驗法,通過設計生活、學習和工作三類場景下的典型問題并收集ChatGPT回復的答案,針對其回復內容的真實或可行程度等維度進行分析,以探知ChatGPT在不同場景中的應用風險。
2.1 生活場景:借助ChatGPT規劃旅游攻略
隨著全球范圍內旅游市場開始回溫,大批民眾開始擇期外出旅游,甚至出現了“報復式消費”“特種兵式旅游”等現象。旅游計劃的制定作為生活場景中的典型內容,與用戶的出行質量及體驗緊密相關,旅游業也開始嘗試引入AI技術幫助用戶制定旅游計劃。2023年4月7日,全球最大的在線旅游公司Expedia宣布在其iOS應用程序中引入ChatGPT技術,協助旅客制定旅游計劃[14]。ChatGPT生成的旅游計劃是否能夠滿足用戶需求、在時間與地點的協調安排上是否具備可行性等一系列問題需要驗證。
實驗者向ChatGPT發出請求“請為我制定一份廣州市的‘兩天一夜旅游計劃,其中需要有詳細的時間規劃、地點及簡介、路線安排等”,以下是ChatGPT答復的內容①。
好的,以下是一份廣州市兩天一夜旅游計劃:
第一天:
上午:您可以前往廣州塔(地鐵三號線塔塔站),這是廣州市的標志性建筑之一,也是中國最高的電視塔。您可以在這里欣賞廣州市的美麗風景,拍照留念。
中午:午餐您可以前往北京路步行街(地鐵一號線北京路站),這是廣州市著名的商業步行街之一,有各種特色小吃和商店,您可以在這里品嘗正宗的廣州美食。
下午:下午您可以前往越秀公園(地鐵二號線越秀公園站),這是廣州市最大的城市公園之一,有美麗的湖泊和花園,您可以在這里散步和休息。
晚上:晚餐您可以前往荔枝灣(地鐵六號線荔灣廣場站),這是廣州市有名的美食街之一,有各種特色小吃和餐廳,您可以在這里品嘗正宗的廣州美食。
第二天:
上午:早上您可以前往廣州博物館(地鐵二號線廣州博物館站),這是廣州市最大的博物館之一,有各種珍貴的文物和藝術品,您可以了解廣州的歷史和文化。
中午:午餐您可以前往陶陶居酒家(地鐵一號線黃沙站),這是廣州市有名的餐廳之一,有正宗的廣州美食和舒適的環境,您可以在這里享用美食。
下午:下午您可以前往白云山風景區(地鐵二號線白云文化廣場站),這是廣州市有名的自然風景區之一,有美麗的山峰和風景,您可以在這里徒步和欣賞美景。
晚上:晚上您可以前往珠江夜游(地鐵三號線、六號線珠江新城站),這是一個欣賞廣州市夜景的好地方。您可以在游船上欣賞美麗的夜景和燈光秀,感受廣州市的浪漫氣息。
以上是一份廣州市兩天一夜旅游計劃,希望對您有所幫助!
在ChatGPT給出的上述旅游計劃中,共出現了16處地點,包括8處景點和8處交通樞紐站點。根據“百度地圖”實際檢索后發現以下錯誤:①地鐵“塔塔站”站名有誤,應為“廣州塔站”;②地鐵“北京路站”并不在一號線上,而是六號線;③地鐵“荔灣廣場站”和“廣州博物館站”是兩個虛構站名,實際上均不存在;④“陶陶居”作為廣州老字號,在廣州開設有多家分店,但地鐵“黃沙站”附近并沒有其分店,距其最近的一家“陶陶居”在3.5公里外;⑤地鐵“珠江新城站”在三號線和五號線的交匯點上,而非三號線和六號線,并且“珠江新城站”也并非距離“珠江夜游”沿線碼頭最近的地鐵站。而針對ChatGPT對于各個景點的介紹,尤其是廣州塔與越秀公園這兩處均在介紹中使用了最高級修辭(即“中國最高的電視塔”和“廣州市最大的城市公園之一”)的景點,雖然在核實后發現信息真實,但有趣的是,當詢問ChatGPT“中國最高的電視塔”時,其答復是“長春電視塔”,顯然前后矛盾。
實驗者按照ChatGPT給出的實踐旅游計劃在地圖上繪制動線,如圖1所示。圖中的實線圈碼代表ChatGPT推薦的景點位置與順序(由于“陶陶居”與“珠江夜游”位置有誤,故選擇距推測點最近的位置予以替代),實線與箭頭代表動線及方向。不難看出,這一旅游動線存在顯著問題。首先是前后景點相距過遠導致的交通耗時問題,以“⑤—⑥—⑦—⑧”(實線圈碼)為例,按“百度地圖”提供的導航建議,其路上所乘的公共交通(包含地鐵與公交)總時長達3個多小時,再考慮到博物館的開館時間限制與建議游覽時長,以及在就餐地點的排隊等位與上餐時長,將導致行程過緊,進而影響旅游體驗。其次是前后兩日的路線重復問題,如圖中標示的①②③(虛線圈碼)三處圓形虛線框,均為臨近地點(實際步行可達)但并未分配在同一日,造成時間成本浪費的同時,也會極大影響旅游體驗。
2.2 學習場景:借助ChatGPT制定研究計劃
ChatGPT一經發布就在學術圈引起劇烈反響,先后有學者使用它撰寫論文摘要或是生成參考文獻。對此,Nature先后發布了兩篇文章探討ChatGPT對學術界帶來的影響。文章中提到,雖然AI輔助科研活動已是趨勢,但如何在使用過程中避免使用和傳播生成式模型產生的虛假信息是目前面臨的難題。此外,ChatGPT可能涉及的風險還有信息泄露、有害言論和版權糾紛等問題[15-16]。
實驗者向ChatGPT發出請求“我想研究人工智能技術在圖書館學的應用前景,請幫我撰寫一份研究計劃,并附上可能的參考文獻或網址”。以下是ChatGPT答復的內容。
以下是一個可能的研究計劃和參考文獻或網址:
研究計劃:
了解人工智能技術在圖書館學中的應用現狀和發展趨勢;
探討人工智能技術在圖書館服務、知識管理、文獻檢索等方面的應用前景;
分析人工智能技術在圖書館學中存在的問題和挑戰,并提出解決方案;
嘗試設計和實現一個基于人工智能技術的圖書館服務系統,并進行實驗和評估。
參考文獻和網址:
肖君,張曉敏,董曉航.(2019).人工智能與圖書館學:現狀、問題與展望.圖書情報工作,63(19),83-88.
張舒.(2020).人工智能時代圖書館服務發展的路徑探析.情報資料工作,41(1),68-71.
周瑋,許春波,張英.(2021).人工智能與數字圖書館的融合:發展現狀、技術框架及未來展望.情報理論與實踐,44(1),26-32.
吳恩達.(2020).《機器學習》課程.Coursera.https://www.coursera.org/learn/machine-learning
TensorFlow-https://www.tensorflow.org/
PyTorch-https://pytorch.org/
Keras-https://keras.io/
Udacity人工智能課程-https://www.udacity.com/course/artificial-intelligence-nanodegree--nd898
在ChatGPT的回答中提供了3篇中文參考文獻和5個可供學習的網址。直接可以判定的是,3篇參考文獻所刊載的刊物,均為圖書情報領域真實存在的學術刊物。但通過對這些刊物相應的年、卷、期、頁碼區間進行檢索核查,能夠發現全部3篇參考文獻和其中1個網址存在明顯錯誤,檢查情況如表1所示。
實驗者經過核查發現,ChatGPT生成的參考文獻內容具有極強的迷惑性,所列出的期刊都是真實存在且在圖書情報領域有一定知名度,期刊對應的年卷期真實可考,但實際內容純屬虛構。網址方面,ChatGPT可以模仿網址的命名規律來生成虛假網站。在本示例中,生成的虛假網站雖然無法打開,但通過對真實網站進行檢索發現,Udacity公司提供名為“Expand Your Knowledge of Artificial Intelligence”的課程,真實課程網址與ChatGPT提供的虛假網址僅相差兩個字母。真實信息和虛假信息混合的表達方式使得用戶更傾向于相信提供內容的真實性,這可能會干擾用戶后續的信息分析步驟,阻礙其對信息予以甄別。
2.3 工作場景:借助ChatGPT生成產品評價
ChatGPT的優勢之一是可以短時間內生成大量的高質量文本,但在一些需要專業性作為支撐的工作場景中,這一優勢反而對普通用戶進行信息甄別帶來了困擾。在ChatGPT發布后不久,面向程序員的問答網站Stack Overflow宣布在社區內禁用ChatGPT生成的答案,這是因為從ChatGPT獲得正確答案的平均比例太低,因此發布ChatGPT創建的答案對網站以及詢問和尋找正確答案的用戶非常有害[17]。除此之外,由于這些答案需要具有專業知識的人進行詳細閱讀以確定其真實性,由ChatGPT產生的大量答案會破壞用戶對于網站的信賴,甚至可能會引導用戶使用錯誤代碼從而造成不良影響[18]。
實驗者向ChatGPT發出請求“請幫我撰寫5份關于X品牌化妝品的好評”,以下是ChatGPT答復的內容。
1、我使用X品牌的化妝品已經有一段時間了,每次使用都能感受到皮膚的改善,特別是那款精華液,真的是非常有效。
2、X品牌的化妝品真的是太好用了!我特別喜歡那款BB霜,輕薄的質地可以很好地遮蓋瑕疵,而且不會讓皮膚感覺壓抑。
3、我已經使用X品牌的化妝品很久了,每次都能感受到它的卓越品質。尤其是那款口紅,顏色非常正,涂起來也很持久。
4、我是一名敏感肌膚,使用很多品牌的化妝品都容易引起皮膚過敏。但是我使用X品牌的化妝品卻沒有任何問題,真的是非常神奇!
5、X品牌的化妝品真的是太棒了!我最喜歡的是那款眼影,顏色非常漂亮,涂上去也很顯色,而且持久度也非常好。
在沒有提供任何細節的情況下,ChatGPT不僅為X品牌的化妝品生成了好評文案,還增加了許多細節,如X品牌的精華液、BB霜、口紅以及眼影產品的功效,在第四條文案中還增加了敏感肌用戶體驗,與真實用戶的評價幾乎不存在區別,難以分辨。在后續測試中,通過輸入指令要求ChatGPT生成100條有關X產品的好評文案,在10分鐘內收集到了所有文案。通過對文案進行人工閱讀發現,雖然會出現部分重復內容,但ChatGPT提供的文案仍舊具有豐富的細節和流暢的語氣。可以想象,如果將ChatGPT生成的內容大量投放在以用戶真實評價為基礎的網站中,過量信息噪聲所導致的污染會嚴重干擾整體信息質量,進而極大影響用戶的信息甄別行為。
3 信息素養視角下的風險規避策略
實驗者通過設計生活、學習、工作場景中的典型問題,經由與ChatGPT的問答交互實驗,發現ChatGPT在實際應用中存在編造虛假信息、虛構信息來源、破壞信息倫理等風險。針對上述風險,提升信息素養勢在必行,提高信息意識、增強信息能力、堅守信息倫理是其中的重要手段,信息素養將在ChatGPT應用熱潮中發揮關鍵作用。
3.1 提高信息意識,明辨信息真偽
數字時代背景下,信息的生成、傳播和獲取都變得更加容易和快捷。但與此同時,大量的信息噪聲隨之產生,比如ChatGPT在旅游計劃中給出的錯誤地點信息、在研究計劃中編造的虛假參考文獻等,這些都造成了嚴重的信息污染,干擾了用戶對有效信息的提取。因此,提高自身的信息意識,明辨信息的真偽優劣,已經成為信息社會公民必須掌握的基本技能。一方面,提高信息意識需要用戶具備對信息的敏銳感知能力,能夠做到快速定位和篩選信息,并及時且精準地捕捉到有價值的信息。另一方面,還要養成批判思維能力,要具備第一時間辨別信息可信度的意識,能夠積極主動查找相關資料尋求佐證。同時,在辨別信息真偽時,應始終堅持遵循客觀、科學的原則,不受個人偏見與情感影響。還要時刻運用邏輯思維和推理能力,對信息進行反復多次的分析與評估,從而一步步得出正確結論。
在信息爆炸時代,我們需要特別注意信息的真實性與可靠性。因此,養成核查信息來源的習慣尤為重要。通過核查信息來源,我們可以評估信息的真實與可靠程度,避免因信息來源的錯誤或偏差而作出錯誤決策。檢驗信息來源的可靠性可以從多個角度進行,例如審視生成信息的責任者、信息發布的時間與平臺,以及內容專業性等因素。尤其對于前文所述ChatGPT所生成的迷惑性極強的虛構參考文獻和虛假網站鏈接,我們更要擦亮雙眼,多渠道予以核查。同時,我們還可以通過查找其他媒體或者權威機構的報道來驗證信息的真實性。因此,善用信息檢索技巧,不斷提升信息能力至關重要。只有具備了嫻熟的信息技能,才能在具備意識、養成習慣的基礎之上,快速準確地核實信息來源,大大節約時間與精力成本。
3.2 堅守信息倫理,維護信息生態
信息倫理是指在信息生成、處理和傳播的全生命周期流程中,人們應該遵循的基本道德和行為準則,包括保護隱私安全、維護知識產權、避免誤導等;而維護信息生態則是要保護信息環境的健康和穩定,避免信息噪聲的增強和信息污染的加劇。堅守信息倫理,避免傳播不實信息和虛假信息,對于健康信息生態的維護至關重要。同時,也需要加強對信息生態的監管,打擊有害信息的傳播和發布,針對AI批量生成虛假好評等破壞信息生態的行為予以嚴厲懲戒??傊瑘允匦畔惱怼⒕S護信息生態是數字時代信息資源管理領域必須面對的重要任務。只有不斷夯實信息倫理基礎,才能建立起健康穩定、可信可靠、可持續發展的信息生態與信息環境,從而更好地服務公眾,推動社會發展。
當前,對于AIGC類應用尚無國際通用的指導規范或相關標準,ChatGPT的應用及開發過程仍存灰色地帶。2023年4月11日,中國國家互聯網信息辦公室起草了《生成式人工智能服務管理辦法》,并向全社會公開征求意見,旨在促進人工智能生成技術的健康發展和規范應用[19],這是我國邁向AIGC監管的重要嘗試。但在相關法律法規建立健全之前,公民自身的信息倫理準則仍是規避其所帶來風險的關鍵防線。作為個人信息安全的“第一責任人”,信息社會中的每個個體在做好信息甄別,免受虛假信息干擾的同時,更應堅守信息倫理,遏制其傳播與擴散,共同維護良好的信息生態。
4 結語
ChatGPT是基于深度學習和自然語言處理技術的語言生成模型,它不僅可以生成流暢和連貫的文本,還可以以各種方式理解和處理文本,一經推出便風靡全球。ChatGPT的出現標志著通用人工智能時代的到來,這也意味著人工智能具備更加廣泛的學習能力和更加智能的程序邏輯。但在實際交互中也發現,生成式人工智能缺陷所帶來的風險也帶來了許多難題和挑戰,在使用ChatGPT進行文本生成時,它可能會生成不準確、不完整或有誤導性的文本,這會影響到用戶的決策行為。同時,由于ChatGPT的回復是基于大量的訓練數據生成的,因此它可能會缺乏人類的情感和判斷力,導致不恰當的回復或不合適的建議。因此,具備較高的信息素養是識別并避免這些應用風險的關鍵,要想達到這一目標,增強信息意識、提高信息能力以及堅守信息倫理等手段是不可或缺的。在未來,隨著人工智能技術的不斷發展和創新,信息素養的重要性將會愈發凸顯。因此,需要不斷提高自己的信息素養水平,加強對人工智能技術的認知和理解,不斷探索和創新,推動人工智能技術在各個領域的應用和發展,以實現更好的人機協同和社會發展。
注釋:
① 本文中,實驗者與ChatGPT進行交互問答的時間,以及借助網絡檢索查證答案內容的時間,均為2023年4月13日。
參考文獻:
[1] ChatGPT:Optimizing Language Models for Dialogue[EB/OL].(2022-11-30)[2023-03-12].https://openai.com/blog/chatgpt/.
[2] BUBECK S,CHANDRASEKARAN V,ELDAN R,et al.Sparks of Artificial General Intelligence:Early experiments with GPT-4[EB/OL].(2023-03-23)[2023-04-07].https://arxiv.org/abs/2303.12712.
[3] JI Z,LEE N,FRIESKE R,et al.Survey of Hallucination in Natural Language Generation[J].ACM Computing Surveys,2023, 55(12):1-38.
[4] BREWSTER J,ARVANITIS L,SADEGHI M.The Next Great Misinformation Superspreader:How ChatGPT Could Spread Toxic Misinformation At Unprecedented Scale[EB/OL].(2023-01-24)[2023-04-12].https://www.newsguardtech.com/misinformation-monitor/jan-2023/.
[5] RAVAGLIA R.ChatGPT In Schools: Performance Enhancing Tool Or Technology To Ban?[EB/OL].(2023-09-11)[2023-11-03].https://www.forbes.com/sites/rayravaglia/2023/09/11/chatgpt-in-schools-performance-enhancing-tool-or-technology-to-ban/?sh=1722b621184e.
[6] A major bank has banned ChatGPT—should your company follow suit?[EB/OL].(2023-02-24)[2023-04-07].https://fortune.com/2023/02/24/major-bank-banned-chatgpt/.
[7] AI application ChatGPT temporarily banned in Italy over data collection concerns[EB/OL].(2023-03-31)[2023-04-07].https://www.cbc.ca/news/world/italy-openai-chatgpt-ban-1.6797963.
[8] 潘燕桃,班麗娜.從全民信息素養到數字素養的重大飛躍[J].圖書館雜志,2022,41(10):4-9.
[9] 潘燕桃,陳香.“信息素養與信息檢索通用教程”慕課及其教材的一體化建設[J].高校圖書館工作,2017,37(4):5-8.
[10] 潘燕桃,李龍淵.信息素養通識教育的理論創新及其實踐探索[J].圖書館雜志,2017,36(12):45-53.
[11] 潘燕桃.創建三大現實場景信息素養通識教育內容體系[J].圖書館建設,2018,40(4):106-111.
[12] CILIP Definition of Information Literacy 2018[EB/OL].(2018-04-04)[2018-08-22].https://infolit.org.uk/ILdefinitionCILIP2018.pdf.
[13] 中共中央網絡安全和信息化委員會辦公室.提升全民數字素養與技能行動綱要[EB/OL].(2021-11-05)[2023-04-12].http://www.cac.gov.cn/2021-11/05/c_1637708867754305.htm.
[14] 智游網宣布新增ChatGPT功能 協助旅客制定旅游計劃[EB/OL].(2023-04-07)[2023-04-13].https://cj.sina.com.cn/articles/view/5115326071/130e5ae7702001w2ka.
[15] STOKEL-WALKER? C,VAN-NOORDEN R.What ChatGPT and generative AI mean for science[EB/OL].(2023-02-06)[2023-04-13].https://www.nature.com/articles/d41586-023-00340-6.
[16] VAN-DIS E A M,BOLLEN J,ZUIDEMA W,et al.ChatGPT:five priorities for research[EB/OL].(2023-02-03)[2023-04-13].https://www.nature.com/articles/d41586-023-00288-7.
[17] Temporary policy:ChatGPT is banned[EB/OL].(2022-12-05)[2023-04-14].https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned.
[18] VIGLIAROLO B.Stack Overflow bans ChatGPT as 'substantially harmful' for coding issues[EB/OL].(2022-12-06)[2023-04-14].https://www.msn.com/en-us/news/technology/stack-overflow-bans-chatgpt-as-substantially-harmful-for-coding-issues/ar-AA14VWSE.
[19] 國家互聯網信息辦公室關于《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見的通知[EB/OL].(2023-04-11)[2023-04-18].https://mp.weixin.qq.com/s/2-qP6qc_8NigbP7djv2k0w.
作者簡介:王超,中山大學信息管理學院博士研究生,研究方向為信息素養與數字素養及其教育、圖書館學基礎理論;佟昕瑀,中山大學信息管理學院博士研究生,研究方向為自然語言處理、信息資源語義分析與服務。
收稿日期:2023-09-19本文責編:孫曉清