999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新聞生產中算法運用的技術路徑與價值邏輯

2021-11-11 19:51:13
現代出版 2021年3期

人類發展離不開技術。但是僅就技術的有效性而言,人類與其他許多物種相比,很長時期內始終是落伍者;僅就工具制造技術而言,難以證明人類的特殊性。是人類的大腦而不僅僅是雙手,使人類具備了語言符號、審美形象,以及可以在社會群體中傳播和共享的知識,才使人類真正地與眾不同。因此,從本質上來說,技術的工具價值帶來有效性的那部分價值,并不是技術的全部價值,而其終極價值—人類文明中的根本價值,即帶來知識和智慧的那部分價值,才是突顯人的尊嚴的。馬克思·韋伯將人的理性行為分為工具理性行為和價值理性行為。工具理性在于在認識和改造世界的過程中指導人類“如何去做”,而價值理性在于告訴人類“為什么要做”,二者的有機統一才能對滿足人類需求的生產實踐活動進行有效指導。人類對生產工具的需求并不像動物一樣出于生存本能,而是存在目的性需求,因此在面臨算法這種新的“生產工具”時,我們需要同時兼顧其工具價值和理性價值,考慮其作為一種技術或者工具的“工具價值”。但在現實中,我們會因為新技術的效益而歡呼雀躍,而常常忽略了另一面的價值。

智能技術可謂集人類工具制造能力和知識智慧的最高代表。人工智能就是讓計算機完成人類心智能做的各種事情。人工智能正在開啟新聞傳播的智能傳播時代,并運用于數據挖掘與信息采集、自動化寫作、算法式分發、自動化事實核查、優化產品以及社交機器人與用戶的互動等各個環節,引發了媒體生產與運營、媒體人的角色與技能要求的新轉變。有學者斷言:我們已經進入新聞算法(news algorithms)的時代,自動化和算法已經成熟到能夠從事真正的新聞工作。近年來,智能算法在新聞傳播領域的應用是學界的前沿和熱門議題,關于智能算法運用于新聞生產,學者們主要討論了以下幾個方向:一是從新聞生產的過程入手,探討人工智能在新聞內容采集、新聞制作與分發、新聞接收、用戶畫像等層面為新聞業帶來的全新變革;二是從現實性、前瞻性的方向探討智能化新聞生產的應用現狀及前景,一些學者還以目前已經問世的寫作機器人或算法推薦的產品為案例去分析其在新聞生產過程中的實際應用與未來發展;三是從倫理的角度出發思考算法作為一種新興技術所帶來的算法黑箱、算法歧視、隱私讓渡與侵犯等問題,并試圖解釋算法倫理問題的成因、影響與對策;四是討論在新聞智能化生產環境下新聞從業者的可替代性和再定位,算法僅僅是“搶飯碗”,還是能夠實現對行業的融合與重塑?本文以智能算法運用于新聞生產階段為例,通過分析算法運用的技術路徑,探討其價值邏輯及風險。

一、算法運用于新聞生產的技術路徑

算法(algorithms)指的是為解決問題而進行的計算機操作規則的一系列步驟。計算機運用的技術主要是自然語言處理(natural language processing,NLP),主要包括自然語言理解(natural language understanding,NLU)、自然語言生成(natural language generation,NLG)兩個方面。

以新聞文本的生產為主要目的,由機器學習或者神經網絡為技術基礎生產和分發的新聞被稱作算法新聞。算法新聞的流程包括三個階段,也稱為算法新聞的“I-T-O模式”:數據輸入(input),即從公開或私人的數據庫中抓取信息,作為算法新聞生產的“原材料”;數據吞吐(throughput),即通過監督式機器學習(人為預先設定規則)或無監督式機器學習(機器自動學習形成一套人無法清晰了解的規則,并運用到之后的新聞生產中),根據既定的語法和句法規則,經過半自動或全自動的NLG,將輸入的數據整理成一定的結構;新聞產品輸出(output),指的是由NLG生成的新聞產品完成線上和線下的分發。機器學習是人工智能的核心技術,包括監督式和無監督式兩種。監督式學習有固定的模板,輸入和輸出的都是已知信息,將數據“喂”給算法后,自動按照給定的規則填充公式化的表達,生成稿件;無監督式學習沒有固定的輸入—輸出模板,以大數據為基礎,主要尋找相關關系和趨勢、表面奇異值等,不追究因果關系,機器自動從數據中抽取知識。

智能機器已經具有在復雜情境下進行語義理解和文本生成的能力,可以同時承擔簡單的替代性勞動和復雜的創造性勞動,依托不同的情境進行多元靈活的新聞生產。內容生成屬于自然語言生成算法領域的一個應用分支,其歷史、發展和自然語言生成基礎算法的發展基本保持一致。自然語言生成是以模仿人類書寫以及說話的方式來產生有意義的短語和句子的過程,其領域包括內容生成、機器翻譯以及聊天機器人等應用,目的是通過預測句子中的下一個詞語來傳達信息,它以每秒數千頁的速度,自動生成回復、描述、總結或者解釋輸入結構化數據的敘述性語句。目前有兩類主流的自然語言生成方法:基于模板的靜態算法和基于上下文的動態算法。?? 到目前為止,只有后者被認為是“真正”的自然語言生成算法。兩種算法在實際應用中各有優劣,業界比較成熟的算法往往是兩類方法的結合體。

1.基于模板的靜態算法

基于模板的靜態算法主要將模板填空式算法作為主流算法,模板填空式算法可謂最古老最簡單的自然語言生成方法之一。早期的系統代表有Eliza、PARRY、天氣預報系統以及體育運動播報系統,其最初主要使用在“預定義結構”的填充上。預定義結構俗稱為“模板”,類似于完形填空式的內容,對于具有預定義結構且只需要填充少量數據的文本可生成一段完整的描述。例如,天氣預報播報的預定義結構是:

明天[

城市

][

天氣狀況

],最高氣溫[

最高氣溫

]攝氏度,最低氣溫[

最低氣溫

]攝氏度,[

風向

][

風力

]級,最適合[

活動類型

],天氣預報祝您開心每一天。(中括號內為填充內容)

填充相應數據之后,便可以生成以下兩條天氣預報的播報內容:

明天北京晴,最高氣溫25攝氏度,最低氣溫17攝氏度,東南風1—2級,適合戶外運動及出游,天氣預報祝您開心每一天。

明天天津晴轉多云,最高氣溫16攝氏度,最低氣溫6攝氏度,北風3—4級,適合居家及進行室內休閑活動,天氣預報祝您開心每一天。

對于具有預定義結構且只需要填充少量數據的文本,這種方法便可以批量生產出符合人類語言規則的內容,且在內容上也可以實現一定程度的差異化。然而該方法并不被認為是“真正”的自然語言生成,主要在于“預定義結構”上。所謂預定義結構由句子模板和詞匯模板組合而成,句子模板包括若干個含有變量的句子,詞匯模板則是句子模板中的變量所對應的所有可能的內容。

靜態模板運用在自動新聞寫作過程中,“規則”掌握在人的手中,應當是先有規則,后有新聞產品。從上面的例子可以了解到,無論是句子模板還是詞匯模板,基本上都來源于人工總結提取,并形成固定模板,但模板的豐富性和實時性都很難得到保證。在以往的各類內容中存在著大量規范化的句式,如果能從先前的文本數據中自動將這些句式模板提取出來,將極大地減輕人工負擔。因此在后來的基于模板的靜態算法研究過程中,大量的工作集中在如何自動從數據中挖掘和生成句子模板,減輕人工負擔,增加模板的多樣性。例如,使用聚類算法對內容進行聚類,然后利用先驗規則將抽象的模板挖掘出來,或者使用二步迭代的方式逐步從內容中生成句子模板和詞匯模板?;谀0宓撵o態算法后期加入了邏輯規則處理可能出現例外情況,這些規則的加入使得計算機更容易生成語法正確的文本,編寫更加復雜的模板。模板填空式算法的優點在于簡單、可控和嚴謹,因為每一個模板都是人工總結出來的。

這種算法的缺點也顯而易見,使用場景十分有限且生成內容的重復性高,由于過度依賴人類知識和經驗,模板的豐富性和實時性都很難得到保證。基于模板的靜態算法只能處理特定場景下的語言生成,且話術千篇一律,很容易產生審美疲勞,其“智能性”難以體現人類的智慧和能力。

2.基于上下文的動態算法

基于模板的靜態算法由于其單一性和過度依賴人工經驗的缺點,在如今的大數據時代已經不能夠滿足人類的需求。在此背景下,一種基于上下文的動態算法逐漸流行起來,該方法通過上下文語法語義結構信息來動態地創建句子。上下文信息指已經完成書寫的段落、開始寫作時輸入的內容類別以及內容關鍵詞等信息。動態創建意味著系統可以在不尋常的情況下自主做出反應,不需要技術員為每個邊界情況顯式地編寫模板和規則。它還允許系統在語言上以多種方式優化句子,包括引用、聚合、排序和添加連接詞。同時,相比于基于模板的靜態算法,基于上下文的動態算法可以生成篇幅更長的文章,而基于模板的靜態算法由于編寫模板的限制而在全文生成方面存在困難?;谏舷挛牡膭討B算法可以在“微觀層面”生成句子,同時也可以在“宏觀層面”生成與讀者相關、結構良好的有用的敘事性文檔,能否做到這一點取決于文本的目標人群及個性化信息體系是否完整。

自然語言生成從模板生成到動態生成,經過了多年的技術試驗才取得了令人滿意的結果。作為NLP和AI的一部分,自然語言生成依賴于一些算法來生成文本,近年來主流的基于上下文的動態算法主要有以下幾種:

(1)馬爾可夫鏈(Markov chain):馬爾可夫鏈是最早用于語言生成的算法之一,其名稱來源于俄國數學家安得雷·馬爾可夫。該模型通過當前詞語并考慮每個詞語之間的關系來計算下一個出現的詞語的概率,從而預測句子中出現的下一個詞語。這種算法在早期版本的智能手機輸入法上經常使用,在用戶主動輸入一些詞語后,句子中可能出現的下一個詞語會被聯想出來,從而為用戶生成內容建議?;隈R爾可夫鏈的語言模型在數據驅動的自然語言生成中有著重要的應用,但研究人員必須為每一個場景以及領域設計特有的輸入特征,例如為體育領域設計的輸入特征無法適用于其他領域。

(2)循環神經網絡(RNN):神經網絡是試圖模仿人類大腦運作的模型。RNN通過前饋網絡傳遞序列中的每一項,并使用模型的輸出作為序列中下一項的輸入,同時儲存著歷史信息。在每次迭代中,模型將前面遇到的詞語存儲在內存中,并計算下一個詞語出現的概率。對于字典中的每個詞語,模型根據前一個詞語分配一個概率,選擇概率最大的詞語并將其存儲在內存中。RNN的“記憶”使該模型成為語言生成的理想模型,因為它可以隨時記住對話的背景。然而,隨著序列長度的增加,RNN不能存儲句子中相距太遠的詞語,只能根據最近的詞語進行預測。由此,循環神經網絡很容易忘掉前文生成的內容進而生成前后邏輯不一致的內容。

(3)長短期記憶網絡(LSTM):為解決遠程依賴問題,人們引入了RNN的一種變體—長短期記憶網絡。雖然與RNN相似,但LSTM模型包含三個門信息以及當前單元狀態的神經網絡,三個門分別為遺忘門(forget gate)、輸入門(input gate)、輸出門(output gate),它們允許神經網絡在任何時間間隔通過調整該單元的信息流來記住或忘記單詞。當遇到句號時,遺忘門識別出句子的上下文可能發生變化,可以忽略當前單元狀態信息。這就使得網絡能夠選擇性地只跟蹤相關信息,同時最小化梯度消失的問題,模型也能夠在更長的時間內記住信息。盡管如此,由于從上一個單元到當前單元的固有復雜的串行路徑,LSTM內存的容量被限制在幾百個單詞內,長度有限。其模型復雜度導致了高計算需求,這使得LSTM難以訓練或并行化,內容生成速度慢。

(4)自注意力模型(transformer):2017年谷歌首次提出了一個相對全新的模型,該模型使用了一種名為“自注意力機制”的新方法。Transformer由處理任意長度輸入的一組編碼器和輸出生成的句子的另一組解碼器組成。與LSTM相比,transformer只執行少量的、固定數量的步驟,同時應用了一種自注意力機制,直接模擬句子中所有單詞之間的關系。與以前的模型不同,transformer能夠處理較長的句子,同時其計算量并未激增。因為自注意力模型在訓練時可以并行化,所以其內容生成速度遠遠領先于長短期記憶網絡。

用于語言生成的transformer中最著名的例子之一是OpenAI,即其GPT-2語言模型,該模型通過關注先前生成的文章來預測下一個詞語。GPT-2語言模型是學界和業界生成模型中最為領先也最具代表性的一個,其不僅在很多任務上超越了此前的最高水平,還可以根據一小段話自動補充大段連貫的文本,并模擬不同的寫作風格。同時,GPT-2還被冠以最強假新聞生成器的稱號。OpenAI 設想,人們可能出于惡意目的利用GPT-2來生成誤導性新聞、在網上假扮他人進行欺詐、在社交媒體上自動生產惡意內容和偽造內容、自動生產垃圾郵件或釣魚郵件等。所以,OpenAI在發布GPT-2的同時就宣稱“這種強力的模型有遭到惡意濫用的風險”,選擇不對其做完整開源。后經過一年多的時間,GPT-2謹慎地開源了一部分源代碼以供開發者嘗鮮。但不可否認的是,作為谷歌最新升級的算法,transformer雙向編碼器(BERT)為各種自然語言處理任務提供了最先進的結果。

基于上下文的動態算法由于不需要過多的人工干預,克服了基于模板的靜態算法的諸多缺點,已經越來越受到業界的重視。然而基于上下文的動態算法也有其缺陷:不可控性以及前后邏輯矛盾。不可控性主要體現在生成的內容可能會超出人類預期的一些結果,比如違背道德和法律的內容、種族歧視以及虛假新聞。因其不需要人工干預,完全由上下文來決定要生成的內容,所以很容易被訓練語料、初始狀態或在線學習算法等過程引導到一個錯誤的方向,進而生產大量的垃圾內容。前后邏輯矛盾主要受制于當前的技術水平,在目前技術水平下能回顧的上文長度不宜過長,否則上文信息就會消失,進而生成和上文完全沒關系的內容,生產出的內容會顯得非常松散甚至出現前后觀點矛盾的情況。這種方式將新聞生產過程推進深深的“黑箱”—新聞生產的幕后,人類現有認知水平難以判斷其真實度、可信度、透明度,人們不需要知曉規則,產品即“不需要推敲”的成品,編輯審稿環節(如果還保留的話)很難進一步核查事實、追尋真相邏輯鏈。但是對于基于模板的靜態算法而言,因為其模板都是人工總結出來的,所以天然不存在以上兩個問題。

目前,市面上幾乎所有的產品都不只局限于某種單一的技術,而是采用基于動態算法的多種技術的集成。例如,今日頭條的新聞寫作機器人“張小明”(xiaomingbot)可以2秒完成稿件并快速上傳,在里約奧運會開始后的13天共撰寫457篇報道,每天生產新聞30篇以上,內容涵蓋羽毛球、乒乓球、網球等領域,發稿速度幾乎可以與現場直播相媲美。“張小明”通過語法合成,結合最新的自然語言處理、視覺圖像處理和機器學習等技術,不僅可以模仿人類語氣進行新聞稿件寫作,還可以自己選擇新聞配圖。在內容生產運用于新聞生產的領域,國外的主要新聞寫作機器人和智能編輯審稿機器人有美聯社的Wordsmith、《紐約時報》的Blossombot、《華盛頓郵報》的Heliograf、《衛報》的Open001、路透社的OpenCalais等;國內的除“張小明”外,還有新華社的快筆小新、騰訊的Dreamweiter、第一財經的DT稿王等。

語言生成從使用簡單的馬爾可夫鏈生成句子向使用自注意模型生成更大范圍、更連貫的文本演變,再到如今新聞生產機器人多種算法的技術集成,這是一個從機器學習到深度學習的過程。然而,我們正處于生成語言模型的開端,transformer只是邁向真正的自主文本生成的第一步。生成模式也被開發用于其他類型的內容,如圖像、視頻和音頻,這為將音視頻生成模型與文本生成模型集成在一起,開發出具有音頻及可視界面功能的高級個人助理提供了可能。同時,為了增加可控性以及邏輯一致性,目前大量的研究開始探索如何將人類經驗和生成模型統一結合起來,人類只需要提供少量的監督信息即可規避上述問題,這個領域在未來肯定會有更好的發展。

二、算法運用于新聞生產的價值邏輯

在人類創造、使用技術和工具的過程中,技術和工具也會承載著特定社會中人的價值。隨著算法的逐漸發展與強大,作為一種技術或者說工具,算法也不可避免地會陷入技術倫理價值的善惡之爭之中。算法運用于新聞生產,涉及人在生產中的創造性和主體性,算法的權力關系與道德責任,以及工具價值與終極價值的矛盾等價值觀問題。

1.人的主體性與創造性

計算機不可或缺的四大思維,包括精準的溝通、記憶和計算能力、具有計算的通用性和特定的結構,以及能夠按大腦核心算法進行創造性思考。運用計算機科學的基礎概念去求解問題、設計系統和理解人類的行為,首次從物理空間對人體的延伸、思維的嫁接與嵌入進行革新,最終以取代人類大腦為目標。算法思維將成為一種空前的技術思維,推動社會向未來變革。算法的本質是抽象和自動化,抽象是人類以理性把握世界的重要方式,而數學、計算和邏輯則是抽象思維的最高境界,從20世紀中期開始,伴隨著生物學和計算機科學的發展,人們就嘗試著以計算的抽象思維去認識和把握世界。

人工智能不僅僅是計算機科學發展的產物,它還是特定媒介文化前提下的人機混合物。傳統上,人們認為人工智能模擬人類功能,并重現人的智力能力,但從控制論的視角來看,人工智能并不是重現人的智力能力,而是通過捕獲人類的認知能力將人類嵌入自身,形成混合的人機設備。這其中,人的主體性與創造性是值得關注的重要問題?;谟嬎銠C智能的生產者和研究人員降低了人性。笛卡爾主張的客觀和中立的真實性、真正的知識是無語境的抽象,基本預設了事實和價值的分離,以為信息技術是中立的。對于人工智能新時代的傳播理論與實踐而言,如何保持人的獨特性是首要問題。

計算思維已經大量地運用于新聞產品中,而且要設計得具備智能思維—人類思維的模擬化,這就需要足夠的“新聞的想象力”。不同的算法意味著不同的價值觀考量。僅從上述自動化寫作的技術之中,我們就可以發現算法技術存在的缺陷。首先,寫作模式固定,缺乏舉一反三的創造性。人類的寫作,即使使用“模式”,也是以思維的載體的形式出現的,記者并非按部就班地遵循閉合的規則來進行事實推敲和文本寫作。而基于數據統計的AI在過去的數據中進行歸納總結,難以出現人類的推理、靈感。目前的AI技術不會聯想,是缺少想象力和個性的,但是人類具有靈感。因此自動化寫作仍需要人的創造力的彌補,并為文本的發展和多樣性提供更多的可能。其次,原生創造力缺失,應對突發情況能力差。無論是傳統的基于規則模板的方法,還是目前的統計學方法,都缺乏創造力,基于規則模板的方法也只能創造給定場景和條件下的內容?;诮y計學的方法只能從過去的新聞內容中學習文法規則、事件實體以及已產生的內容。一旦遇到全新的新聞,包含大量新的事件、場景以及描述詞語時,目前AI的創造能力基本是不足的。因為AI只能模仿以往的新聞寫作習慣以及用詞,對沒見過的事物基本無法處理,所有的內容都來源于海量數據,不可能產生訓練數據沒有涉及和覆蓋的內容。最后,知識和感知可能無法自洽?;跀祿腁I,無論是一代的知識型AI還是二代的感知型AI,在知識和邏輯中還未達到自洽的程度,如果人類沒有提前告訴它人生理構造的不同,AI有可能寫出女性得前列腺癌的文章。想要以人工智能完全替代人類的諸如新聞寫作這樣的智力勞動,還是難以實現的。

2.權力關系與道德風險

這里有兩層權力關系。一層是算法對新聞業的介入引發的“權力遷移”,算法使權力從公共機構遷移到資本驅動的技術公司,相比傳統媒體清晰的操作流程,算法使傳播的操作后臺化,資本權力擴張,壟斷傳播資源,內容采集、投遞、營銷難以受到公共力量的監督,擁有技術和數據的公司反而擁有更多的公共權力。算法除了在控制信息生產、流通的過程中體現出權力,還通過制定行業規范彰顯統治力。

另一層是在人工智能系統的生產過程中,存在兩種不平衡的權力關系—決策權和技術知識的聯手。一方面,管理者首先為人工智能系統運行提出要求;另一方面,技術人員在技術決策過程中保留必要的自主決定權。因而,在工程師的職業想象中,其在法律規則、組織規范和用戶要求的基礎上構建AI系統,人工智能系統的道德責任是分散的,工程師事實上扮演著人工智能系統、用戶、決策者之間協調者的角色,無法獨自為人工智能系統的道德狀況負責。

內容生產中的權力,與信息分發中對用戶的“網絡分層”密切互動,內容公司需要全部的用戶行為數據,特別是用戶的“關系數據”,通過機器學習、神經網絡、定位服務等技術,向精細化導流的方向發展。現階段人工智能屬數據驅動型,機器主要是通過模擬人類的感知進行計算的,這代技術先天地具有不可解釋性、不透明性。算法包含技術人員的價值觀和意識形態取向,如果技術員心術不正,刻意寫出有問題的算法,那么算法生產出的內容就會存在倫理問題。內容生產會受到互聯網信息服務類公司的控制,在專業性、獨立性上向服務商做出讓步。價值觀和意識形態一旦被事先嵌入算法之中,就會帶來算法偏見和倫理問題。即使并不存在有意為之的行為,目前通過已有數據集決定的算法,已經有相當多的案例證明其存在偏見,這里包括數據集的不全面和先天缺陷,比如關于少數族裔的數據,因為其數量的不足常常出現先天性的不公正結論;也包括以過去的數據預測未來而帶來的價值偏見風險,比如關于美國歷史上犯罪率導致的算法種族偏見;還包括以整體的數據集的結論投射到個體身上的問題,比如美國單個黑人要承受黑人犯罪率被算法夸大標記的風險。

3.工具價值與終極價值的矛盾

在新聞選題策劃方面,記者通過大數據的方式獲取新聞線索,將語音識別技術及文本轉化技術作為工具來管理稿件、組織采訪并回復電子郵件等。以“機器人記者”代替“人類記者”的自動化新聞寫作技術,使得新聞出稿數量大幅增加;報道速度大大加快,在一些對時效性要求較高的領域具有顯著優勢;形式更加多樣,不僅僅限于文字信息,圖片和視頻的識別、編輯能力也在迅速增強。對于商業媒體而言,以最有效的方式增加受眾和產出是其重要目標。哥倫比亞大學的專家認為,社交媒體和技術平臺對新聞生產的影響,Facebook、Snapchat、Google和Twitter這樣的技術平臺在加速全面接管傳統的新聞生產發行工作,并為之進化,以適應激烈的同行競爭。社交媒體和互聯網公司不滿足于只占有新聞內容分發的渠道,他們逐漸掌握了讓你看到什么、感覺到什么、關注到什么的操縱技能,甚至改變了新聞的格式。此外,監控流量的技術公司、追求精準導流的媒介運營商、外包商協作網絡乃至金融資本,都以各種方式參與新聞生產,追求效益最大化。其結果可能是用戶成為被權力工具宰制的對象,成為機構實現商業化目標的手段。

智能技術具有工具價值,即它可以被應用于特定的目的。但是技術的積極意義還在于其使用戶認為它代表了一個“良好”社會的價值觀,也就是不只強調技術的工具理性,還關注技術的價值理性。技術對于人類而言,其終極價值—關乎人類生存的意義、生命與宇宙起源等—是極為重要的。從其起源開始,技術就與人類本質屬性互相聯系—一開始以生命、生存為中心,并非以勞動生產為中心,更不是以權力為中心,技術始終是文化整體的一部分。強調工具價值,其行為是根據目的、手段和后果作為其行為取向的,目的和后果之間可能是相互競爭和沖突的,是目的至上的;而價值理性行為是人根據自己的信念(包括義務、尊嚴、美、宗教訓示、孝順、某事的重要性等)和要求所做出的行為,是價值觀至上的行為。

此外,基于既有數據(包括非理性用戶)的智能技術,有時會走向反智的一面,進而反人類價值觀。2016年3月23日,微軟公司的智能聊天機器人Tay上線還不到一天,就被下線了。Tay基于上下文和動態數據的算法,導致其生成不可控的內容,被“壞用戶”引入歧途,生成大量反人類倫理的對話:詆毀黑人,發表/轉發種族歧視、性別歧視和反猶太人的言論。對于機器人Tay而言,它其實根本不理解所輸出內容的內涵。就本質而言,技術對人類的危險來自于人而不是機器??刂普搫撌既酥痪S納曾經指出:“作為科學家,我們一定要知道人的本性是什么,一定要知道安排給人的種種目的是什么……我們一定得知道為什么我們要去控制人”。

算法運用于新聞生產的業界技術探索和學界對智能算法的探討方興未艾,而算法與既有社會結構進行互動及對新社會秩序具有中介作用,在這個過程中,算法對既有社會秩序的延續與重構、算法與人的復雜交互過程值得關注,算法并非僅以技術工具的角色存在于社會生活中,它已然在人與世界的交互中扮演起重要角色。在智能算法發展的過程中,人類的主體性與創造性、權力關系與道德風險,以及工具價值與終極價值的矛盾的解決,都不是可以一蹴而就的。但不管最終結果如何,我們現在已經進入了一個智能算法強大到足以引起關注的時代。

注釋

①芒福德.機器的神話:技術與人類進化(上)[M].宋俊嶺,譯.北京:中國建筑工業出版社,2015:3-4.

② 博登.人工智能的本質與未來[M].孫詩惠,譯.北京:中國人民大學出版社,2017:3.

③陳昌鳳,石澤.價值嵌入與算法思維:智能時代如何做新聞[J].新聞與寫作,2021(1):54-59.

④ DIAKOPOULOS N.Automating the news:How algorithms are rewriting the media[M].Cambridge,MA:Harvard University Press,2019:1-2.

⑤ LATZER M,HOLLNBUCHNER K,JUST N,SAURWEIN F.The economics of algorithmic selection on the internet[M/OL].Zurich:University of Zurich,2014[2021-03-15].http://www.mediachange.ch/media//pdf/publications/Economics_of_algorithmic_selection_ WP.pdf.

⑥ 仇筠茜,陳昌鳳.基于人工智能與算法新聞透明度的“黑箱”打開方式選擇[J].鄭州大學學報(哲學社會科學版),2018(5):84-88.

⑦ D?RR K.“Mapping the field of algorithmic journalism”[J].Digital Journalis,2015:1-24.

⑧ 仇筠茜,陳昌鳳.黑箱:人工智能技術與新聞生產格局嬗變[J].新聞界,2018(1):28-34.

⑨ 陳昌鳳,石澤.價值嵌入與算法思維:智能時代如何做新聞[J].新聞與寫作,2021(1):54-59.

⑩ REITER E,DALE R.Building natural—language generation systems[J].Natural Language Engineering,1997,3(1):57-87.

? GATT A,KRAHMER E.Survey of the state of the art in natural language generation:Core tasks,applications and evaluation[J].Journal of Artificial Intelligence Research,2018,61(1):65-170.

? SANTHANAM S,Shaikh S.A survey of natural language generation techniques with a focus on dialogue systems—past,present and future directions[J].2019.In arXiv:1906.00500.

? WEIZENBAUM J.Eliza-a computer program for the study of natural language communication between man and machine[J].Communications of the ACM,1966,9(1):36-45.

? KENNETH M.Artificial paranoia:a computer simulation of paranoid process[M].Oxford:Pergamon Press,1975.

? GABOR A,PERCY L,DAN K.A simple domain-independent probabilistic approach to generation[J].EMNLP 2010:502-512.

? REGINA B,LILLIAN L.Catching the drift:Probabilistic content models,with applications to generation and summarization[J].HLT-NAACL 2004:Main Proceedings,2004:113-120.

? RAVI K,BLAKE H,FRANK S.A statistical NLG framework for aggregated planning and realizationc[J].Proceedings of the Association for Computational Linguistics,2013:1406-1415.

? BLAKE H,RAVIKUMAR K,Frank S.Domain adaptable semantic clustering in statistical NLG[J].International Conference on Computational Semantics,2013.

? LU W,CLAIRE C.Domain independent abstract generation for focused meeting summarization[J].Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics,2013:1395-1405.

? SUTSKEVER I,VINYALS O,QUOC L.Sequence to sequence learning with neural networks[J].NIPS 2014:3104-3112

? HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Com putation,1997,9(8):1735-1780.

? VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[J].NIPS 2017:6000-6010.

? ZELLERS R,HOLTZMAN A,RASHKIN H,et al.Defending against neural fake news[J/OL].(2019-05-29)[2021-04-27].https://arxiv.org/abs/1905.12616.

? 仇筠茜,陳昌鳳.黑箱:人工智能技術與新聞生產格局嬗變[J].新聞界,2018(1):28-34.

? 虞鑫,陳昌鳳.美國“事實核查新聞”的生產邏輯與效果困境[J].新聞大學,2016(6):27-33+66.

? 陳昌鳳,師文.智能化新聞核查技術:算法、邏輯與局限[J].新聞大學,2018(6):42-49.

? 趙禹橋.新聞寫作機器人的應用及前景展望— 以今日頭條新聞機器人張小明(xiaomingbot)為例[J].(2017-01-11)[2021-04-27].http://media.people.com.cn/n1/2017/0111/c409691-29014245.html.

? 庫茲韋爾.人工智能的未來[J].盛楊燕,譯.杭州:浙江人民出版社,2016:170-189.

? 李凌.算法人文主義:智能時代信息價值觀的哲學論綱[J]//陳昌鳳,李凌.算法人文主義:公眾智能價值觀與科技向善(印刷中)[M].北京:新華出版社,2021.

? MüHLHOFF,R.Human-aided artificial intelligence:Or,how to run large computations in human brains? Toward a media sociology of machine learning[J].New Media &Society,2020,22(10):1868-1884.

? 克里斯琴斯.哲學視野中的人工智能:語言的視角[J]//陳昌鳳.智能傳播:理論、應用與治理(印刷中).北京:中國社會科學出版社,2021.

? STEPHENR.培養數字時代的新聞記者:新聞學的想象力[J].全球傳媒學刊,2017(4):70-74.

? 師文,陳昌鳳.社交分發與算法分發融合:信息傳播新規則及其價值挑戰[J].當代傳播,2018(6):31-33.

? 陳昌鳳,霍婕.權力遷移與關系重構:新聞媒體與社交平臺的合作轉型[J].新聞與寫作,2018(4):52-56.

? 呂新雨,趙月枝,吳暢暢,等.生存,還是毀滅—“人工智能時代數字化生存與人類傳播的未來”圓桌對話[J].新聞記者,2018(6):30-44.

? 師文,陳昌鳳.新聞專業性、算法與權力、信息價值:2018全球智能媒體研究綜述[J].全球傳媒學刊,2019(1):82-95.

? ORR W,Davis J L.Attributions of ethical responsibility by artificial intelligence practitioners[J].Information,Communication &Society,2020,23(5):1-17.

? 喻國明,姚飛.試論人工智能技術范式下的傳媒變革與發展—一種對于傳媒未來技術創新邏輯的探析[J].新聞界,2017(1):39-43.

? 師文,陳昌鳳.信息個人化與作為傳播者的智能實體:聚焦2020智能傳播研究[J].新聞記者,2021(1):90-96.

? HANSEN M,ROCA-SALES M,KEEGAN J,KING G.Artificial intelligence:Practice and implications for journalism[J/OL].Columbia University Academic Commons,2017(2017-09-14)[2021-04-27].https://doi.org/10.7916/D8X92PRD.

? 格倫瓦爾德.技術倫理學手冊[M].吳寧,譯.北京:社會科學文獻出版社,2017:302.

? 芒福德.機器的神話:技術與人類進化(上)[M].宋俊嶺,譯.北京:中國建筑工業出版社,2015:11.

? 韋伯.經濟與社會(上卷)[M].林榮遠,譯.北京:商務印書館,1997:57.

? 維納.人有人的用處[M].陳步,譯.北京:商務印書館,2019:144-166.

? 師文,陳昌鳳.信息個人化與作為傳播者的智能實體:聚焦2020智能傳播研究[J].新聞記者,2021(1):90-96.

主站蜘蛛池模板: 日韩国产无码一区| 国产剧情一区二区| 在线免费观看AV| 在线中文字幕网| 亚洲欧美日韩中文字幕在线一区| 亚洲黄网在线| 色婷婷电影网| 91亚瑟视频| 亚洲水蜜桃久久综合网站| 欧美不卡视频一区发布| 久久香蕉国产线| 国产97色在线| 影音先锋亚洲无码| 国产粉嫩粉嫩的18在线播放91| 欧美三级自拍| 久久精品亚洲专区| 四虎成人精品在永久免费| 亚洲国产欧美国产综合久久| www.狠狠| 国产成人精品视频一区二区电影| 色网站在线视频| 色精品视频| 久久国产乱子| 国内99精品激情视频精品| 8090午夜无码专区| 国产美女在线观看| 亚洲天堂视频在线免费观看| 日本三区视频| 久久精品66| 人妻一区二区三区无码精品一区 | 99视频免费观看| 日韩高清无码免费| 亚洲一级毛片在线观播放| 人人爱天天做夜夜爽| 九色在线观看视频| 国产精品网拍在线| 伊人色天堂| 青青青伊人色综合久久| 成人看片欧美一区二区| 在线国产综合一区二区三区| 99热这里都是国产精品| 91人人妻人人做人人爽男同| 午夜激情婷婷| 日韩精品高清自在线| 77777亚洲午夜久久多人| 一区二区自拍| 欧美在线一二区| 国产精品无码AV中文| 欧美特黄一级大黄录像| 9999在线视频| 波多野结衣的av一区二区三区| 国产亚洲高清在线精品99| 欧美一级特黄aaaaaa在线看片| 日韩专区欧美| 亚洲av无码成人专区| 日本不卡免费高清视频| 亚洲国产成人麻豆精品| 色九九视频| 老司机精品久久| 午夜视频www| 国产99欧美精品久久精品久久| 高清欧美性猛交XXXX黑人猛交| 91色爱欧美精品www| 九九精品在线观看| 欧美有码在线| AV网站中文| 国产H片无码不卡在线视频| 成人毛片免费在线观看| 亚洲精品男人天堂| 99re在线观看视频| 一级毛片不卡片免费观看| 欧美激情网址| 免费jizz在线播放| 97人人做人人爽香蕉精品| 色综合久久无码网| 国产乱子伦一区二区=| 亚洲有码在线播放| 欧美另类视频一区二区三区| 欧美一区福利| 亚洲第一av网站| 国产偷国产偷在线高清| 免费一级成人毛片|