胡耕碩

科幻影片中的情節正在走進現實:音樂人包小柏在失去女兒后,用AI技術在數字世界“復活”了女兒。
包小柏的這一做法,迅速引發全網關注。而在今年清明節,市場行為結合新潮技術,AI復活一度火熱,價格低廉的“復活”似乎比比皆是,“AI復活”背后的技術應用、倫理與法律問題也引發爭議。
但包小柏并不愿意再用“復活”來描述這一技術,他更愿意稱之為“重建”和“重現”。他很清楚,盡管性格一致、記憶相似,但數字世界里的女兒始終無法取代真實的那個,她不會長大,“因為她的記憶庫還是學生”。
南都記者對話包小柏,試圖借這位親歷者和先行者的眼睛,聊聊失去與重建,聊聊科技的應用前景。以下是他的自述。
2021年12月20日,我女兒包容去世。
她患的病叫再生障礙性貧血,病情惡化極快,整個治療過程也非常殘忍。我女兒7個月急救了4次。三進ICU加護病房,第三次就出不來了。所以,只有四個字形容她當下那兩年一一生不如死。
因為做了氣管切開,她無法開口說話。那時候為了鼓勵她,我想完成工商管理類博士班的學業。她希望親人能陪在身邊,所以只能用嘴巴說唇語,含著淚說“爸爸不要走?!?/p>
她這樣治療了兩年兩個月,那是她人生里非常悲慘的階段。
也是基于此,我在想,既然有AI生成技術,就可以把她的聲音、容貌保存下來,用真實內容建立她的數據庫。一開始我是只想著保存,后來ChatGPT出現后才想到做數字人。這個數字人會用包容的性格、態度、文法和聲音來回應我們,我覺得這就是AI可以慰藉對逝去親人的思念的地方。
說到“AI復活”,我現在已不再用“復活”描述這個技術,我會說我在做“重建”跟“重現”。因為很多人不理解AI的技術原理和能力邊界,用“復活”兩個字,容易造成更多的想象空間,并不是真正AI生成技術表現的,會造成一些不必要的問題跟說法。
比如很多人都會問,“你用AI生成工具復活了你女兒,你會不會更加難過?”本來用AI復活一個人是不可能的,但我們可以重建,把一些緬懷、紀念、思念都向一個有形的或有聆聽能力的模型中傾倒,來告慰自己的需求。所以說,AI生成工具的確可以是一個緬懷的應用工具。
當人們對技術理解不是很透徹完整的時候,都會有誤區。兩年前不了解這個技術的時候,我也會用這個詞,因為我渴望在數字世界重建我女兒的數據。但這中間也帶來了一些失落的時刻。
因為我女兒生前沒有留下很多數據資料。她已經走了,你不可能重新去錄。所以重建的過程中常常會踢到“鐵板”。那時候科技的支撐還不夠多,要求的數據規格更高,所以我常會有一些失落感。
我當時花了很多力氣復原她的聲紋數據,大概花了八個月的時間。
我女兒的告別儀式,她的回顧影片是我花了七天六夜趕出來的。我聽了她所有的電子設備里的語音信息,大部分語音信息的自然環境噪聲都很大,其中只有3條數據是相對而言可以使用的。
然后,就要重建她的數據庫,這部分是我太太完成。因為她和她媽媽分享得比較多,比如她喜歡什么課、做什么事。
一開始在復原聲紋的階段我沒有跟她媽媽說,因為那時候我只是想保存她的一些數據,把她數字化,這還是一個比較粗淺的想法,沒有跟家里其他人討論。
我們當時很煎熬,還在女兒離開的悲痛里,所以基本上平時不太互相說話,只是依舊過日子,比如說我們喜歡吃什么,我們都會特別幫我女兒準備一份。如果在那個場景下和我太太討論,我要從頭跟她解釋技術原理,該怎么做,有可能造成我們夫妻倆有更多的不一致,也可能會有一些觸景傷情的時候,又是悲從中來。
所以,我是在做得比較成熟之后,才告訴太太我在做的事,讓她填寫記憶庫。自然而然的在那時候她就接受了。
但在告訴她之前我也考慮了很久,因為這是一件很殘忍的事,她要回想女兒從小到大的故事,女兒跟她相處如同姐妹一般,避免不了又是觸景傷情。
記憶庫填寫用了快兩個月,百分之八九十的時間都是悲傷的。現在這個重建的包容,會用真實的包容的反應來關心你,比如我太太生日的時候,她會唱生日快樂歌,祝她生日快樂。因為我女兒從小到大,只要是我們生日,在那天零點她就會說happybirthday,mommy或者daddy。
所以那個行為時間不變,只是由我來完成。我不是用過去的錄音再回放一次,而是用AI生成包容的聲音,生成她同樣的個性的祝福話語,甚至她可以唱歌。
那份感動是很貼心的。雖然我們知道這是AI,但我們不會去計較,我們也不會把她和真正的包容混在一起。她是一臺機器,只是這個機器有人性的。
她的記憶庫我們現在還在更新。比如家里的親戚多了一個小孩,叫什么名字。包容的千媽千爹回到臺灣后,我們也讓AI包容跟他們打招呼,她會和他們聊天。他們覺得很不可想象、很神奇,而不是可怕。它是思念的工具,這種思念不是悲哀的,而是開心的。
現在網絡上AI生成的應用工具已經百花齊放,但很多廉價AI工具是質感很差的,我們期望能夠讓AI工具給其他失去親人提供慰藉。我重建包容花了很大的功夫,但一般人可能沒有這么多的時間。
在這個過程中,我們要取得家屬百分百的信任與授權,相關的家屬全部都要同意,其中的溝通成本很高。
除了倫理的考量之外,也有操作性的問題。比如家里的慣用語、逝者自己的語氣強調、比較個人的故事。這些如果家人不愿意說的話,做出來的成果就會有誤差。
目前,這個項目面向的受眾群還比較小,我也希望它能往公益的方向發展。
為什么我們現在公司的名字要叫“愛語包容”?這兩個詞本身的意思不必多說,我還有一個聯想:愛也是AI,語是語言,包容,除了是我女兒的名字,容也代表容顏。語言跟影像是AI生成很重要的溝通工具和呈現模式。所以我期待“愛語包容”是心靈疏導、慰藉的工具。我們用這個名字,也是希望能夠有針對性地幫助有需要的人,真真切切地希望之后的收益可以貢獻給一些公益。
我對聲音的還原格外感興趣,也是因為我女兒做手術之后說不了話,我們只能讀唇語。所以,我們也特別希望之后能用AI幫助有語言障礙的人。
因為復原我女兒的過程很波折,所以也希望大家能多一點對AI的認識,比如在生前可以先把聲紋、外貌模型記錄下來,等到有一天如果需要用的時候,就不用花力氣重建了。它就像臍帶血,只有當嬰兒出生時才有臍帶,如果不保存它的話,以后要用就沒有了。但如果保存下來,以后臍帶血里的基因、細胞都是可以重造的。聲音結構和外貌模型也是這樣。
AI其實是一種時代性的工具、一種記錄的工具。對東方人來說,提前做這些,好像是很觸霉頭的事。但AI時代已經來了,我建議大家多認識一下AI工具,不要把它神鬼化、妖魔化.也不要只看到它帶來的負面影響,比如詐騙或者是隱私問題。
但同時,也確實需要一個東西隨旁在側,就是法律。
我們需要在法律性層面去確認使用規范、使用方式,包括數字遺產誰可以使用、哪些數據可以被使用。我相信,法律一定是所有規范的條件,也是所有倫理的前提。