999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

東南亞構建本地人工智能的意義

2025-08-15 00:00:00埃利娜·努爾
南風窗 2025年17期
關鍵詞:開發者人工智能語言

在OpenAI公司于2022年11月公開發布ChatGPT后,其承認這款大型語言模型存在向西方觀點和英語傾斜的狀況。對于東南亞的開發者而言,需要一些能用多種語言為本地區服務的人工智能工具。這可不是一項小任務,因為該區域有超過1200種語言。例如,柬埔寨有近30種語言,泰國有大約70種語言,越南有100多種語言。

不出所料,那些試圖為一個擁有如此多代表性不足的語言的地區建立真正本地化人工智能模型的人,面臨著諸多障礙—從缺乏高質量、大批量的標注數據,到無法獲得從頭開始建立和訓練模型所需的算力。在某些情況下,這些挑戰甚至更為基礎,源于母語使用者數量不足、標準化拼寫體系的缺失或頻繁的電力中斷。

在這些制約因素下,對外國公司創建的既定模型進行微調,是通常做法。2020—2023年諸如PhoBERT(越南語)、IndoBERT(印尼語)和Typhoon(泰語)等東南亞語言模型,都是從谷歌的BERT、Meta的RoBERTa(后來的LLaMA)和法國的Mistral等更大型模型中衍生出來的。

即使是SeaLLM的早期版本—由阿里巴巴達摩研究院發布、針對地區語言進行優化的一套模型,也是基于Meta、Mistral和谷歌的架構構建的。但在2024年,阿里云的Qwen模型打破了這一西方主導態勢,為東南亞提供了一套更廣泛的選項。卡內基國際和平研究院的一項研究就發現,在當年推出的21個地區性模型中,有5個是基于Qwen構建的。

努力實現人工智能本地化,并確保東南亞社區擁有更大自主權,可能會加深開發者對更龐大參與者的依賴,至少在初始階段是如此。不過,東南亞的開發者們也已著手解決這一問題。包括SEA-LION(11種官方地區語言的集合)、PhoGPT(越南語)和MaLLaM(馬來語)在內的多個模型,都是在每個特定語言的大型通用數據集基礎上,從頭開始預訓練的。這一機器學習過程的關鍵步驟,將使這些模型能夠對各類特定任務實施進一步的微調。

盡管SEA-LION繼續依賴谷歌的架構進行預訓練,但它對區域語言數據集的使用,促進了本土模型的開發—比如能用印尼語、巽他語、爪哇語、巴厘語和峇達克語進行交流的Sahabat-AI。后者自詡為“印尼人工智能主權承諾的證明”。

但是,代表本土視角也需要強大的本地知識基礎。如果對語言的政治性、傳統意義建構和歷史動態缺乏了解,我們就無法忠實地呈現東南亞的觀點和價值觀。

比如,許多土著社區都對時間和空間—兩個在現代語境中被廣泛理解為線性的、可分割的、可測量的,以最大限度地提高生產力為目的的概念—有著不同的觀感。巴厘島的歷史文獻打破了傳統的編年模式,在西方或許會被視為神話或傳說,但它們繼續影響著這些社區對世界的認知。

該地區的歷史學家們警告說,用西方的視角來看待當地文本,會增加誤讀土著民眾觀點的風險。從18世紀到19世紀,印尼的殖民管理者經常將他們自己對爪哇編年史的理解,寫入翻譯后的再創作作品中。因此,英國人和歐洲人對東南亞人的許多偏見性觀察,被視為有效的歷史記載,官方文件中的種族分類和刻板印象也被內化。如果人工智能在這些數據的基礎上進行訓練,這些偏見最終可能會進一步變得根深蒂固。

這需要有意識地過濾歷史遺留的偏見,質疑關于我們身份定義的一些假設,并重新發現我們語言中的本土知識庫。如果我們從一開始就幾乎不了解我們的文化,那也就無法通過技術去忠實地凸顯它。

猜你喜歡
開發者人工智能語言
鴻蒙破局·盤古聚力:HDC 2025解碼華為智能生態閉環
中關村(2025年7期)2025-08-18 00:00:00
利益平衡視域下人工智能數據訓練的著作權侵權認定研究
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
讓語言描寫搖曳多姿
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
累積動態分析下的同聲傳譯語言壓縮
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
我有我語言
主站蜘蛛池模板: 在线色综合| 黄色在线网| 国产精品久久国产精麻豆99网站| 午夜福利无码一区二区| 日本高清免费不卡视频| 67194在线午夜亚洲| 欧美日韩中文国产va另类| 国产流白浆视频| 五月天福利视频| 欧美在线视频a| 亚洲自偷自拍另类小说| 日韩 欧美 国产 精品 综合| 精品国产中文一级毛片在线看| 2022国产91精品久久久久久| 男女性色大片免费网站| 国产精品亚洲片在线va| 亚洲欧美日本国产专区一区| 亚洲人网站| 亚洲国产清纯| 91蜜芽尤物福利在线观看| 69视频国产| 亚洲成综合人影院在院播放| 亚洲精品图区| 2021国产精品自产拍在线| 欧美成人二区| 中文字幕2区| 亚洲二区视频| 欧美综合中文字幕久久| 无码视频国产精品一区二区| 在线观看免费国产| 亚洲日本中文字幕乱码中文| 影音先锋丝袜制服| 亚洲精品第五页| 国产日本欧美亚洲精品视| 97成人在线视频| 亚洲精品片911| 久久性妇女精品免费| 国产午夜福利亚洲第一| 一本无码在线观看| 国产成人毛片| 天堂va亚洲va欧美va国产| 国产在线麻豆波多野结衣| 农村乱人伦一区二区| 久久免费视频6| 国产成人8x视频一区二区| 国产亚洲欧美在线人成aaaa| 丁香六月激情婷婷| 最新日韩AV网址在线观看| 国产高清在线观看91精品| 亚洲aaa视频| 欧美午夜视频在线| 成人国内精品久久久久影院| 91精品啪在线观看国产60岁| 热99re99首页精品亚洲五月天| 色男人的天堂久久综合| 一区二区午夜| 久久久久免费精品国产| 在线播放精品一区二区啪视频| 五月天香蕉视频国产亚| 97国产精品视频人人做人人爱| 亚洲无码熟妇人妻AV在线| 97精品国产高清久久久久蜜芽| 国产va在线观看| 国产精品理论片| 国产va在线观看免费| 高清无码不卡视频| 日韩无码视频专区| 免费国产不卡午夜福在线观看| 日本一本在线视频| 日韩在线中文| 欧美97欧美综合色伦图| 日韩欧美国产三级| 色天堂无毒不卡| 青青久视频| 欧美亚洲网| 国产人妖视频一区在线观看| 久久精品最新免费国产成人| 国产网站免费观看| 麻豆精品久久久久久久99蜜桃| 99激情网| 99人妻碰碰碰久久久久禁片| 蝌蚪国产精品视频第一页|