999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能延伸科學交流觸角

2019-09-10 07:22:44張蓋倫陸越
科海故事博覽·下旬刊 2019年3期
關鍵詞:人工智能文本

張蓋倫 陸越

近日,一款看起來挺有文化的寫稿機器人上線了。它叫小柯,由中國科學報社和北京大學科研團隊共同研發。小柯寫的不是普通的稿子,而是中文科學新聞。據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然后由專業人士和報社的編輯進行把關和完善信息,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。目前小柯的作品已經上線。人工智能的觸角,也在伸向各個領域。

小柯:一個盡職的摘要翻譯轉寫者

2019年7月5日,小柯機器人發出第一篇稿子,截至8月22日統計時,小柯機器人共發稿415篇。初期更新時間距論文發表時間間隔一個月左右,現在可以做到當天或隔天更新,每天更新幾篇到二十幾篇不等。所選論文來自生命科學等領域,涉及《自然》《細胞》《新英格蘭醫學雜志》等期刊。有記者對照分析了小柯的作品《單細胞測序揭示冠狀動脈疾病保護機制》及其英文原文。文章中,小柯先對論文主題、研究單位以及發表的期刊進行了簡單介紹,后接英文原文摘要的翻譯,大致反映原文內容;翻譯時會對原文進行適當的語句簡化,同時在對專業詞語的翻譯上也使用了如“血管平滑肌細胞”“保護性纖維帽”等專業表述。不過,這也不全是小柯的功勞,因為稿件發出前,還有人工審校這一步驟。北京大學計算機科學技術研究所研究員萬小軍團隊負責小柯的系統總體設計與聯合技術攻關。他告訴記者,目前機器翻譯系統的性能很大程度上依賴于其所使用的訓練數據,即平行語料。目前的平行語料多為新聞語料,因此訓練得到的機器翻譯模型對于日常新聞的翻譯效果較好。但學術文獻(比如生物學術論文)與日常新聞在用詞造句等方面都有較大差別,機器翻譯系統對于學術文獻翻譯的效果并不理想。這一次,他們通過融合領域知識進行語句智能篩選,選擇適合大眾理解的語句,并基于語句簡化提升語句翻譯質量。“英文學術論文摘要適合專業科研人員閱讀,但摘要中的語句并不都適合寫到科學新聞中面向大眾傳播,因此需要結合編輯提供的先驗知識,采用計算機算法對語句進行篩選,保留適合進行大眾新聞傳播的語句。”萬小軍說。

機器人不只能寫稿

研發小柯用了半年時間,萬小軍表示,和一般寫稿機器人相比,一個好的跨語言科技新聞寫稿機器人需要進行兩次重要的信息轉換過程:一次是不同語言的轉換,將英文文本轉換為中文文本;另一次是語言風格的轉換,將學術型文字表達轉換為大眾能夠接受的通俗文字表達。“這兩次轉換都具有較大的挑戰性,目前并沒有完全解決。后續還需要進一步積累數據,調整算法模型,才能取得更好的效果。”萬小軍說。接下來,團隊還將繼續優化小柯,讓它寫出的科學新聞內容更豐富,表達更生動。當然,翻譯撰寫科技新聞稿件,只是自然語言處理等人工智能技術在學術交流中所能大顯身手的領域之一。“基本上,只要人類交流和工作過程中涉及語言和文字的地方,自然語言處理技術都有可能發揮作用。”萬小軍說,在科研論文寫作過程中,可以借助自然語言處理技術幫助推薦參考文獻,并自動生成related work等章節的文字;業界也有基于自然語言處理技術自動編撰圖書的嘗試。“我個人也接觸了很多很有意思也很有挑戰的應用需求,但可惜的是不少需求都無法基于目前的自然語言處理技術進行實現。自然語言處理技術還需要進一步地發展和突破,我相信在未來將有更多的用武之地。”

中國知網常務副總經理張宏偉長期關注自然語言處理,大數據和人工智能方面的應用研究。他告訴記者,在數字出版和知識服務的全鏈條中,你都能看到人工智能和機器學習技術的身影。人工智能可以對數字出版的選題策劃、協同撰稿、內容編審進行賦能。大數據標注機器人則能對海量文獻信息資源進行OCR文字識別,智能版面分析,知識元抽取,自動分類,自動標引主題,自動生成摘要,自動翻譯,自動標注引用和參考文獻。人們熟悉的論文抄襲檢測,同樣需要智能技術。它不是簡單的語句重復檢測,而是要對文本內容(包括圖片、公式、表格等)進行語義索引,“看你在思想上有沒有抄襲別人”。如果存在不同語言之間的互抄,還需要動用“機器翻譯”。張宏偉表示,初級的語義抄襲可以由機器揪出來,不過,如果足夠有“心機”,就可以完全用自己的語言“洗”了別人的思想,對人工智能的技術要求一下就提高了許多。目前已有利用神經網絡模型對文本內容構建高維度語義索引等新技術出現,不管是中文還是英文,一律映射到一個統一的語義空間,實現真正基于內容理解的語義級全文比對檢索。

知識庫是智慧社會的基礎設施

至于在學術研究中必不可少的資料索引,看似簡單,也仍然具有技術含量。張宏偉說,數字出版和數字圖書館的資源類型非常豐富,有大量文本、圖像和音視頻數據,且數據是非結構化的,若想對其進行深度的挖掘利用,難度不小。就拿常見的信息檢索來說,首先得做到結果要全,相關度要高;再進階一步,能不能用自然語言交互的方式檢索;升級一下難度,用智能問答的方式查找信息,能否直接給出答案?“要讓檢索功能變得更貼心,計算機要‘學會’閱讀資料,總結、推理然后回答。它需要把海量的數據資源變成自己可以理解的知識庫。”張宏偉說。深度學習等統計方法嚴重依賴于大樣本數據,然而,現實世界中,很多實際問題僅僅依靠統計方法是無法解決的,這就需要建立專門的計算機能理解的知識庫,實現真正的人工智能。但構建知識庫,本身是一項極其艱難且耗時漫長的工作。畢竟,機器和人對知識的理解方式大相徑庭。張宏偉說,像知網這樣的機構正在致力于深度整合全球知識信息資源,建設世界知識大數據。也在讓文本文獻碎片化、網絡化,依據知識使用的場景,采用半自動知識抽取算法來構建面向垂直領域的知識圖譜。2019年知網陸續推出了一些基于知識圖譜的行業智慧應用產品,如醫療領域的臨床智能診斷,法律領域的智能量刑判案等。“不過,我們在這些領域剛剛起步。我個人覺得,還是要少一點浮躁,踏踏實實做一些基礎性的工作。沒有知識的支撐,就談不上‘智慧’。”在張宏偉看來,知識庫和人工智能,本身就是互相促進、相互賦能的關系。構建知識庫需要人工智能,而人工智能的發展,也離不開知識庫。怎么將人類的知識庫轉換成計算機能理解的知識庫是人工智能的核心問題,面臨許多困難,需要學術界和產業界共同努力。

猜你喜歡
人工智能文本
我校新增“人工智能”本科專業
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 国产欧美日韩综合在线第一| 四虎精品黑人视频| 亚洲香蕉伊综合在人在线| 亚洲成在人线av品善网好看| 中字无码精油按摩中出视频| 亚洲国产清纯| 亚洲男人天堂网址| 亚洲欧美在线综合一区二区三区| 日韩av电影一区二区三区四区| 狠狠做深爱婷婷久久一区| 999福利激情视频| 国产精品久久久久久搜索| 狠狠做深爱婷婷久久一区| 99热这里都是国产精品| 国产精品免费露脸视频| 免费欧美一级| 国内精品久久人妻无码大片高| 乱系列中文字幕在线视频| 久草视频精品| 色婷婷狠狠干| 免费人成又黄又爽的视频网站| 国内精品自在欧美一区| 国产精品999在线| 天天操精品| 亚洲精品日产精品乱码不卡| 成人小视频网| 久久久成年黄色视频| 91精品啪在线观看国产| 91福利国产成人精品导航| 奇米影视狠狠精品7777| 中文字幕在线不卡视频| 高潮毛片无遮挡高清视频播放| 久久精品亚洲中文字幕乱码| 成人小视频在线观看免费| 亚洲资源站av无码网址| 成人亚洲国产| 青青青国产视频手机| 国产91高跟丝袜| AV不卡在线永久免费观看| 久久香蕉国产线| 毛片手机在线看| 欧美天堂在线| 在线免费亚洲无码视频| 18禁高潮出水呻吟娇喘蜜芽| 欧美在线天堂| 波多野结衣无码视频在线观看| 一级片免费网站| 日本高清免费一本在线观看 | 伊人久久福利中文字幕| 日韩国产综合精选| 亚洲一级无毛片无码在线免费视频| 69国产精品视频免费| 亚洲αv毛片| 一级毛片在线播放免费| 人妻无码中文字幕一区二区三区| 99精品在线视频观看| 国产精品白浆在线播放| 久久亚洲美女精品国产精品| 亚洲熟女偷拍| 亚洲第一天堂无码专区| 国产一级毛片高清完整视频版| 国产免费好大好硬视频| 亚洲日韩欧美在线观看| 91丨九色丨首页在线播放| 国产精品蜜芽在线观看| 国产成人综合网在线观看| 国产精品林美惠子在线播放| 九九视频免费在线观看| 2021国产v亚洲v天堂无码| 在线看国产精品| 中文成人在线| 亚洲成a∧人片在线观看无码| 看av免费毛片手机播放| 国产精鲁鲁网在线视频| 综合网天天| 亚洲成aⅴ人片在线影院八| 国产高清国内精品福利| 国产精品成人久久| 香蕉久久永久视频| 国产午夜福利在线小视频| 日韩不卡免费视频| 91伊人国产|