999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網(wǎng)絡(luò)信息采集技術(shù)的體育信息采譯編平臺的研制與應(yīng)用

2019-11-02 01:33:40袁俊杰
體育科技文獻通報 2019年11期
關(guān)鍵詞:體育信息系統(tǒng)

袁俊杰,王 彬

1 研究目的

體育信息工作中,跟蹤國外體育最新動態(tài)是一項非常重要的常規(guī)性任務(wù)。外文信息的翻譯整理是其中的核心環(huán)節(jié)。雖然近年來機器翻譯準確度隨著人工智能發(fā)展而不斷提高,但目前機器翻譯系統(tǒng)與人類譯文仍然差距尚遠,短期內(nèi)很難完全取代人類譯員。

隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)信息更新速度加快,僅僅依靠人工搜集國外體育動態(tài)信息已愈來愈不能滿足實際需要。同時,采編團隊之間溝通不及時也容易造成不必要的重復(fù)勞動。這些都需要從技術(shù)手段上加以解決。

網(wǎng)絡(luò)信息采集技術(shù)是目前時興的一種信息獲取方式,可以短時間里,智能的自動采集不同網(wǎng)站的信息,已在其他領(lǐng)域廣泛應(yīng)用。近兩年,筆者在網(wǎng)絡(luò)信息采集系統(tǒng)基礎(chǔ)上設(shè)計開發(fā)了體育信息采譯編系統(tǒng),將外文體育信息的采集、翻譯、校對、編輯等工作統(tǒng)一管理,取得了很好的成效。

2 研究方法

文獻資料法:查閱有關(guān)網(wǎng)絡(luò)信息采集、眾包翻譯、新聞采編等方面的文獻資料。

專家訪談法:與部分體育信息專家、翻譯人員以及程序員進行訪談交流。

軟件編程法:運用PHP、Java及MySQL進行系統(tǒng)編程。

3 研究結(jié)果

3.1 網(wǎng)絡(luò)信息采集技術(shù)簡介

我們接觸最多的網(wǎng)絡(luò)信息是以網(wǎng)頁形式存在的,而網(wǎng)頁上的信息基本上是非結(jié)構(gòu)化的。利用時,一般需要轉(zhuǎn)為結(jié)構(gòu)化的信息,以便檢索和分類。

網(wǎng)絡(luò)信息采集技術(shù)是指利用計算機軟件技術(shù),針對定制的目標數(shù)據(jù)源,實時進行信息采集、抽取、挖掘、處理,將非結(jié)構(gòu)化的信息從大量的網(wǎng)頁中抽取出來保存到結(jié)構(gòu)化的數(shù)據(jù)庫中,從而為各種信息服務(wù)系統(tǒng)提供數(shù)據(jù)輸入的整個過程。

匯集了各種網(wǎng)絡(luò)信息采集技術(shù)的程序集成系統(tǒng)稱為網(wǎng)絡(luò)信息采集系統(tǒng),主要用于門戶網(wǎng)站的新聞采集、行業(yè)資訊采集、競爭情報獲取等領(lǐng)域。

圖一 網(wǎng)絡(luò)信息采集系統(tǒng)流程圖(來源:百度百科)

但目前網(wǎng)絡(luò)信息采集系統(tǒng)也存在一些缺點,雖然可以自定義部分篩選規(guī)則,能自動屏蔽一些信息,但仍有不少無用信息會被采集入庫,不如人工搜集相關(guān)度高,后期仍需要人工介入。

3.2 翻譯模式的選擇

當(dāng)眾包翻譯首先在社交網(wǎng)站一展身手之后,逐漸在新聞、娛樂、語言學(xué)習(xí)、非營利組織及政府機構(gòu)等領(lǐng)域得到廣泛應(yīng)用。在眾包翻譯模式下,一篇原文通過網(wǎng)絡(luò)管理系統(tǒng)分割多塊交給多名翻譯員,最后匯總整合,翻譯、編輯和審校并行多向進行,譯員隊伍規(guī)模大,成員個體差異大,結(jié)構(gòu)松散,不受時間和地點限制,翻譯速度快,但譯文質(zhì)量很難控制。而傳統(tǒng)翻譯模式采用翻譯——編輯——審校自上而下的單向模式,譯員隊伍相對固定,結(jié)構(gòu)嚴謹,成員個體差異小,翻譯速度較慢,譯文質(zhì)量容易控制,但受到一定的時間和空間限制。

體育信息翻譯專業(yè)性較強,對譯文質(zhì)量要求較高,要符合中文表達習(xí)慣和行業(yè)規(guī)范,實際工作中合作的翻譯人員相對固定,因此,傳統(tǒng)翻譯模式更容易控制翻譯質(zhì)量,而其受時間和空間限制的缺點可以借鑒眾包翻譯模式中的網(wǎng)絡(luò)化管理加以解決。

3.3 系統(tǒng)架構(gòu)

整個信息采譯編平臺包括采集和譯編二個子系統(tǒng),相對獨立,通過同一后臺數(shù)據(jù)庫共享數(shù)據(jù)。平臺采用B/S結(jié)構(gòu),用戶通過瀏覽器訪問系統(tǒng)進行操作。

采集子系統(tǒng)采用國內(nèi)先進的商業(yè)化采集軟件,譯編子系統(tǒng)在采集子系統(tǒng)后臺MySQL數(shù)據(jù)庫基礎(chǔ)上定制開發(fā)。原采集庫基本不動,增加譯編庫,人工篩選時自動將選定的采集庫數(shù)據(jù)拷貝到譯編庫,后續(xù)翻譯和編校操作均在譯編庫中進行。

系統(tǒng)設(shè)管理員、組長、選稿員、翻譯員、審校員和主編等6類角色。管理員負責(zé)采集任務(wù)配置和系統(tǒng)管理;組長負責(zé)本組人員管理和角色分配;選稿員負責(zé)篩選信息,或另外上傳其他信息;翻譯員在線競爭選擇翻譯任務(wù);審校員負責(zé)初步校對本組譯文;主編負責(zé)所有譯文再次審校并改編成最終文稿。

不同角色的用戶訪問界面不同,每個用戶可分配多個角色。

3.4 系統(tǒng)功能設(shè)計

系統(tǒng)主要功能是通過采集子系統(tǒng)每天自動跟蹤采集權(quán)威體育信息網(wǎng)站的最新動態(tài),經(jīng)人工篩選后,翻譯員在線競爭翻譯,再經(jīng)初步校對和再次審校,最后改編成最終文稿,實現(xiàn)信息采集、篩選、翻譯、審校、編輯一體化管理。

3.4.1 信息采集和篩選

采集任務(wù)配置是整個系統(tǒng)的基礎(chǔ),操作難度較大,要求管理員熟悉網(wǎng)頁結(jié)構(gòu)。采集子系統(tǒng)提供網(wǎng)頁探測器和任務(wù)配置器等輔助工具,幫助管理員配置采集任務(wù)。

在任務(wù)配置開始前,需要通過網(wǎng)頁探測器分析擬采集的網(wǎng)頁,確定要抽取網(wǎng)頁的哪些信息、信息在頁面的哪個位置、采集時使用的遍歷方式以及是否有下一頁等。

配置任務(wù)時,利用前面的分析結(jié)果把采集所需要的各種參數(shù)加入到任務(wù)文件中,例如標題、作者、時間、來源、過濾規(guī)則等,以便任務(wù)執(zhí)行器按照我們的意圖進行采集。大部分外文網(wǎng)站的網(wǎng)頁結(jié)構(gòu)各不相同,需要單獨配置,少部分的網(wǎng)站可直接使用系統(tǒng)默認的配置文件。

最后設(shè)定采集任務(wù)開始執(zhí)行時間和執(zhí)行頻率,如每天6點執(zhí)行一次,每隔8小時執(zhí)行一次。

采集系統(tǒng)按設(shè)定參數(shù)自動訪問各網(wǎng)站,下載最新動態(tài)信息并存儲在采集庫中。

圖二 采集任務(wù)列表界面

選稿員需要手動挑選出有針對性的信息,供各組翻譯員競爭翻譯,各組選稿員也可直接指定本組的某個翻譯員進行翻譯。選稿員可以對原文進行改編,還可以刪除或另外上傳新的信息。

圖三 采集的信息列表及人工篩選界面

3.4.2 信息翻譯

各組翻譯員統(tǒng)一從待譯任務(wù)池中競爭任務(wù)。系統(tǒng)限制每個翻譯員同時承接的任務(wù)數(shù),若已達到限制數(shù),則不能承接新任務(wù)。承接后,任務(wù)自動鎖定,別人無法翻譯。翻譯過程中可以暫時保存,也可取消任務(wù),重新返回任務(wù)池。

平臺提供了世界地名、外國人名、國際體育組織和體育項目等中英文術(shù)語對照表,供在線查詢參考。

圖四 翻譯任務(wù)列表界面

圖五 信息對照翻譯/校對界面

3.4.3 譯文審校和編輯

翻譯完成后,初譯稿自動進入初校任務(wù)池,由本組審校員進行初步審校。各組審校員只能審校本組成員翻譯的譯文,其他小組的譯文則無權(quán)審校。審校員還可以對譯文進行1-5星的評分,便于對翻譯員的能力進行評估。

所有一校稿需要經(jīng)過主編最終審校,并改編成符合要求的最終文稿。一些重要信息還會由主編進一步整合或補充資料。

3.5 應(yīng)用效果

平臺完成后,合作的兩家院校的教師翻譯團隊以及十余位外語兼職人員進行了兩年多的使用,效果良好。平臺每天采集130余個外文體育信息網(wǎng)站的200余條信息,經(jīng)篩選和翻譯后,每天可提供10余條譯文,與以前每周提供一次相比,信息時效大大提高。

4 結(jié)論

整個平臺采用B/S結(jié)構(gòu)設(shè)計,用戶通過瀏覽器訪問,操作簡單,簡化了培訓(xùn)過程。采集管理和譯編管理相對獨立,安全性更高。

平臺利用網(wǎng)絡(luò)信息采集技術(shù)每天定時自動采集上百家體育信息網(wǎng)站的最新信息,極大地節(jié)約了人工,提高了采集效率。

平臺在傳統(tǒng)翻譯模式中引入了競爭翻譯和網(wǎng)絡(luò)化管理,既發(fā)揮了傳統(tǒng)翻譯模式質(zhì)量易控的長處,又發(fā)揮了網(wǎng)絡(luò)管理的便捷優(yōu)勢,對體育信息工作實現(xiàn)創(chuàng)新升級具有重要作用。

猜你喜歡
體育信息系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
提倡體育100分 也需未雨綢繆
甘肅教育(2020年2期)2020-11-25 00:50:04
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
2016體育年
我們的“體育夢”
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
談體育實踐課中知識的擴展
體育師友(2010年6期)2010-03-20 15:29:07
主站蜘蛛池模板: 国产日韩欧美视频| 午夜视频日本| 久久久久亚洲av成人网人人软件| 久久久久亚洲AV成人人电影软件| 国产成人无码Av在线播放无广告| 国产精品无码AV中文| 日韩专区第一页| 日韩欧美中文字幕在线精品| 综合色亚洲| 亚洲人成网站日本片| 久久一日本道色综合久久| 亚洲第一区在线| 免费观看国产小粉嫩喷水| 欧美国产日韩在线| 美女毛片在线| 91精品啪在线观看国产| 91色在线视频| 激情午夜婷婷| 国产手机在线ΑⅤ片无码观看| 美女国内精品自产拍在线播放| 国产综合网站| 国产亚洲精品91| 亚洲视频免| 一级成人a毛片免费播放| 欧美午夜视频在线| AV片亚洲国产男人的天堂| 亚洲精品波多野结衣| 最新国产在线| 久久这里只有精品8| 天堂网亚洲系列亚洲系列| 亚洲国产理论片在线播放| 亚洲精品无码AV电影在线播放| 午夜在线不卡| 久久无码av一区二区三区| 国产一区二区三区在线观看视频| 91无码人妻精品一区| 一本大道视频精品人妻| 中文字幕一区二区人妻电影| 亚洲精品片911| 真人高潮娇喘嗯啊在线观看| 欧美高清国产| 国产产在线精品亚洲aavv| 国产视频大全| 国产香蕉在线视频| 中文字幕无码电影| 热热久久狠狠偷偷色男同| 亚洲国产系列| 性视频久久| 亚洲视频二| 成人一级免费视频| 麻豆国产精品一二三在线观看| 麻豆国产原创视频在线播放| 蜜臀AVWWW国产天堂| 在线观看国产小视频| 亚洲成人黄色在线观看| 国产白浆一区二区三区视频在线| 亚洲高清中文字幕在线看不卡| 亚洲三级a| 玩两个丰满老熟女久久网| 欧美区日韩区| 日韩一二三区视频精品| 丝袜久久剧情精品国产| 国产精品自在在线午夜| 黄色污网站在线观看| 日韩视频福利| 爽爽影院十八禁在线观看| 99久久精品美女高潮喷水| 伊人久久综在合线亚洲91| 72种姿势欧美久久久久大黄蕉| 97视频在线精品国自产拍| 色综合五月| 亚洲欧美不卡视频| 婷婷色一二三区波多野衣| 国产色婷婷| 久久久久中文字幕精品视频| 免费一级毛片完整版在线看| 91青青草视频在线观看的| 欧美不卡视频一区发布| 成人国产精品2021| 天堂av高清一区二区三区| 性色一区| 亚洲国产欧美中日韩成人综合视频|