999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本挖掘口角升溫

2013-04-10 19:51:41邢鴻飛編譯
世界科學 2013年5期
關鍵詞:文本研究

邢鴻飛/編譯

●科學家和出版商就使用機器查閱科研論文的許可產生分歧。

要是那些把守信息的人們能給科學家們自由,那么未來就會是基于計算機的研究時代。研究者們過去一年一直在苦苦抱怨,出版商不允許他們使用電腦程序下載或者瀏覽科研文章的文本,這一方法即是文本挖掘,可在研究中呈現范圍較大的整體模式。

出版商們擔心文章內容可能會被任意重組,因此一般會屏蔽他們發現到的瀏覽全文的程序,對那些付費使用者也不例外。他們只就具體個例,給予那些對協議條款讓步的人使用許可。目前,歐盟委員會和出版社聯盟正準備制定更明細的條款。但是上個月,有人向歐盟一個正在討論文本和信息挖掘相關內容的小組投訴,這表明持不同意見者仍然為數不少。

去年九月,在布魯塞爾知識產權峰會上,歐盟委員會副主席尼利·克羅斯(Neelie Kroes)曾表示:“要是我們不再像現在這樣進行法律限制,信息和文本挖掘技術是通向下一次醫學重大突破的關鍵。”

文本挖掘項目

將基因與研究論文相關聯。“文本-基因組”項目從大約三百萬份研究論文中找到DNA序列,創建了一個在線的基因組圖,圖中每個區域都與相關論文鏈接(go.nature.com/iupijx)。

繪制大腦譜圖。“神經合成(NeuroSynth)”項目從大約4 400篇科研論文中提取出大腦掃描數據,使用者可以將人腦部的不同位置與相關研究術語和研究主題相鏈接(neurosynth.org)。

化學數據。SureChem成果頗豐,擁有從約2 000萬項專利中獲取的有關分子研究的可用數據(surechem.com)。

新藥研發。研究者們從MEDLINE(聯機醫學文獻分析和檢索系統)數據庫中的2 000多萬篇文章中免費搜索摘要,并發現E-cadherin(一種細胞黏附分子)和帕金森癥之間某種間接關聯(go.nature.com/fsv4az)。

出版商們表示,到目前為止,要求獲許挖掘文本的研究者寥寥無幾。盡管如此,據位于阿姆斯特丹的Elsevier出版公司說,2012年,機器人在整個網絡平臺上瀏覽其ScienceDirect網站的流量占總流量的百分之四,幾乎是2011年的兩倍。無論這些項目有任何意圖,這一數據表明,除了人類,現在越來越多的機器開始瀏覽相關的文章。

康涅狄格州瑞吉菲爾德的Boehringer Ingelheim醫藥公司的計算生物學家勞爾·羅德里格斯-埃斯特班(Raul Rodriguez-Esteban)說,他在 2012年處理了160次文本挖掘的查詢。其中有一次,他搜索了超過23 000篇文章后,選出上百個能夠緩解一個多發性硬化癥的小鼠模型的蛋白質。接著,他將其他與之相關的蛋白質草擬了一個網絡,并由此發現新的潛在藥物靶標。學術科研工作者垂涎這一技能,但也表示,對相關使用協議條款進行協商需要花上數月甚至數年。加利福尼亞州圣克魯斯大學的馬克斯·霍伊斯勒(Max Haeussler)花了三年的時間才爭取到下載三百萬篇文章的資格,從這些文章中他找到了所需的DNA數據來注解一個在線人類基因組圖(見《自然》483,134-135,2012)。

爭議何其多

今年晚些時候,英國將允許非商業化使用文本挖掘,即允許科學家們挖掘他們付費查詢的任何內容。文本挖掘者們希望歐盟委員會也能做到這一點。英國曼徹斯特大學國家文本挖掘中心的副主任約翰·麥克諾特(John McNaught)說道:“流傳在使用者們中的口號是‘閱讀權是我自己的權利’。”

然而,歐盟今年成立的討論文本和數據挖掘的工作小組已經飽受爭議。2月4日的會議之后,研究者們和圖書管理者們抱怨該小組只是討論了如何處理文本挖掘的許可,并沒有討論如何給予文本挖掘免除版權的問題。“這將會對文本挖掘技術的使用制造障礙,并且使得諸多方面進行計算機輔助研究舉步維艱。”這是他們2月26日寫給克羅斯以及其他三位歐盟委員的信中的一段,委員們并未對此做出任何回應。

據英國巴斯大學的羅絲·芒瑟 (Ross Mounce)說,3月8日的第二次會晤幾乎沒有能夠對免責條款進行正式討論,羅絲本人正在使用文本挖掘從文獻綜述中選取進化關系的樹狀結構。歐盟工作小組希望能夠在年底達成相關結論。

同樣的問題在美國,情況略微好些。一些律師認為,文本挖掘獲得允許的可能性在于“公平使用”權利,也就是說人們可復制文本的部分片段。但沒有人能夠肯定,而且很多研究者們擔心,這樣做會觸及到法律的灰色區域。

一些出版社表示,不受約束的文本挖掘會給他們的服務器增加負擔,因此還需要有協議來明確說明下載文章的時間和方式。無數學術出版商的非營利合作平臺CrossRef,正在研發一種系統,能夠讓研究者們通過點擊出版商網站上的按鈕接受標準格式的文本挖掘條款。CrossRef平臺的杰夫·比爾德(Geoff Bilder)希望該系統在年底能夠正式推出。

曼徹斯特丹佛的版權稅計算中心(CCC)與出版社就版權許可進行合作,他們的努力更加有野心。據該中心的羅伊·考夫曼(Roy Kaufman)介紹,他們想做中間人,收集各個出版社的相關條款和內容,并將它們收錄進為研究者們開放的網站。目前該中心正就此與包括自然出版集團在內的六家出版社,以及一些迫切需要挖掘文獻的醫藥化學公司合作。

北卡羅來納州達勒姆的美國國家進化綜合中心的希瑟·比沃華爾(Heather Piwowar)對研究者如何使用信息進行研究,她說,允許像谷歌這樣的大公司瀏覽網絡內容并編入索引,而限制科學家們這樣做不公平。她在博客中寫道:“谷歌知道它在做什么,而我們這些人卻無法被人信任,這說得過去嗎?我希望不要這樣。”

猜你喜歡
文本研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
在808DA上文本顯示的改善
EMA伺服控制系統研究
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
新版C-NCAP側面碰撞假人損傷研究
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 手机精品福利在线观看| 伊人久久久大香线蕉综合直播| 亚洲午夜18| 中文字幕在线一区二区在线| 99精品欧美一区| 国产成人精品一区二区不卡| 亚洲午夜福利在线| 免费一级毛片在线观看| 尤物亚洲最大AV无码网站| 亚洲福利片无码最新在线播放 | 日本日韩欧美| 免费人成又黄又爽的视频网站| 亚洲国产理论片在线播放| 国产麻豆另类AV| 国产成人在线小视频| 久久久精品久久久久三级| 国产精品视频第一专区| 99er精品视频| 日韩成人免费网站| 99视频在线精品免费观看6| 四虎影视永久在线精品| 欧美日韩一区二区在线免费观看| 亚洲精品无码av中文字幕| 黑色丝袜高跟国产在线91| 五月婷婷精品| 久久综合色88| 国产在线观看一区精品| 中文字幕日韩丝袜一区| 亚洲精品国产日韩无码AV永久免费网| 亚洲欧美成人| 国产成人高精品免费视频| 亚洲综合色区在线播放2019| 国产精品视频系列专区| 四虎国产在线观看| 精品久久久久成人码免费动漫| 国产视频入口| 国产天天射| 国产尹人香蕉综合在线电影| 国产成人资源| 国产杨幂丝袜av在线播放| 性欧美精品xxxx| 日韩在线第三页| 狠狠干综合| 男女精品视频| 亚洲欧美成人综合| 精品视频一区在线观看| 亚洲欧美日韩中文字幕一区二区三区 | 激情综合图区| 91精品免费高清在线| 最新国产网站| 99这里精品| 久久情精品国产品免费| 天天色综合4| 免费AV在线播放观看18禁强制| 欧美日韩一区二区三区在线视频| 制服丝袜亚洲| 国产午夜一级淫片| 亚洲天堂日本| 中文字幕精品一区二区三区视频| 国产精品久久久久久久伊一| A级毛片无码久久精品免费| 尤物视频一区| 99精品伊人久久久大香线蕉| 成年人视频一区二区| 在线观看热码亚洲av每日更新| 亚洲中文在线看视频一区| 亚洲中文无码h在线观看| 欧美中文字幕第一页线路一 | 72种姿势欧美久久久大黄蕉| 婷婷午夜天| 亚洲美女视频一区| 国产真实自在自线免费精品| 无码福利视频| 九九热在线视频| 无码福利视频| 在线免费a视频| 国产人免费人成免费视频| 三上悠亚一区二区| 国产91麻豆免费观看| 亚洲午夜国产精品无卡| 亚洲国产中文精品va在线播放| 国产va在线|