999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于現代信息技術的情報分析方法研究

2021-11-27 12:22:18郭建偉
天津科技 2021年11期
關鍵詞:數據挖掘科技信息

趙 欣,郭建偉

(1. 北京科學學研究中心 北京 100089;2. 北京市科學技術情報研究所 北京 100048)

0 引言

情報分析工作主要包括信息的抽取、篩選,知識分析、綜合,知識濃縮、集成,以及相應的情報(信息)系統(決策支持系統、群體決策系統、電子數據處理系統等)開發、研制與使用[1]。情報分析的最終目的是通過分析研究已知信息,獲得對事物深層次的認識與把握,探索未知、預測未來,為科學決策、科學研究、市場開拓等提供參考方案,為知識創新服務。通過情報分析,揭示研究對象的內在變化規律及其與周圍有關事物的聯系,弄清其歷史和現狀,并預測其未來發展的可能趨勢;通過情報分析,可根據決策者和有關人員的情報需求,動態及時提供情報。

1 情報分析的對象及作用

按照內容的加工深度分,情報分析的對象可分為零次文獻、一次文獻、二次文獻和三次文獻[2]。零次文獻是指最原始的未公開傳播的文獻,如私人筆記、設計草圖、試驗記錄、文章草圖、會議紀要及各種內部文檔。一次文獻是以作者本人的生產和科研工作成果為依據而創作的原始文獻,如期刊論文、科技報告、專利說明書、會議論文、學位論文等。一次文獻通常反映了作者的創見,是對知識的第一次加工。二次文獻是對一次文獻進行替代、改組和綜合的產物,如編輯成目錄、文摘、索引等檢索工具或數據庫。二次文獻具有存儲、報道和檢索的功能,是對知識的第二 次加工。三次文獻是對原始文獻群的內容進行系統分析、綜合、評述而編寫的文獻資料,是高度濃縮加工的再生科研文獻,如專題評述、動態綜述、學科年度總結、進展報告以及數據手冊等。

目前,情報分析工作一般是通過二次文獻,或直接閱讀、篩選一次文獻,對情報信息的再度濃縮、提煉和加工。其研究報告是直接面對用戶、面向問題的智慧結晶或決策參考方案。國外把承擔這類工作的機構稱之為“智囊團”或“腦庫”,如美國的蘭德公司、英國倫敦國際戰略研究所、日本野村綜合研究所等。在我國則是由情報研究機構、咨詢公司等承擔,如中國核情報研究所、全國各省市情報所等。他們為各級、各行業領導機關、決策機構、科技管理部門的宏觀決策及時提供情報支持;為科學研究單位承擔的科研項目提供情報調研服務及關鍵技術跟蹤,研究科技發展態勢;為社會有關行業和部門提供科技信息咨詢服務,為重大項目論證、重大技術攻關以及科研成果產業化提供信息支撐服務。

2 情報分析方法的國內外現狀與發展趨勢

情報分析是情報研究當中的一個重要環節,傳統的分析方法大多是采取人工方式,側重于對文獻的調研,如判斷分析法、對比法、相關分析法、綜合法、類別法、時間序列分析法、模糊綜合評價法、回歸分析法、文獻計量法和德爾菲法等[3]。這些方法在一些經典的情報學著作中有詳細的介紹,在此不再贅述。網絡時代的到來,可以獲取的信息資源越來越多,怎樣從海量信息當中獲取有價值的情報,去偽存真,總結提高,并且對分析結果進行明晰表達,都是急迫需要解決的問題。面對數量龐大和形式復雜的信息資源,已經有越來越多的研究和實踐表明,將計算機技術應用到情報分析當中,可以極大地提高情報分析的質量和效率[4]。

通過對美國、英國、日本、加拿大、韓國等信息分析業比較發達的國家的研究發現,充分運用現代化的信息分析手段是其提高情報分析水平的關鍵[5]。早在1980年美國進行的一次信息分析專業人員的調查就表明他們的工作已經計算機化。這些國家的信息分析機構除了采用熟知的通用統計分析軟件包,如社會科學統計軟件包(Statistical Package for the Social Sciences,SPSS)、統計分析系統(Statistics Analysis System,SAS)和Oracle、SQL server等數據庫軟件,德溫特分析家(Derwent Analytice,DA)等專利分析軟件包,還自行開發了大量情報分析專用軟件。

我國在普及計算機技術在情報研究中的應用、掌握利用互聯網從事信息采集和分析的技術、熟悉并開發各種情報分析軟件、改進情報成果表達和交流方式等方面做了大量的工作,使情報研究環境得到改善。以中國科技信息研究所、上海市科技情報研究所為代表的一些國內情報服務機構,已經在情報分析專用數據庫建設、智能情報分析軟件的開發和利用等方面,取得了顯著的成果。中國科技信息研究所為了加強對中國科技論文的統計和分析,在1987年建立了大型多功能文獻數據庫——“中國科技論文與引文數據庫(CSTPCD)”,既有科技論文與引文的統計分析功能,又有很強的文獻檢索功能。數據來源于1200多種科技類核心期刊,以及國家科技部年度發布的科技論文與引文的統計結果。除了關鍵詞檢索之外,還能通過地區、城市、學科、科研單位、高等院校、各類基金資助論文發表情況、科研人員本人發表的論文情況等方面進行檢索和統計,從而反映我國學科、專業的發展趨勢、國家的科技水平、主要大學和科研院所的科學生產能力以及新興領域的潛力。在CSTPCD數據庫的支持下,中國科技信息研究所每年完成《中國科技論文統計與分析》年度報告、《中國科技期刊引證報告》、《中國高校科技論文產出排行榜》,對中國作者在國內外發表的論文和被引情況進行多角度的深入分析,從科技論文角度反映我國科研整體狀況和在世界上所處的位置及其變化。

上海市科技情報研究所利用Oracle數據分析軟件實現對專利信息的數據挖掘;北京市科技情報研究所建立的以自然語言處理技術為基礎的智能情報處理系統,實現了科技情報的自動分類、去重、摘編等功能。一些軟件公司也推出了專業的情報分析軟件,如萬方數據專利文獻多維檢索與分析軟件、TRS競爭情報系統等[6]。

情報機構的信息化、情報分析工作的現代化仍是我國科技情報事業的工作重點。目前,我國在情報研究工作方式、手段及研究方法上都有待提高。國內的情報研究工作方式還有相當一部分停留在文獻調研的基礎上,單純的定性研究仍占有較大的比例,情報分析工作也要加強信息資源的整合,通過引入和利用計算機輔助情報分析(Computer Aided Information Analysis,CAIA)軟件,通過數據挖掘技術、語義理解技術、相關統計分析技術以及數據抽取技術等提高定量分析能力,并集成多種情報分析手段和工具,建立更為完善的情報分析平臺,并通過網絡組成虛擬的情報分析團隊,發揮潛在的社會智力資源。

3 基于數據挖掘技術的情報分析方法研究

數據挖掘,又稱數據庫中的知識發現[7],是指從巨大的、不完整的、有聲造的、含糊的、隨機的數據中,抓取隱藏在其中的、人們事先不知道的但又潛在有用的信息和知識的過程。最為著名的是美國沃爾瑪連鎖超市利用數據挖掘方法對顧客的購物行為進行分析,意外發現:跟尿布一起購買最多的商品竟是啤酒。原來美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。

數據挖掘的主流技術方法有:關聯分析、決策樹、遺傳算法、貝葉斯網絡、粗糙集方法、神經網絡、統計分析[8]。近幾年來,自然語言理解、語義關聯分析、詞頻分布統計、語料學研究等可以用于進行情報分析的技術方法和工具已經成為數據挖掘算法的重要研究方向,并且已經出現一些成型的軟件工具。計算機技術的飛速發展使情報的自動化收集、自動化處理成為科技情報工作必然的發展趨勢,更需要利用數據挖掘技術從海量信息中快速、準確地獲取有用信息,并發現這些信息內在的聯系,根據現有信息預測將來的發展趨勢,以幫助情報分析人員實現對情報資料的深加工。

4 常用情報分析方法的計算機實現

4.1 Matlab實現層次分析法

層次分析法一般針對目標結構復雜的決策任務,通過將目標分層,建立多個分層的矩陣進行計算得到最后結果,在解決實際問題時,往往計算量大,手工計算費時且容易出現錯誤,這很大程度制約了此方法的應用。隨著計算機技術的出現,計算量大的任務在計算機上實現能夠極大地節省時間。下面就Matlab軟件實現層次分析方法進行介紹。

Matlab能夠對層次分析法的判斷、分析和計算過程進行處理。當用戶輸入層次結構方案和兩兩對比的判斷矩陣后可以快速得出相應的結果,提高了層次分析方法在實際應用中的效率。層次分析方法中最大的計算量是計算判斷矩陣是否滿足一致性約束,并且求解最大特征值和它對應的特征向量。它在Matlab中求解程序如下:

使用者既可以利用上述程序在Matlab中編程實現,也可利用一些成熟的層次分析法軟件,如yaahp 0.4.1進行計算。

4.2 模糊評判法介紹及計算機輔助實現

模糊綜合評判法的基本思想主要是先利用與評價對象有關的單因素來評價結果,構成相應的評價矩陣,然后利用各確定因素重要性程度的權重因子作模糊變換,最終得到對評價對象的評價結果。

模糊評判法的實現步驟如下:

①設定各級評價因素和評判集。對于一個問題進行評判,關鍵問題之一是確定與此問題有密切關系的評價因素。找出影響問題領域的典型因素,需要全面但是不能太過精細以免影響效率。

②計算因素值。一般現實生活中評價因素多是定性指標,而進行模糊評判時需要轉化為定量指標,SPSS統計分析軟件為處理此類問題提供了強大的 功能。

③設定各級評價因素的權重(W)。各評價因素權重系數的準確定義對于評判結果的合理性有決定性作用,為合理確定權重系數,需要綜合考慮問題領域多個經驗豐富的專家意見和此前相關的處理經驗。權重系數的量化處理方式可參照層次分析法的權重選擇系數確定方法。

④進行模糊綜合評判計算,得出最后結果。建立評判因素、評判集、因素值矩陣和權重系數之后,即可以借助計算機進行模糊綜合評判計算。

5 情報預測

情報研究的目的不僅在于更好地解釋過去與總結現在,更重要的是要有效地預測將來,加強對未知領域的預測是提高情報研究生命力的重要途徑,也是充分體現科技情報前瞻性的價值所在。通過科學的情報預測可以找到未來一個時期內預測對象的發展動向和必然的趨勢,并給予評價和做出預想的結論,包括水平發展動向、發展規模、發展過程中的主要因素和可能的影響因素以及各環節之間的關系變化等。通過對以往發展過程的調研和總結,結合目前的現狀和發展趨勢,經過分析、判斷、推理而提出未來發展中的問題。

情報預測具有戰略意義,這種研究的結果為決策者確定科技發展的方向、規模、結構和速度提供依據。如科技發展方向預測,科技發展水平預測,某個行業、某個專業在國民經濟發展中地位和發展比例的預測,科技發展速度與科技隊伍之間的比例關系和培養的途徑,對國內外重大科學技術發明、發現的預 測等。

目前,情報預測已成為科研活動和科學決策中不可缺少的部分,并且人們對預測的科學性、合理性要求也日益提高。傳統的情報分析活動以手工方式和直觀預測進行的定性分析占據了相當大的比例[9]。隨著現代信息技術的迅速發展和廣泛應用,信息的搜集、處理和傳遞方式都發生了革命性變化。特別是在分析處理過程中,由于在現代信息社會中信息量劇增,需要處理的信息和可利用的情報數量巨大,更加需要采用一定的信息技術或人工智能的手段,才能達到科學預測的目的。

6 結論

隨著社會環境和戰略決策需求的不斷變化,作為科技情報研究前提和保證的情報研究方法也必將進一步得到充實和完善。一些情報研究方法的軟件化、集成化及在計算機上的實現都是未來發展的趨勢。

猜你喜歡
數據挖掘科技信息
探討人工智能與數據挖掘發展趨勢
科技助我來看云
科技在線
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
科技在線
科技在線
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 亚洲精品亚洲人成在线| 亚洲天天更新| 亚洲第一黄色网址| 国产视频资源在线观看| 亚洲综合香蕉| 成年人视频一区二区| 高潮毛片免费观看| 国产又粗又爽视频| 国内a级毛片| 亚洲人成在线精品| 日本免费一级视频| 日韩无码白| 国产毛片高清一级国语 | 在线另类稀缺国产呦| 91精品国产麻豆国产自产在线 | 日韩欧美在线观看| 国产99在线观看| 国产在线视频欧美亚综合| 91麻豆国产视频| 国产无码性爱一区二区三区| 色综合久久88色综合天天提莫| 国精品91人妻无码一区二区三区| 97se亚洲综合| 欧美成人在线免费| 亚洲第一黄色网址| 久久精品日日躁夜夜躁欧美| 十八禁美女裸体网站| 亚洲视频欧美不卡| 在线精品欧美日韩| 国产精品久线在线观看| 在线看片中文字幕| 国产精品福利社| 久久久久久国产精品mv| 国产精品综合久久久| 国产一区二区福利| 亚洲无码免费黄色网址| 国产爽爽视频| 日本影院一区| 亚洲综合天堂网| 亚洲品质国产精品无码| 狂欢视频在线观看不卡| 成人免费午夜视频| 福利一区三区| 亚洲综合天堂网| 伊人久久精品无码麻豆精品 | 91精品aⅴ无码中文字字幕蜜桃| 91区国产福利在线观看午夜| 亚洲成人在线网| 茄子视频毛片免费观看| 久久综合九色综合97网| 国产亚卅精品无码| 三上悠亚精品二区在线观看| 久久久91人妻无码精品蜜桃HD| 国产一区二区网站| 亚洲第一成年网| 欧美色视频日本| 国产精品尤物铁牛tv | 91美女视频在线观看| 国产精品99r8在线观看| 国产男人天堂| 色哟哟国产精品一区二区| 欧美日韩精品一区二区视频| 国产爽爽视频| 日韩在线1| 青青国产视频| 亚洲综合精品香蕉久久网| 国产大片黄在线观看| 国产美女无遮挡免费视频| 在线看片免费人成视久网下载| 男人天堂亚洲天堂| 国产亚洲视频免费播放| 亚洲精选高清无码| 午夜国产在线观看| 国产在线视频自拍| 精品国产免费观看一区| 凹凸国产分类在线观看| AV无码一区二区三区四区| 亚洲色图欧美| 日韩少妇激情一区二区| 丁香亚洲综合五月天婷婷| 狠狠色综合网| 亚洲人成网站日本片|