999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的科研機構標簽體系研究

2022-07-02 07:18:28郭紅梅曾建勛
情報學報 2022年6期
關鍵詞:關聯學科特征

郭紅梅,曾建勛

(中國科學技術信息研究所,北京 100038)

1 引 言

科研機構是以社會和經濟需求為導向,有明確研究方向和任務并持續有組織地開展相關研究與開發活動的機構。作為國家科學研究的主體,它們是科技資源和科學成果的主要創造者和發布者,在長期從事科學研究的過程逐步形成了各自的特色,并建立了復雜的關聯關系。科研機構豐富的屬性特征和關聯關系是進行知識組織、資源關聯、科研管理和評價的重要基礎,如何從科研活動及其海量、多樣化、非結構化的科研成果中挖掘隱含的屬性特征和關聯關系,提煉科研機構各自的特點并賦予相應的標簽一直是科研界關注的重點。科研機構具有名稱、性質、學科、行業等多種屬性,而且存在層級、合作、引用等多種關聯關系,這些多樣的屬性和復雜的關系具有本體特征。本體作為一種能在語義層面對知識進行描述的概念模型,能很好地對科研機構的屬性進行定義和描述,并可基于知識推理來挖掘隱性的語義關系。因此,本文探索基于本體的方法和思維來構建科研機構畫像標簽體系;為滿足更細粒度的機構索引和管理需要,不僅針對一級科研機構,更深入到下屬二三級機構的標簽體系構建。

本文貢獻主要包括三個方面:①對機構的精準畫像可以支撐以機構屬性標簽為入口的檢索和導航。機構畫像過程中對機構的地域、性質、職能、學科、行業等多種屬性進行了標簽化,標簽化后的機構不再是孤零零的名稱,而是一個個內涵豐富的實體,可按照某種或某些標簽對機構相關的資源進行檢索和導航,對具有相同標簽的機構進行關聯檢索,將具有某種或某些特征的機構同時檢索出來并進行推薦,彌補了傳統上僅按照機構名稱對機構進行關聯、對機構相關資源進行組織、檢索和導航的不足。②支持更精細的統計分析和科學評價需求。機構畫像不僅對一級機構,也對其下屬二三級等更細粒度機構的標簽化,可實現從深層次對機構的理解和把握,支持按照某種或某些屬性標簽對處于不同層級的機構進行遴選、統計、聚類或對比分析,而且可按照某種特征準確定位與某機構最相關、最細粒度的關聯機構,滿足多元化的信息支撐服務。③支持機構知識圖譜的構建。在畫像過程中構建了科研機構之間的合作、引用和層級關系,形成了復雜的關系網絡,可通過機構知識圖譜將科研機構豐富的特征標簽和關聯關系構建成一個完整的知識體系,當用戶搜索某機構時,機構知識圖譜可以提供該機構最全面的摘要,讓用戶快速得到機構的科研、學科、行業、關聯機構等詳細標簽,輔助用戶在短時間內獲取所需信息,深入和廣泛地了解機構之間的關系。

2 國內外相關研究

對機構本質的認識經歷了虛擬主義理論、現實主義理論和名義主義理論三個階段。虛擬主義理論認為機構是由權利和義務相關對象組成的、獨立存在的虛擬實體;現實主義理論認為機構是由不同的成員構成的、人為賦予的、獨立存在的真實實體;名義主義理論認為機構是由所擁有的成員及其成員之間的關系構成的、具有復雜社會關系的獨特實體,該理論是構建機構本體的基礎[1]。在名義主義理論基礎上,學者們對機構給出了更多具體的定義。Hodgson[2]認為機構是規范社會交流行為的、既定和普遍存在的社會規則系統。Scott[3]認為機構是保證社會穩定的規則、規范和文化認知結構。Searle[4]與Johannesson 等[5]認為機構是通過人的交流交互來創建和維持的,但獨立于人類的信念而存在,交流交互是機構存在的本質,并提出利用本體來描述和揭示機構的特征。

隨著機構本質理論體系的逐漸成熟,國內外學者認識到機構是復雜的社會實體,有多種構成要素并具有自身特征,他們探索了多種方法來提煉機構的特色之處并賦予標簽以實現畫像的目的,按照畫像對象的不同將相關研究細分為面向機構相關主體的畫像和面向機構自身屬性特征的畫像。

2.1 科研機構主體特征的畫像方法研究

對科研機構主體的畫像又稱為用戶畫像,用戶畫像概念最早是由Copper[6]提出的,他認為畫像是基于用戶真實行為數據而構建的虛擬模型;隨著研究的深入開展,其內涵越來越豐富。用戶畫像是實現大數據環境下精準化信息服務的重要工具,近年來在人工智能、數據挖掘、信息檢索、圖書館、健康醫療、商業營銷等領域得到廣泛的研究和具體應用。

Eke 等[7]總結了信息檢索和推薦領域中用戶畫像最新的研究進展,包括用戶特征的提取、畫像的技術和方法、畫像的過程,以及畫像的效果等。曾建勛[8]指出,數字圖書館服務必須將用戶需求與知識創造相結合,從多維度對用戶的屬性特征進行細分和描述,以能夠在知識創造過程中提供精準服務。劉海鷗等[9]對用戶畫像的概念、構成要素、模型等進行總結,將用戶畫像方法分為基于行為的畫像方法、基于興趣偏好的畫像方法、基于主題的畫像方法,以及基于人格特性與用戶情緒的方法。Liang 等[10]構建動態用戶和詞嵌入模型對Twitter 上動態用戶進行畫像。陳澤宇等[11]在LDA(latent Dirichlet allocation)主題模型和神經網絡模型的基礎上,采用森林分類算法對用戶屬性進行分類以實現用戶畫像。Gu 等[12]參照MagicFG 畫像模型,對大數據環境下Web 用戶的行為進行畫像。

2.2 科研機構自身特征的畫像方法研究

科研機構是具有多種屬性特征的社會實體,其屬性可細分為相對穩定的靜態屬性和隨時間變化的動態屬性。靜態屬性在機構官網上均有介紹,容易識別,描述相對簡單。動態屬性較為復雜,如何對其進行準確標簽化,國內外學者進行了很多探索。本體作為重要語義知識描述工具,可實現對機構屬性和關系的綜合全面描述和關聯揭示,學者們探討了多種機構本體的構建方法。此外,為滿足具體應用場景的個性化需求,學者們也深入探索了針對某些具體屬性的描述方法。

2.2.1 科研機構的本體描述模型構建方法研究

學者們探討了多種機構本體的構建方法,通過構建本體模型來對機構的屬性及交流交互過程中形成的復雜關系進行定義、描述和揭示。馬里蘭大學構建了高校本體,定義了描述高校及相關活動的元素, 如 學 生、 教 員、 課 程、 科 研 成 果 等[13]。Chakhmoune 等[14]基于本體構建了機構知識記憶模型,對相關的人、資源、技術等進行描述和定義。Passerini Glazel[15]研究機構本體中的屬性類型與表征符號的關系。Eriksson 等[16]提出支持不同信息架構的機構本體。2010 年,Epimorphics 公司構建了政府機構本體[17]。為促進數據的共享,增強互操作性,W3C 對Epimorphics 機構本體進一步擴展,發布新的機構本體,旨在支持多個領域機構信息的關聯數據發布[18]。葉壯壯[19]將Wikidata 和DBpedia 兩個知識庫已有機構屬性進行融合來構建科研機構本體。金家琴等[20]探索數字人文數據基礎設施建設中的機構本體構建方法。胡雪環[21]從科研機構的屬性、關系、演化路徑以及層級結構等方面探索科研機構本體的構建方法。

2.2.2 科研機構的屬性描述方法研究

學者們針對某種或某類屬性的描述方法進行了深入研究。曾建勛等[22]針對科研機構名稱構建了機構規范文檔的語義化描述模型,并引入Schema 詞匯表對其進行描述。Johannesson 等[5]提出了機構概念描述模型,從角色、規則、權利、責任和過程角度對機構進行描述,并定義了不同實體的描述準則。Asumeng 等[23]基于機構的變革過程理論和實施理論提出機構描述發展模型,用于評價分析機構在發展過程中的特征、相似性、差異性、劣勢和優勢。孟琳[24]通過對多源知識進行數據獲取、信息融合和挖掘,對機構的核心成員、機構興趣等動態屬性進行抽取和畫像研究。Taneja[25]認為高校網站首頁上不同標簽字段的檢索瀏覽情況可反映學生對高校的關注情況,從而輔助學生進行高校的選擇;通過對國外高校網頁元數據字段的瀏覽分析發現,學生更關注學校的研究領域、學術項目、地理位置和科研環境。Galan 等[26]研究發現,高校的課程設置、聲望、評價評議、就業情況、學費等是學生在擇校中比較關注的屬性。Kettunen[27]研究了與高等教育機構相關聯對象的特征,關聯對象包括影響機構發展的其他組織、客戶以及內部的員工和學生等。

國內外學者通過構建本體、描述模型或挖掘算法對機構的屬性和關系、用戶行為等進行顯性化描述方面,積累了很多有益的理論和實踐經驗,不斷豐富著機構畫像方法技術體系,但仍存在以下幾點不足:①大多研究只是面向具體應用需求,針對科研機構某些具體屬性進行定性描述,沒有從整體上對科研機構的屬性和關系進行綜合全面的梳理,而且已有的研究主要集中于對一級機構屬性和關系的描述揭示,很少涉及其下屬更細粒度機構的分析。②對科研機構的行為特征描述揭示不夠,已有的畫像研究主要集中在對科研機構成員或具體科研用戶行為特征的描述,很少有研究在用戶之上對機構行為及其關聯關系進行描述揭示。③科研機構畫像的目的是支撐以機構為單元在文獻檢索、分面導航、定標比超、統計評價分析等方面的應用,但目前大多方法還處于理論探索階段,缺乏具體場景下應用效果的驗證。因此,本文以科研機構在知識組織、關聯揭示和檢索導航等應用場景的具體需求為導向,綜合分析科研機構的特征和關聯關系,基于本體思維構建一套能準確定義和描述科研機構屬性與關系的標簽化方法體系,且不局限于對一級科研機構的描述,還適用于對下屬二三級機構的描述。

3 面向科研機構畫像的本體模型構建

科研機構作為國家科學研究的主體,處于社會關系網絡之中,除了具有普通社會對象共有的經濟特征、法律特征、行為特征等以外,在從事科學研究的過程中逐步形成了自身的科研特征,如學科、行業、研究主題等。此外,科研機構之間還建立了合作、引用等關聯關系,這些特征和關系可通過科研機構相關的屬性進行揭示。本文借鑒Johannesson等[5]提出的概念模型,采用自下而上的思想構建科研機構本體模型,根據各屬性在機構發展中的作用將它們分為物理層、特征層和規則層,如圖1 所示,不同層的屬性相互作用,共同支撐機構的持續發展。最底層是物理屬性層,主要包括科研機構所依賴的物理主體、物質和行為,對特征層屬性起支撐作用;最頂層是規則層,主要包括科研機構所要承擔的責任和所有遵循的合約、規則、法律等文件,對科研機構進行約束控制;中間層是特征層,主要對科研機構的基本信息、科研成果、科研行為和機構主體等進行描述。科研機構主體通常指機構的法人和成員,基本信息屬性主要包括機構簡介、發展歷程、聯系方式等描述字段,通常利用文本或圖像表示;物理屬性用于描述科研機構的硬件設施等;行為屬性用來描述機構在科研活動中的行為;科研成果屬性用于描述機構的產出特征;功能和性質屬性主要對科研機構的性質職能特征進行描述。物理層和規則層通常不直接體現科研機構的特征進行描述;特征層的各個屬性用于描述揭示機構的不同特征面,它們并不是孤立存在的,而是相互關聯、相互作用,共同對機構本體進行限定描述。

3.1 科研機構本體的標簽體系研究

科研機構本體由多個屬性相互作用共同描述限定,通過對各個屬性和關系的總結分析,凝煉出科研機構在社會關系、社會屬性、科研活動等方面需要描述的屬性特征,如圖2 所示。社會屬性主要是科研機構作為社會實體所具有的身份地位、權利義務、目標任務和性質職能等;基本屬性主要包括機構的通用描述信息,如機構名稱、地域歸屬、聯系方式、發展歷程等;關系屬性是指科研機構在參與科研活動過程中,與其他社會實體產生的關聯關系,如名稱變更、拆分、合并等過程中產生的沿革關系,科研成果合作產生的合作關系,以及機構組織架構中得到的層級隸屬關系;科研屬性是對科研行為的描述,包括產生的科研成果、主要活動領域、關聯機構等。

圖1 科研機構本體模型

圖2 科研機構本體的屬性特征

科研機構標簽化就是利用標簽體系勾畫科研機構在從事科研過程中所形成的社會屬性、關系和領域的過程,精準、細粒度且結構化的標簽體系是機構畫像的基礎,其廣度和粒度對機構畫像的精確性有較大影響。因此,首先要提煉科研機構的標簽,形成機構標簽庫,包括特征標簽、關系標簽等。對科研機構本體中各實體的屬性和關系的抽象凝練得到科研機構在基礎屬性、社會、關系和科研四個方面的特征,按照各屬性特征在機構畫像中的作用和關系將它們分為三類,分別是描述信息標簽、關聯關系標簽和關聯機構標簽,從三個維度構建標簽體系,如表1 所示。

表1 科研機構本體的標簽體系

3.2 科研機構本體的標簽化流程研究

科研機構的靜態屬性相對穩定,如機構名稱、地域信息、聯系方式、創立時間等;動態屬性由靜態屬性衍生而來,并隨著內容擴充和時間推移而變化,如機構的活動領域、關聯機構等。靜態屬性獲取方式較為簡單,而動態屬性標注過程相對復雜,需要基于機構行為、科研成果和已有的靜態屬性綜合推理得到。因此,在機構屬性標簽化過程中按照獲取的難易程度分層次進行標注,具體流程如圖3所示。首先,獲取機構的基本屬性信息,它們是識別和構建機構關聯關系的基礎,也是對科研活動進行描述的基礎,機構名稱、地域歸屬、聯系方式、發展歷程等可以通過本地收割或遠程采集(從已構建的機構規范庫、文獻及相關成果庫,以及機構官網等)獲取。其次,基于已標注屬性和機構本體中不同實體之間的關聯和作用,識別機構間的關系,例如,對機構名稱變更過程的分析可以得到機構實體的沿革關系,對機構主管、主辦單位屬性的分析可構建機構的層級隸屬關系,對科研成果參與機構的分析可構建機構間的合作關系,對科研成果研究主題的分析可得到機構間的學科、行業或研究興趣的相似性關系等。最后,基于構建的關系數據,利用主題分析、規則和知識推理的方法識別主要關聯機構,并計算每個關聯機構的關聯強度,從而為某機構推薦相關或相似的機構,實現機構間的科研合作和定標比超。

圖3 科研機構本體的標簽化流程

4 科研機構特征的標簽化方法研究

4.1 基本屬性的標簽化方法

重點選取能夠揭示機構科研特征的、相對復雜的動態屬性進行標簽化。機構的性質和職能決定機構的社會責任和發展方向,對機構的發展有指引導向作用,是標注機構學科和行業的基礎。活動領域標簽是進行科研管理評價、統計分析、識別競爭對手和合作團隊的前提和基礎,而且隨著科學的發展,機構的活動領域也在不斷調整和擴充,遠超越了創建之初的設想,所涉及的學科和行業范圍會越來越廣。因此,本文以表征科研機構性質職能和活動領域的學科類別和行業類別以及關聯機構為例,來論述科研機構屬性特征的標簽化過程。目前科研機構的畫像、排名和評價研究大多針對一級機構,由于一級機構多是綜合性機構,所賦值的活動領域特征標簽粒度較粗,不能滿足從更細學科粒度上進行科研管理的需要,因此,本文構建的標簽體系主要針對下屬二三級機構的特征進行描述,更專指、更具體,滿足從更細的學科和層級粒度對科研機構進行評價和管理。

4.1.1 性質職能的標簽化方法

由于機構在發展歷程中新建、更名、拆分、合并等現象頻繁發生,故根據機構存在的時效性將其分為連續體和非連續體。連續體是指在較長一段時間內持續穩定存在、具有實體形式的機構組織,如某所高校或研究所等;非連續體則是由于社會發展需要,在一定時期內存在,一般需要依賴其他實體機構而存在,如國家重點實驗室。根據不同層級機構間的關系和是否有獨立法人地位,又將連續體分為獨立體和依賴體,比如,某高校是獨立體,而它下屬的院系需要依賴高校實體而存在,屬于依賴體,具體如表2 所示。

根據科研機構所從事的重點業務,對一級機構及其下屬機構分別進行性質特征描述。將一級機構獨立體劃分為高等院校、科研院所、醫療機構、企業、學協會等,將獨立體下屬的依賴體劃分為管理部門、業務部門、服務部門等。

表2 機構性質職能標簽的特征詞

4.1.2 學科屬性的標簽化方法

科研機構的學科類別通常體現在機構的名稱、科研成果和人才培養三個方面。機構名稱是創建時所賦予的,它能標識機構最初設置的目標和研究方向,很多高校和研究所名稱中就存在標識學科類別的詞語,如中國醫科大學(醫學)、中國藥科大學(藥學)、中國政法大學(法學)、中國科學院化學研究所(化學)、中國科學院聲學研究所(聲學)等。由于機構的名稱相對固定,不會輕易更改,本文將從機構名稱中得到的學科類別稱為靜態學科。此外,機構在發展過程中所從事的研究領域會隨著需求進行調整,比如,為滿足社會或科技需要,或為了發展機構特色,或為了追求國際熱點等,機構布局新的研究領域,本文將其稱為動態學科,通常體現在科研成果和人才培養的學科方向。靜態學科和動態學科從不同角度揭示了機構的學科布局,因此,機構學科類別的標注應綜合靜態學科和動態研究領域兩方面的特征,如圖4 所示。

目前存在多種學科范疇分類標準和體系,常用的有《中華人民共和國國家標準學科分類與代碼》(GB/T 13745—2009,簡稱《學科分類與代碼》)、國務院學位委員會和教育部頒布的《學位授予和人才培養學科目錄》《中國圖書館分類法》和Web of Science(WoS) 數據庫的JCR(Journal Citation Reports)期刊學科分類體系。由于使用目標不同,不同分類標準中所設置的學科粒度存在差異,比如,《學位授予和人才培養學科目錄》和《學科分類與代碼》相比,前者在醫學和管理學領域劃分得比較詳細,后者在經濟學和語言學領域劃分得比較詳細。為兼顧不同的分類體系和中國科研機構的學科特點,將幾種學科體系進行映射、合并融合。

圖4 科研機構學科屬性的標簽化

由于不同機構命名沒有特定規則,對于靜態學科類別的標注,需要預先構建不同學科領域的特征詞典,然后依據機構名稱中的特征詞來標注機構的學科類別。為充分準確地構建不同學科下的特征詞典,選取各領域共4300 個高被引機構作為訓練數據,對40 多萬條二三級機構名稱進行預處理,抽取能表征機構學科類別的詞語映射到相應學科中,構建各學科的特征詞典,表3 列出了部分學科所標注的特征詞。將機構名稱與已構建的學科類別詞典進行匹配,實現不同層級機構靜態學科的標注,對于無法按照特征詞映射上的機構,分別與4 種分類體系的最細粒度層級進行比對,若匹配上,則取其上級類值。

科研成果是機構參與科研活動的主要產物,科研成果的學科分布可反映機構關注的領域,揭示研究主題隨著時間的演化和轉移;文獻是科研成果的主要形式,因此,本文以文獻資源為核心來分析機構的動態學科特征。文獻的學科類別可以分別從發文期刊和施引期刊的學科獲取。發文期刊的學科是機構主動選擇的,而施引期刊的學科是外部學者對文獻的理解,是客觀自發的行為,二者從不同角度揭示機構的研究主題分布,可以相互驗證和補充。此外,科研機構擔負著人才培養的責任,所設置的學科和專業可反映機構的特色、發展策略和研究領域,因此,收集不同層級機構所設置的本科專業,以及授予的碩士、博士研究生學位方向,補充文獻的學科領域。

表3 學科屬性標簽的特征詞

4.1.3 行業屬性的標簽化方法

科研機構在從事科研活動、服務社會和支撐國民經濟發展的過程,會產生一定的社會經濟效益,通常體現在不同的行業類別中,對機構行業類別的標注有助于對比機構科研成果的應用效果或服務社會的成效,尤其是一些以技術研發為主的科研機構,在成果轉化過程中為不同行業帶來了較大的社會效益。科研機構所涉及的行業主要集中在教育,科學研究和技術服務,信息傳輸、軟件和信息技術服務,衛生和社會工作等類別中。國民經濟行業分類在不同行業的分類詳細程度存在差異,比如,制造業較為詳盡,而在科研機構比較集中的教育及科學研究和技術服務業,分類則較為粗略。為了準確標注各機構的行業,并盡量保證各機構的行業在可比的層級上,按照實際需求對不同大類下的行業類別進行層級調整,比如,將Q841 醫院(Q 衛生和社會工作)與C27 醫藥制造業(C 制造業)調整為同一層級,盡量保證不同行業分類體系保持在相同粗細粒度上進行標注和對比。

4.2 關聯關系的標簽化方法

機構間存在層級關系、發展沿革關系、科研合作關系和科研引用關系等多種。層級關系通常體現在機構的組織架構和科研成果的機構署名中。沿革關系用于描述機構發生變更前后,新舊機構之間的替代與被替代關系,通常包含兩種情況:一是機構自身的變化,主要包括普通更名、改制更名、升格更名、轉設更名等;二是涉及多個機構的名稱變更,主要包括合并更名、合并轉設更名、拆分更名等。合作關系構建主要基于科研成果,若兩個或多個機構同時參與一項或多項科研成果(科技文獻、專利、基金項目等),則這些機構兩兩之間具有合作關系;此外,將標識同一資助項目的科研成果的機構也視為合作關系。引用關系主要反映在科研成果的參考文獻中,一般分為直接引用關系、共被引關系和耦合關系,引用關系越強的機構之間研究主題越相似。

4.3 關聯對象的標簽化方法

關聯機構是指與某科研機構關系比較緊密的機構,主要體現在兩個機構的科研活動或科研成果的交互程度,集中在合作或引用關系較強的機構,因此,將合作強度和引用強度較大的機構均視為關聯對象。關聯對象的標注是識別合作伙伴和競爭對手的基礎,二者存在交叉重疊,通常合作密切的機構也是同領域內科研實力相當的機構,存在競爭關系。

4.3.1 合作機構的標簽化方法

合作機構的識別主要基于科研成果中的署名機構來判斷,出現在同一科研成果中的機構即為合作機構,合作的科研成果越多,機構間的合作關聯強度越大。本文主要基于公開發表的文獻、專利和基金項目中的署名機構來識別合作機構。除了作者署名機構字段外,部分文獻、專著和專利數據中還具有基金項目字段,本文將標識同一基金項目的科研成果的署名機構也視為合作機構。分別計算某機構與各領域中其他機構的合作強度,強度較高的即為該領域內所識別出的合作機構。

4.3.2 對標機構的標簽化方法

對標機構通常是指綜合實力與本機構水平相當的機構,它的識別需要權衡科研機構的活動領域、人員規模、科研產出、學術影響力和國際地位等各方面的屬性特征,運用知識推理的方法,依據綜合性評判結果來確定,并不局限在同層級機構中。活動領域相同是指兩個機構在相同分類體系下,學科或行業領域一致。科研人員規模相當是確保兩個機構體量一致,具有可比性和公平性。在科研人員規模相當的情況下,通過科研產出指標和學術影響力指標來測度不同領域中的對標機構;科研產出通常利用科研成果論文量來衡量,學術影響力利用引文數量來衡量,其他科研合作指標和社交媒體指標等可以作為輔助,在必要情況下使用。對標機構的識別是與領域相關的,按照機構所屬的科研領域可將機構分為專業領域機構和綜合性機構,對于某綜合機構,如果查找某具體領域的對標機構,那么推薦出的對標機構可能是單領域機構,也可能是綜合機構的下屬子機構。如果要推薦某綜合性機構的對標機構,不關聯某具體學科,那么推薦的對標機構也應該是綜合機構,按照領域分別計算其與某綜合性機構的相關性,然后將各領域相關性進行綜合排序來推薦相關機構。

5 實證研究

對科研機構來說,活動領域和合作機構是兩個重要的屬性,因此,本文重點選取這兩個屬性進行機構特征標簽的實證研究。選取《中國高被引分析報告2019》[28]中物理學領域的高被引機構天津大學和清華大學為示范機構,對它們的活動領域和合作機構進行識別和標注。

2011—2018 年,《中國高被引分析報告2019》[28]遴選出的物理學領域的64 種期刊上共發表學術論文62682 篇,其中天津大學第一作者發文625 篇(截止到2019 年被引1443 次),清華大學第一作者發文935 篇(截止到2019 年被引1416 次)。從第一作者高發文期刊來看,天津大學發文主要集中在《物理學報》《光學學報》《光譜學與光譜分析》等期刊上,清華大學發文主要集中在《中國物理快報(英文版)》《物理與工程》等期刊上(表4)。從天津大學發文期刊細分領域可知,它在物理學的主要活動領域是光學,清華大學則以力學和工程為主。

從表5 可知,天津大學和清華大學在物理學領域的主要合作機構上存在差別,二者沒有交叉重疊。天津大學的主要合作機構是南開大學、天津師范大學、中國科學院半導體研究所等,清華大學則主要與西北核技術研究所、中國科學院物理研究所、中國工程物理研究院等機構合作。此外,對于同一個機構,從其與不同機構合作發文的期刊來看,合作的具體研究主題也存在差別。例如,天津大學與南開大學、中國科學院半導體研究所的合作發文集中在光學和激光領域,與天津師范大學、河北工業大學的合作發文則集中在光譜學;清華大學與西北核技術研究所、中國工程物理研究院的合作發文集中在激光領域。

表4 天津大學和清華大學在物理學領域第一作者高發文期刊

表5 天津大學和清華大學主要合作機構與合作發文期刊

從天津大學和清華大學在物理學領域的活動領域分析可以看出,在較粗學科分類粒度上機構的研究領域雖然相同,但在細粒度研究主題上卻存在很大差別。從合作機構來看,不僅它們合作的機構有差異,對于同一個機構,其與不同機構的合作主題也會存在很大差異。因此,只有構建機構全面的、細化的標簽化體系,才能對機構進行準確描繪和客觀評價。

6 結 語

本文通過對科研機構的屬性特征的深入分析,采用自下而上的思想構建了包含物理層、特征層和規則層的本體模型;凝煉了科研機構在社會關系、社會屬性、科研活動方面的主要特征和標簽體系;按照屬性特征獲取的難易程度,提出分層次標注流程,為以機構為單元的服務應用提供理論支撐。本體模型能夠從語義層次上對科研機構的概念、屬性及關聯關系進行全方位的定義和描述,不僅能揭示科研機構的學科、行業等屬性和科研行為關聯,還可以通過簡單的知識推理形成語義化的關系網絡,滿足語義環境下檢索和導航等服務應用需求,是揭示科研機構復雜屬性和關聯關系的優選工具。以科研機構本體為基礎的機構畫像可在對機構屬性特征和關系進行知識推理和關聯挖掘的基礎上,提煉各個機構的特征,構建更細粒度和廣度的標簽化體系,輔助用戶快速直觀了解某個機構的特色、發展水平、活動領域等,從更為全面客觀的角度提供對機構的信息挖掘和分析,對具有相同特征標簽的機構進行分析,便于機構與機構之間進行比較,輔助宏觀決策和預測科研機構的發展趨勢,識別潛在合作伙伴和競爭對手等。本文以科研本體模型和標簽體系的構建理論研究為主,通過對天津大學和清華大學在物理學科的活動領域和合作機構的標注可知,細粒度標簽化有助于全面深入了解科研機構的屬性特征,準確識別關聯機構。下一步將根據具體應用場景對標簽化方法體系進行優化,構建支撐不同服務需求的科研機構標簽體系。

猜你喜歡
關聯學科特征
【學科新書導覽】
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
土木工程學科簡介
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
奇趣搭配
抓住特征巧觀察
“超學科”來啦
智趣
讀者(2017年5期)2017-02-15 18:04:18
論新形勢下統一戰線學學科在統戰工作實踐中的創新
主站蜘蛛池模板: 成人在线欧美| 国产在线八区| 国内精品视频| 亚洲精品欧美日本中文字幕| 午夜免费视频网站| 黄片一区二区三区| 福利在线免费视频| 精品乱码久久久久久久| 2021亚洲精品不卡a| 四虎精品黑人视频| 久久精品只有这里有| 亚洲色欲色欲www网| 无码丝袜人妻| 99国产在线视频| 亚洲女同一区二区| 亚洲国产清纯| 国产91小视频在线观看| 国产区人妖精品人妖精品视频| 成年人国产网站| 亚洲性日韩精品一区二区| 国产在线麻豆波多野结衣| 伊人丁香五月天久久综合| 成人亚洲国产| 久久夜色撩人精品国产| 麻豆精品国产自产在线| 天天摸天天操免费播放小视频| 国产麻豆精品手机在线观看| 欧美午夜小视频| 内射人妻无码色AV天堂| 欧美国产日产一区二区| 内射人妻无套中出无码| 亚洲色图欧美| 免费看av在线网站网址| 欧美人人干| 波多野结衣第一页| 欧洲成人在线观看| 日韩高清成人| AV色爱天堂网| 毛片视频网址| 777国产精品永久免费观看| 99视频在线精品免费观看6| 日本www色视频| 亚洲天堂久久| 日本精品αv中文字幕| 2022精品国偷自产免费观看| 欧美日韩北条麻妃一区二区| 日本一区二区三区精品视频| 国产高清色视频免费看的网址| 久久精品66| 国产精品蜜臀| 日本不卡视频在线| 日韩精品欧美国产在线| 国产自无码视频在线观看| 国产小视频在线高清播放| 国产成年女人特黄特色毛片免| 99热最新网址| 国产成人艳妇AA视频在线| 谁有在线观看日韩亚洲最新视频| 欧洲欧美人成免费全部视频| 波多野结衣一级毛片| 国产精品亚欧美一区二区| 九九久久精品免费观看| 久久国产香蕉| 欧美a在线| 婷婷激情五月网| 国产在线97| 亚洲综合色区在线播放2019| 国产18在线| 喷潮白浆直流在线播放| 国产呦视频免费视频在线观看| 日韩午夜伦| www.狠狠| 国产区精品高清在线观看| 日韩视频免费| 99久久精品免费看国产免费软件 | 永久免费无码日韩视频| 美女高潮全身流白浆福利区| 精品视频一区二区三区在线播| 亚洲成人黄色网址| 亚洲国产精品无码AV| 亚洲第一天堂无码专区| 亚洲第一网站男人都懂|