〔摘 要〕本文詳細闡述知識集合的研究范圍,從物元模型#65380;知識集合中的組合表示和相關性三方面分析知識集合的表示方式,最后介紹了物元模型在科研評價中的應用#65377;
〔關鍵詞〕知識集合;物元模型;表示方式
〔中圖分類號〕G250 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)08-0205-03
Representation Model of Knowledge Set and Application in Scientific EvaluationLiu Huijun Song Yaowu
(Library,Guangdong University of Technology,Guangzhou 510090,China)
〔Abstract〕This paper described in details of the research scope of knowledge set and analysed the representation model of knowledge set from three aspects of matter-element model,combinatorial description and relativity.Finally,the application of matter-element model in scientific evaluation was introduced.
〔Key words〕knowledge set;matter-element model;representation model
知識集合論是武漢大學王子舟對圖書館學研究對象積極探索得出的成果#65377;以圖書館學基礎理論和集合論#65380;系統論作為理論基礎,認為圖書館學的研究對象是知識集合,知識元素是組成知識集合的最小知識單元#65377;知識集合的理論自提出以來受到不少學者的關注,本文詳細闡述知識集合的研究范圍,從物元模型#65380;知識集合中的組合表示和知識集合中的相關性三方面分析知識集合的表示方式,最后介紹了物元模型在科研評價中的應用#65377;
1 知識集合的研究范圍
知識集合不是僅停留于物質的表面,而是從本質上揭示出了圖書館學的研究對象,并深化了對圖書館研究對象的研究——從圖書館轉移到客觀知識世界,可以說是從感性認識上升到理性認識的一個飛躍#65377;有人認為知識集合對于圖書館缺乏專指性,認為知識集合是指對有序化了的文獻庫的微觀描述#65377;因此得出結論:知識集合只不過是作為文獻成為圖書館的一個要素,而并非指圖書館整體#65377;筆者認為是不貼切的#65377;主要原因如下:
首先,這是其認識基點不同造成的結果#65377;知識集合認為“圖書館”不是圖書館學研究的對象,“圖書館”只是一個機構的名稱,它本身不能反映圖書館學研究的本質#65377;這一點,在提出信息資源說時,已經作了精辟的論述#65377;其次,知識集合本身是個由不同大小的知識子集組成的體系,同等級的知識集合聯系起來還可以組成更大的知識集合#65377;美國著名圖書館學家謝拉曾在闡述社會認識論時說“知識是如何發展和擴大的,這是人們特別是哲學家一直研究的一個主題,而怎樣把知識安排得協調,使之成為一個完整的體系并加以利用,這還是一個幾乎未被認識的研究領域”,當我們引入了知識集合的概念后,可以看到,知識的發展和擴大體系正是以集合形式構成的——也是所說的知識集合#65377;對這個擴大體系的研究是很重要的,一般以具有機構實體形式的圖書館作為知識集合的基點,那么目前在文獻資源共享的思想下發展起來的館際合作#65380;聯機檢索等,就是知識集合更宏觀的研究內涵;知識集合更微觀的研究內涵是知識子集,知識子集的研究就進入了對文獻的知識內容與結構研究的領域,這種思想可追溯到我國古代時期的圖書館學思想,其研究重點是文獻本身,即所謂“重書不重館”,相對于對文獻本身價值的研究而言,對圖書館管理等方面的學說甚少#65377;它通常與目錄學#65380;版本學的研究融合在一起#65377;到了圖書館學理論研究確立和發展時期,研究者則更多地是從圖書館這個機構本身出發,對圖書館進行研究#65377;從當時對文獻的定義中也可以看出這一傾向,“記錄有知識的載體”這一描述著重于文獻的物理形態,忽視了人們利用文獻是獲取文獻的內容和它包含的知識#65377;20世紀中后期,隨著信息技術的發展和人們對知識#65377;研究者的目光又重新回到文獻本身包含的知識#65380;信息上,而且,數字圖書館是21世紀圖書館的發展方向已成為研究者的共識,在國內外數字圖書館研究更成為一項社會化的研究課題,計算機專家側重于信息技術(IT)的研究,圖書館專家則側重于信息內容(content)的研究,這是在現代技術飛速發展的環境下,圖書館學專家應好好把握的研究方向#65377;
總之,這種從古代基于文獻研究的圖書館學研究思想發展到目前以知識集合為研究對象,可以說是一個“肯定——否定——否定之否定”的輪回#65377;
2 知識集合的表示方式
2.1 物元模型
知識集合中的基本組成部分是知識元素,為了更好地對知識元素進行統一的存儲#65380;管理與組織,必須將知識元素邏輯地表示出來#65377;采用可拓方法中的物元模型來表示知識集合中的知識元素,其模型建構如下:
以有序的三元組R=(N,C,V)來表示知識元,其中N表示事物,C表示特征,V表示事物關于C的量值#65377;那么,對于N維知識元可表示為:
其中Ri=(N,ci,vi)(i=1,2,……)稱為R的分物元,此時R為一個知識集合,簡記為
由上可見,對于集合{R1,R2,……Rn}包含了幾個組成元素,這些組成部分也可稱為子集:
事物集:N (N={N1,N2,……,Nn})
物征集:C (C={C1,C2,……,Cn})
量值集:V (V={V1,V2,……,Vn})
為了更好的描述知識元的復雜多變性,引入參變量t,此時R記為R(t):
R(t)=(N(t),C,V(t))
或R(t)=(N(t),C,C(N(t))))
引入參變量物元可更方便描述事物的動態,如量變與質變,也可以描述不同特征,不同事物的相互之間的關系#65377;
2.2 知識集合中的組合表示
可擴表示:可擴可以分為可加與可積,用表示可加,若事物N0與事物N構成聚合物N′,可記作N0N=N′;同樣地,若C′=C0C則特征C′為特征C0與C之和#65377;例如:印刷型文獻是由圖書#65380;期刊#65380;報紙及特種文獻聚合而成,記為:圖書期刊報紙特種文獻=印刷型文獻;又如:特種文獻=科技報告會議文獻技術標準專利文獻政府出版物學位論文產品資料#65377;
用表示可積,若事物N0和事物N可以構成系統N′,則稱N為N0的可積事物,記作N0N=N′同樣地,若C′=C0C則特征C′為特征C0與C之積#65377;例如:圖書館機構是由其內部各部門組成的一個系統結構,一般包括領導機構#65380;行政機構和業務機構三部分,業務機構通常包括采編部#65380;流通部#65380;閱覽部#65380;信息咨詢部和技術部,可記為:采編部流通部閱覽部信息咨詢部技術部=圖書館業務機構#65377;
可分表示:可分包括聚分和組分,若事物N0=N1N2……Nn,則稱N0是可以聚分的,N0分解為N1,N2,……,Nn,稱為事物的聚分,記作:N0/{N1,N2,……,Nn};例如:特種文獻/{科技報告會議文獻技術標準專利文獻政府出版物學位論文產品資料};又如在《中國圖書館分類法》中,醫藥衛生類(R類)可分解為預防醫學#65380;衛生學,中國醫學,基礎醫學,臨床醫學,內科學,外科學,婦產科學,兒科學,腫瘤學,神經病學與精神病學,皮膚病學與性病學,耳鼻咽喉科學,外國民族醫學,特種醫學,藥學#65377;因此可記為:醫藥衛生/{(預防醫學#65380;衛生學),中國醫學,基礎醫學,臨床醫學,內科學,外科學,婦產科學,兒科學,腫瘤學,神經病學與精神病學,皮膚病學與性病學,耳鼻咽喉科學,外國民族醫學,特種醫學,藥學}#65377;同樣地:農業科學/{農業基礎科學,農業工程,農藝學,植物保護,農作物,園藝,林業,(畜牧#65380;動物醫學#65380;狩獵#65380;蠶#65380;蜂),(水產#65380;漁業)}
若事物N0=N1N2……Nn且N0能分解為N1,N2,……,Nn,稱N0是可以組分的,記作N0∥{N1,N2,……,Nn}如:圖書館業務機構∥{采編部,流通部,閱覽部,信息咨詢部,技術部}
2.3 知識集合中的相關性
2.3.1 事物的相關
對兩個事物N1(t),N2(t)(t為參變量),若c[N1(t)]=f[c(N2(t))]則稱事物N1(t)與N2(t)關于特征C是相關的,記作:N1(t)~(c)N2(t)
例如:影響因子是一個國際上通用的期刊評價指標,它是一個相對統計量,所以可公平地評價和處理各類期刊#65377;通常影響因子越大,期刊的學術影響力和作用也越大#65377;具體算法為:
影響因子=該刊前兩年發表論文在統計當年被引用的總次數該刊前兩年發表論文總數
設N1(t)=中華外科普通雜志,N2(t)=中華泌尿外科雜志,t為時間參數t=2001年,c為影響因子,則:
[N1(t),c1,c1(N1(t))]=[中華外科普通雜志,影響因子,0.556]
[N2(t),c2,c2(N2(t))]=[中華泌尿外科雜志,影響因子,0.556]
由于c[N1(t)]=[c(N2(t))],稱事物N1(t)與N2(t)關于特征C是相關的,即這兩種期刊在學術上的影響力是一樣的#65377;
2.3.2 特征的相關
兩個特征關于同一事物的相關:對事物N(t)的兩個特征c1,c2(t為參變量),若c1[N(t)]=f[c2(N(t))]則稱特征c1和c2關于N(t)是相關的#65377;記作:c1~(N(t))c2
兩個特征關于同族事物的相關:對同族事物{N}的兩個特征c1,c2,若c1[N(t)]=f[c1(N(t))],N∈{N}則稱特征c1和c2關于同族事物{N}是相關的,記作c1~({N})c2
例如:一個檢索系統文獻的組成包括4個部分:在檢出文獻中,與檢索提問相關的文獻;在檢出文獻中,與檢索提問無關的文獻;在未檢出文獻中,與檢索提問相關的文獻;在未檢出文獻中,與檢索提問無關的文獻#65377;因此,可用檢全率#65380;檢準率#65380;漏檢率和誤檢率來衡量檢索效果:
由于c1(N)=1-c3(N);c2(N)=1-c4(N);所以特征c1與c3;c2與c4關于文獻的檢索效果是相關的#65377;記作:c1~(N(t))c3;c2~(N(t))c4#65377;另外,在檢全率和檢全率之間也存在著相關性,即一般來說,提高檢全率會使檢準率下降,提高檢準率也會使檢全率下降#65377;如:提高標識的專指度,可提高檢準率,但會影響檢全率;若降低標識的專指度,則可提高檢全率,但又會影響檢準率#65377;
2.3.3 物元的相關
對物元 R1(t)=N1(t),c1,c1(N1(t))
R2(t)=N2(t),c2,c2(N2(t))
若
c1[N1(t)]=f[c2(N(t))]
則稱R1(t)與R2(t)是相關的,記作:R1(t)~R2(t)
(1)當c1=c2時,若c1[N1(t)]=f[c1(N2(t))],則R1(t)與R2(t)是事物相關的物元#65377;
(2)當N1(t)=N2(t)時,若c1[N1(t)]=f[c2(N1(t))],則R1(t)與R2(t)是特征相關的物元#65377;
3 知識集合物元模型在科研評價中的應用
現代信息網絡技術的發展使得科技論文快速發表成為可能,大量的科研人員可以通過網絡快速發表和傳播自己的科研學術成果#65377;國內的開放存取資源系統也涌現了如中國科技論文在線#65380;中國預印本服務系統和奇跡論文文庫的資源庫#65377;運行于2003年12的中國科技論文在線,5年的時間發展成為一個科研人員“闡述學術觀點#65380;交流創新思想#65380;保護知識產權#65380;快捷論文共享”的平臺,共收錄首發論文共26 358篇#65377;因此共享時代論文的存在形式與傳統形式大為不同,用可擴表示來表示共享時代論文的聚合形式,記為:信息共享時代的論文=期刊論文會議論文開放存取論文#65377;
當前科研管理評價體系的缺陷與局限性#65377;科技論文是科研成果評價的重要依據,在信息共享時代,將網絡發表的科技論文納入現有科研評價體系是必要的#65377;設N1(t)=某期刊上的論文A,N2(t)=開放存取論文網站上的論文B,t為時間參數t=2008年,c為被引次數,則:
[N1(t),c1 ,c1(N1(t))]=[論文A,被引次數,11]
[N2(t),c2 ,c2(N2(t))]=[論文B,被引次數,11]
由于c[N1(t)]=[c(N2(t))],N1(t)與N2(t)關于特征C是相關的,即這兩個論文在2008年的被引次數是一樣的#65377;可以看到,網絡發表的科技論文與在期刊上公開發表的科技論文的指標存在相關,可以比較,因此將網絡發表的科技論文納入現有科研評價體系存在可操作的路徑#65377;
在科研評價體系中,不僅需要對論文本身進行評價,對于發表論文的期刊或網站也需要進行評價,在對開放存取資源進行評價時,評價的系統包括論文與網站,記作:開放存取資源的科研評價=網絡發表的科技論文的評價開放存取網站的評價#65377;對于開放存取網站的評價指標可以參照科技期刊學術標準的評價的數據指標,即總被引頻次#65380;影響因子#65380;載文量#65380;即年指標#65380;論文地區分布數#65380;基金論文比例#65380;被引半期#65380;自引總引比8個方面#65377;記為:R(t)=(N(t),C,V(t))其中:C=cn={c1,c2,……,cn,……}={總被引頻次,影響因子,載文量,即年指標,論文地區分布數,基金論文比例,被引半期,自引總引比};t則表示所選用數據指標進行評價的具體年份#65377;
通過確定知識集合的物元模型我們可以建立信息共享時代的科研評價體系,進行全方面的科研評價,有利于公正#65380;有效的科研管理#65377;
參考文獻
[1]孫倩,郭軍成.關于知識集合論幾個問題的討論[J].河南圖書館學刊,2007,(1):20-22.
[2]劉茲恒,管計鎖.對中國圖書館學研究對象的審視與展望[J].圖書情報工作,2002,(1):45-48.
[3]門寶輝,梁川.城市環境質量綜合評價基元模型及其應用[J].系統工程理論與實踐,2003,23(3):134-139.
[4]蔡國梁,王作雷,黃斌,等.多指標可拓綜合評價方法在城市經濟可持續發展評價中的應用[J].科技通報,2005,21(4):297-301.
[5]陳廣字.可拓評價方法在技術創新項目評價中的應用研究[J].工業技術經濟,2004,23(5):65-71.