薛永琴,劉 華
(1.西北農林科技大學圖書館,陜西楊凌 712100;2.中國科學技術信息研究所,北京 100038)
科技資源是指從事科技活動的人力、物力、財力以及組織、管理、信息等軟、硬件要素的總稱。科技資源是科技創新的重要物質基礎,充分有效地利用各類科技資源對于提升研發水平、增強科技創新能力有著重大作用[1]。然而,隨著科學技術的不斷發展,科技資源呈現來源廣泛、類型多樣、異種異質和異構分布的特點,使得科技資源集成、加工和組織較為困難,進而影響科技資源的服務效率和價值。為了使用戶更加便利地獲取所需要的科技資源,改善科技資源的服務模式進而提升科技資源的服務效率和價值成為亟待解決的問題。
當前關于科技資源服務模式的研究取得了一定的進展,主要包括兩個部分。一是基于科技云的科技資源服務模式研究。科技云是建立在云計算基礎之上,借助云服務理念形成的科技信息資源開發利用和服務的新范式[2]。在此范式中,所有權各異的科技機構、多來源的科技信息以及服務人員整合起來形成資源池,以統一的界面為公眾提供多個級別、多種類型的科技信息資源服務。如游靜等[3]以科技云構建思路為基礎,剖析科技云平臺數據資源、服務功能、用戶對象,提出了政府主導模式下和企業主導模式下的科技云運行模式;張苗苗等[4]通過調研國內多個科技管理數據服務單位,歸納現有的科技管理數據服務模式,并結合科技云的特點進行科技資源的關聯,在此基礎上提出了科技云環境下的科技資源服務模式;葛秋萍等[5]利用大數據等網絡技術,將多來源的科技資源存儲到科技云平臺,提出了包括智能終端層、平臺門戶層、智能處理層和資源庫等構成的新型服務模式。二是面向用戶需求的科技資源服務模式研究。如王宏起等[6]從科技資源需求的時間維度,基于科技資源的現實需求、潛在需求、未來需求等不同需求的特點,提出信息交互、個性化知識推送以及智慧服務模式;張發亮等[7]從區域科技創新活動信息需求的不同層次出發,提出面向大眾需求的基礎性信息服務、面向高層次需求的個性化信息服務、面向重點領域的“一站式”信息服務以及面向科研活動關鍵階段的嵌入式服務相結合的立體式信息服務模式。
綜上可知,當前關于科技資源服務模式的研究主要是從科技資源提供的角度和用戶需求的宏觀維度出發,較少從服務價值的角度開展。服務的本質是滿足用戶的需求,為用戶創造價值,而價值鏈是由創造價值的一系列活動組成,因而構建分布式科技資源協同服務模式與價值鏈密不可分。當今科技資源服務是在網絡環境下進行的,在網絡環境下,傳統的實物價值鏈虛擬化形成信息價值鏈;同時,由于科技資源多元化的特點,需要不同來源的科技資源、不同的服務主體協同配合,發揮“1+1>2”的協同效應,進而提高整體的服務效率和價值。因而,本研究以信息價值鏈理論為指導,結合科技資源及其服務的特點,以提升科技資源服務價值和效率為導向,構建分布式科技資源協同服務模式。為了便于討論,本研究主要聚焦于科技文獻、科學數據、科學儀器以及種質資源等4 種類型的科技資源。
1985 年,Porter[8]在企業競爭優勢的研究中提出了價值鏈理論,指出每家企業都是設計、生產、營銷、交付和支持產品的一系列活動的集合,各活動之間相互關聯、相互影響,形成了價值創造的動態過程,并構成了價值鏈。Grigorescu[9]認為,通過價值鏈可以確定組織所提供的產品或服務的潛在差異來源。隨著產業的升級以及服務業的興起和發展,新的價值鏈觀點將傳統價值鏈與信息元素高度集成和整合,企業的實物價值鏈以信息的形式反映在虛擬的信息世界中,形成企業信息價值鏈。企業的信息價值鏈用于形容企業的信息流動,一般由信息收集、記錄、傳遞、匯總、報告等環節構成。之后,企業的信息價值鏈被延伸到其他領域。總體上,信息價值鏈是指能夠實現信息資源價值流動和增值價值的鏈條。信息價值鏈通過信息的采集、組織、加工、存儲、分析、傳遞等環節分解價值創造過程。
信息價值鏈的核心思想是將信息價值創造的過程分解為不同的環節,每個環節都伴隨著信息的增值。目前,不同的研究對信息價值鏈環節存在差異,但關于信息價值鏈的總體邏輯思想基本一致,整體上包括信息輸入、信息增值以及信息輸出等幾個環節。在科技資源服務中,信息價值鏈貫穿于為用戶服務的整個流程。在本研究中,根據科技資源服務的實際情況,結合信息價值鏈的內涵,科技資源服務信息價值鏈的每個環節都包含著科技資源服務的提供方、需求方和科技資源平臺方三者的對接和交互。例如,信息采集環節對應信息的輸入,包括科技資源信息的采集以及用戶數據的采集;信息加工對應信息的增值過程,是對所采集的科技資源和用戶數據進行加工;信息服務環節對應信息價值輸出,是指用加工后的科技資源對接用戶需求,并根據用戶需求場景提供多種服務方式、為用戶提供服務的過程。
依據上述關于分布式科技資源協同服務信息價值鏈的劃分,提出分布式科技資源協同服務模式框架,如圖1 所示。

圖1 分布式科技資源協同服務模式框架
信息采集環節包括對多來源科技資源的采集和用戶數據的采集,為后續的信息加工和服務環節奠定基礎。科技資源的采集是科技資源共享的基礎,是將多來源、多類型的科技資源信息集成到科技資源平臺(以下簡稱“平臺”)上。科技資源整合是實現科技資源高效利用的基礎[10]。由于多來源的服務提供方對于科技資源的描述方式不同,給科技資源的集成和檢索帶來一定難度,因而平臺針對不同類型的科技資源制定不同的描述模板,使得同一概念的科技資源描述一致、同一類型的科技資源數據格式得到統一;當服務提供方加盟平臺時,其將自身所擁有的科技資源信息按照平臺制定的描述模板導入或登記到平臺,從而將多源異構、異種異質的科技資源信息集成到平臺上,實現了多來源的科技資源信息的采集,為后續科技資源的檢索和利用奠定基礎。
關于用戶數據的采集,它是為了更好地分析用戶的需求,從而為用戶提供符合其需求的服務。用戶即服務需求方在平臺上注冊和訪問之后,平臺可通過技術手段采集到用戶的注冊信息和瀏覽訪問信息。當用戶注冊并登錄平臺時,其基本信息和行為信息直接與其登錄賬號相關聯,當用戶在未登錄狀態下在平臺上瀏覽和檢索信息時,用戶信息無法與其賬號關聯,但在現有技術下,平臺系統記錄用戶的瀏覽軌跡并存儲于本地客戶端內,當用戶再次在本地登錄時,平臺可將其足跡信息關聯到其賬戶內,從而實現平臺對用戶數據的全方位采集。
在信息采集環節對科技資源和用戶數據進行集成的基礎上,信息加工環節對科技資源信息和用戶數據進行加工。對科技資源信息進行加工,是為了提高科技資源的有序化程度,使科技資源之間的關系清晰化,圍繞某一主題的不同類型的科技資源可以集聚為一個整體,幫助用戶快速找到所需要的科技資源,提高科技資源的利用效率。在云計算等相關技術的支持下,科技資源平臺構建科技資源池。科技資源池是一種高效整合不同類型科技資源的架構模式,可以打破各類型科技資源相互分割的局面[11]。在科技資源池中,所有權各異的科技資源整合起來,池中各種不同類型的科技資源相互關聯,使科技資源可以隨需調用、隨取隨用。例如,新型玉米種質資源與檢驗其成分的科學儀器、培育新型玉米的數據集以及研究新型玉米的科技文獻之間建立了關聯,在檢索“新型玉米”時,用戶可以快速檢索到與之相關的種質資源、科學儀器、科學數據以及科技文獻等其他類型科技資源,從而促進科技資源利用率和利用效率的提高。
用戶數據是構建用戶畫像的基礎。用戶畫像主要用于描述用戶角色特征,而用戶的角色特征可以很好地描述用戶需求,因此用戶畫像是平臺以用戶為中心進行設計生產的工具[12]。在科技資源服務中,構建用戶畫像,可以根據用戶畫像的特征縮小供需匹配的范圍,減少因科技資源供需信息不對稱而帶來的供需對接障礙,提高科技資源供需匹配的效率[13]。用戶畫像構建是平臺將信息采集階段所集成的用戶信息進行綜合分析,獲取到用戶的個性化需求偏好以及需求特征,構建用戶的個性化特征模型,然后通過對用戶聚類,從而便于服務系統基于用戶個性化特征和群體特征提供更加符合用戶需求的個性化服務。
對科技資源信息以及用戶數據信息進行加工,構建科技資源池和用戶畫像后,科技資源與用戶需求之間可進行供需對接,由于此時的科技資源和用戶數據都進行了加工,供需雙方信息的對稱性提高,使得供需匹配效率得以提高,在一定程度上也提高了科技資源平臺的服務效率。
信息服務環節是直接面向服務需求方為其提供服務。面對用戶多樣化的需求,科技資源服務系統需要提供多樣化、層次化和個性化服務。綜合考慮用戶需求場景的不同,設計4 種不同類型的服務方式,包括服務推送、服務調度、相關推薦和解決方案服務:(1)服務推送是在用戶沒有明確需求的場景下,平臺通過對用戶歷史行為數據的分析,向用戶推送其可能需要的科技資源;(2)服務調度是在用戶有明確需求時,平臺根據用戶檢索內容為其匹配符合需求的同類型科技資源,并綜合考慮用戶選擇科技資源的影響因素,根據不同用戶對特定因素的敏感程度對同類型的科技資源進行調度,為用戶提供最優的綜合排序方案;(3)相關推薦是指平臺在提供用戶檢索所需科技資源的同時,基于不同類型科技資源的關聯程度向用戶推薦其他類型的相關科技資源;(4)解決方案服務是綜合型的服務,平臺針對用戶較為復雜的需求為其匹配符合需求的多個服務方,多服務方之間協同配合,為用戶提供全流程的解決方案服務。
最后,平臺完成對科技資源或者服務提供方的匹配后,用戶選定一個或多個服務方申請提供服務;平臺在接收到服務申請后,將其對接到服務提供方,服務提供方進行服務響應,通過系統的服務流程為服務需求方提供服務。整個服務流程融合了外部多個服務方形成協同網絡。例如,在服務交易流程中,需要調用第三方支付機構、物流服務商等,實現用戶、服務提供方與第三方的協同,從圖2 可見,在支付結算過程中需要協同第三方支付機構。需求方選擇多個服務時,無需分別向每個服務方支付,系統自動統計總費用進行統一支付;在服務未完成時,需求方支付的費用凍結在第三方支付機構,當需求方確認每種服務完成后,第三方支付機構分別向每個服務方進行費用結算。對于實物科技資源的交易,如種質資源,需要通過線下郵寄方式提供給需求方,因而平臺接入專門的物流服務商,為實物科技資源的線下郵寄提供專業的保障,實現了線上線下的協同服務。除了物流、支付等服務方之外,科技資源平臺還會融入其他類型的服務方,如相關的系統技術運營商、儀器售后服務商等為平臺運營提供技術支持,多服務方之間各司其職、協同配合,創造協同效應,使科技資源平臺能夠持續穩定地運行,為需求方提供更加便捷、高效的服務。

圖2 科技資源服務過程中各方的協同關系
在交易結束后,用戶可對服務進行多維度的評價,系統綜合每個評價維度的信息進行計算,得到用戶關于該服務的評分,然后再綜合計算不同用戶對同一服務的評分,將其作為該項服務的評分。用戶評價可作為服務質量考核評估的依據,也可在進行服務推送時作為用戶個性化偏好的參考,從而促使服務推送更加精準。
通過信息采集、信息加工和信息服務3 個環節,科技資源的服務需求方能夠獲取更加高效、更具價值的服務,有利于增加用戶黏度;服務提供方提供給需求方的不僅是科技資源,還有具有價值的引申服務,并從服務中獲取一定的酬勞,可以激勵其積極進行科技資源的共享和服務;而平臺為服務需求方和服務提供方進行供需對接搭建了“橋梁”,促進了科技資源更好地被利用。
上述4 種科技資源服務模式的應用需要來自多方的科技資源和服務主體的協同,因而針對每種服務方式的應用場景提出不同的協同策略。
服務推送方式是通過用戶的基本信息和歷史行為軌跡信息發現用戶的需求偏好,在新用戶注冊登錄平臺或者用戶訂單完成后沒有其他新的明確需求時,為其推送可能需要的資源和服務。目前比較流行的服務推送方法包括基于內容的服務推送和基于協同過濾規則的服務推送,但這兩者均存在不足之處。本研究構建的服務推送模式綜合了以上兩種方法的優勢,可提高服務推送的精確度,具體如圖3所示。

圖3 科技資源服務推送流程
首先,服務系統從用戶歷史行為數據中抽取關鍵詞并進行特征表示,形成用戶興趣描述。針對不同類型的科技資源,用戶關注的科技資源特征不同,具體如表1 所示。在用戶行為中,從不同來源抽取的特征詞的表達力度不盡相同,用戶屬性數據中的專業領域和研究方向等信息反映的是用戶大致的需求方向,是粗粒度的潛在需求表達;用戶訂單數據反映的是用戶較為明確的研究方向,是細粒度的明確需求表達。訂單時間越近,越能表明用戶當前的研究主題。

表1 各類科技資源的主要特征項
其次,計算用戶相似度。基于內容的推送是根據用戶偏好的科技資源與平臺科技資源池中的資源進行相似度計算[14]。從用戶行為數據中獲取科技資源的元數據,科技資源i的特征表示如下:

式(1)中:ci為科技資源的元數據項;vi為每個元數據項的值。
將Si與系統中的科技資源元數據進行相似度計算,科技資源i和j的相似性為Sim(Si,Sj),Sim 計算結果值越大,表明兩種科技資源相似性越大。設置一定閾值,假設S1與S2的相似度超過這個閾值,用戶A偏好科技資源S1,則為用戶推送S2;所有與用戶A偏好相似的其他科技資源納入“結果列表1”(見圖3)。
基于協同過濾的服務推送,是通過分析用戶之間的相似性程度,為用戶推送相似用戶偏好的科技資源[15]。將用戶行為數據特征化表示,用戶特征化即為用戶打標簽[16]。從用戶數據中提取科技資源相關的文本描述,并從中提取關鍵詞作為特征詞;根據關鍵詞的特點進行加權,如從較近訂單中提取的關鍵詞權重較高,從而形成用戶的特征向量集合。如用戶1 的特征向量集合表示為:

式(2)中:tkl為從用戶k的數據中抽取的第l個關鍵詞;wkl為關鍵詞tkl的權重。
關鍵詞加權規則是根據詞頻、所屬的用戶行為類型、時間等因素進行加權,如收藏行為的權重一般高于瀏覽行為權重、時間越新越能反映用戶當下的偏好等。假設加權因素有a個,且用戶k的特征詞tkl在用戶k的歷史行為數據中共出現y次,則tkl的權重計算公式如下:

用戶特征向量的相似度Sim(Uk1,Uk2)反映用戶之間偏好的相似度,相似度的值越大表示用戶1 和用戶2 的偏好相似度越大。對相似值設定一個閾值,當大于該值時,用戶之間聚為一類。假設用戶1 與用戶A相似度最大,則選擇用戶A特征詞集TA減去用戶1 的特征詞集T1形成的結果集合中的特征詞作為關鍵詞在系統中檢索,將檢索結果進行篩選排序,納入到“結果列表2”(見圖3)。
最后,優先選擇“結果列表1”和“結果列表2”中的交叉資源進行推送,之后對單個列表中的科技資源進行綜合排序,選擇排序靠前的科技資源進行推送。
整個服務推送過程體現了用戶信息和科技資源之間的協同:為一個用戶推送資源,需要在大量的其他用戶信息之間進行協同和匹配,用戶信息和科技資源進行對接匹配,用戶信息和科技資源之間也進行了協同,產生協同效應,為用戶提供了便利。服務推送過程中所采用的如協同過濾技術等服務推送方法已經較為成熟,已應用在如淘寶、攜程等多個平臺,為用戶推薦其喜愛的資源,因而這一服務方式切實可行。
在本研究中,服務調度主要表現為針對多來源、多類型的科技資源進行服務調度,即用戶通過平臺“一站式”的資源檢索系統查詢所需資源,平臺分析用戶需求,從平臺科技資源池中匹配到所有符合需求的多來源的科技資源,同一類型的資源來源和服務方式不同,因而基于一定的服務調度規則對服務進行排序。如圖4 所示,用戶A查詢“太陽能電池測試儀”得到多種符合需求的儀器,但不同的儀器在來源、價格、參數、服務周期等方面存在差異,則平臺基于對用戶歷史行為偏好的分析,獲取其對于儀器來源、價格等因素的敏感度,通過服務調度,對多種科學儀器進行排序,為用戶提供符合其需求偏好的最優科學儀器。所謂服務調度規則是,基于用戶的基本信息、動態行為偏好信息、所需科技資源相關性以及服務方的相關因素等而對服務提供的結果進行優先排序。其中,用戶相關因素包含用戶的專業、領域等基本信息及其瀏覽、檢索、訂單等信息;科技資源相關因素一般包括科技資源基本描述信息以及來源、價格信息等;服務方的相關因素包括服務方的資質、服務周期、服務評分等。對于不同類型的科技資源,用戶的需求偏好不同,如用戶對于科技文獻資源更偏好免費的、發表時間較新的文獻,而對于科學儀器可能更注重科學儀器的性能和服務周期等,因此,調度規則在不同類型科技資源之間存在差別。

圖4 科技資源服務調度流程
假設服務調度的參考因素有m個,分別為P1,P2,,Pm,計算每個參考因素下的資源得分分別為x1,x2,,xm,每個因素的權重分別為a1,a2,,am則每項資源總得分的計算公式如下:

由式(4)可得到得分值高的被優先排序。由于每個參考因素的權重受到用戶行為偏好的影響,因而權重值具有動態性。設m個參考因素的初始權重均為1/m,用戶k對于參考因素g的動態權重akg,計算用戶所有歷史數據中關于參考因素g的得分的平均值,記為Avekg,再計算全體用戶關于參考因素g的得分的平均值,記為Aveg,則參考因素g的動態權重的計算公式如下:

服務調度是對不同來源的同一類型的科技資源進行調度,不同來源科技資源之間產生了協同效應,通過排序的方式為用戶提供最優的服務方案,減少用戶查找科技資源的時間,提高了用戶獲取科技資源的效率。
相關推薦與服務調度的應用場景是一致的,都是基于用戶查詢后進行;與服務調度不同的是,相關推薦是在用戶實時查詢的情境下,系統匹配到符合用戶查詢信息的科技資源后,基于不同類型科技資源的關聯性為用戶推薦其他類型的相關科技資源(見圖5)。例如,用戶A檢索主題為“太陽能電池銀漿”的科技文獻,系統為其匹配到相關的科技文獻,在此基礎上,基于不同類型科技資源的關聯關系,進一步為用戶推薦太陽能電池檢測儀等科學儀器以及某太陽能電池檢測數據等有關科學數據資源。可見當用戶在平臺上查詢某類科技資源后,平臺從科技資源池中匹配多來源的、符合用戶檢索信息的資源,與此同時,基于不同科技資源之間的關聯性,為用戶匹配與檢索匹配結果相關聯的資源,從中選擇相關度較高的資源推薦給用戶。

圖5 科技資源服務的相關推薦流程
科技資源之間的關聯,主要包括主題關聯、學科關聯以及引用關系產生的關聯。(1)主題關聯是從科技資源元數據的描述文本中抽取主題概念,并對主題概念進行加權,常用的加權方法為詞頻-逆文獻頻率法(term frequency-inverse document frequency,TF-IDF),加權后得到科技資源的主題特征集合,然后計算科技資源主題之間的相關度,相關度越高表明兩種科技資源之間的關聯度越大。(2)學科關聯是將不同類型的科技資源的分類元數據映射到同一種分類體系下,計算科技資源之間的相似度。假設有科技資源Re和Rf,且Re和Rf屬于不同類型的科技資源,將這兩類科技資源按照統一的學科分類體系C進行分類,Re和Rf分別屬于類型E和類型F,計算E和F之間的相似度。(3)引用關系一般針對科技文獻和科學數據資源,文獻和數據之間的引用關系產生了關系網絡,通過計算這兩種科技資源之間的關聯度確定其相關性。綜合上述3 種關聯方式,選取合適的閾值,得到相關科技資源集合,最后對科技資源集合進行篩選,并基于資源相關度、價格、距離等因素進行排序,最終為用戶提供優選推薦的科技資源。
在相關推薦過程中,平臺基于不同類型科技資源之間的關聯為用戶推薦相關科技資源,通過關聯聚合使得在用戶檢索科技資源時,不同類型的科技資源之間可以實現協同,不同類型科技資源產生了協同效應,用戶只需要進行一次檢索就可獲得不同類型的科技資源,為用戶提供了便利。其中所采用的資源關聯技術是基于科技資源元數據的文本信息進行關聯,而采用元數據進行關聯在圖情學領域已經較為成熟,因而此服務方式同樣切實可行。
解決方案服務分為提交需求、需求描述、服務響應、服務實施以及支付結算等幾個過程。(1)首先,當用戶存在相關需求時,可在平臺上提交需求,平臺對用戶提交的需求進行審核。(2)平臺審核通過后,系統對用戶的需求進行描述,將復雜的需求分解為多個簡單需求,確定服務所需的科技資源基本要求和服務項目需求;同時在平臺專家的幫助下,根據需求梳理出解決方案執行流程,并從系統中匹配各類型的服務方,形成服務方列表供用戶選擇。(3)用戶根據需求選擇多類型的服務方提供服務,被選中的服務方進行服務響應,并組成虛擬的在線團隊進行網絡在線協同服務,在線協同的結構要素包括規范、地位、角色和權威[14],關鍵要素包括制度、角色及流程,即團隊與用戶簽署服務協議,規定服務周期、服務費用以及知識產權歸屬等問題,服務方之間也需要簽署合作協議,協議內容包括服務方之間科技資源共享和服務對接的要求、服務方之間的利益分配規則等。(4)用戶與服務方團隊、服務方之間簽訂協議后,根據服務流程提供服務,在整個服務過程中平臺進行全流程跟蹤監控,以保證服務的順利進行;服務完成后,用戶進行服務結果的驗收,其中解決方案服務與其他類型服務不同,服務周期一般較長,若用戶對服務結果不滿意,平臺專家團隊需要不斷與用戶交流溝通,綜合用戶的反饋信息不斷調整服務方案,直到滿足用戶需求為止。(5)用戶對所接受的服務進行合格驗收后,與服務方團隊進行交易結算,向服務團隊支付費用并完成知識產權轉移,之后服務方之間按照合作協議進行利益分配;交易結束后服務完成,虛擬團隊解散。
如圖6 所示,用戶在平臺提交的需求為“某Ⅰ和Ⅱ兩種型號玉米的對比分析報告”,平臺通過對此需求進行描述,將需求分解為兩種型號玉米樣本和相應的檢測科學儀器,以及對檢測結果進行分析的分析機構;系統匹配到所需的科技資源,假設用戶選擇玉米樣本的種質資源所有方O1和O2、檢驗檢測的科學儀器所有方O3以及進行數據分析并撰寫報告的服務方O4。平臺通過設置服務流程,使O1和O2將玉米樣本提供給O3,O3進行檢測后再將檢測結果數據提供給O4,O4對檢測結果進行分析、生成報告,最后提交給用戶。整個由O1、O2、O3、O4共同完成的服務稱為一整套全流程的解決方案服務。解決方案服務不僅需要為用戶提供多樣性的科技資源,還需要服務方利用專業知識為用戶解決問題,在具體服務過程中根據既定流程為不同的服務方分別提供服務,服務方之間協同合作、相互配合,從而形成一整套的全流程解決方案,體現了不同服務主體之間的協同。

圖6 科技資源服務的解決方案服務流程
經過幾十年的發展,我國科技資源服務取得了巨大的成就,基本保障了用戶的科技資源的可獲得性,但隨著網絡環境下用戶需求日趨多樣化,科技資源服務需要重視提升服務價值,提供更具針對性、更有價值的服務。本研究從信息價值鏈理論出發,以提升服務價值為目標,提出了分布式科技資源協同服務的模式框架和具體的協同策略,可以促進科技資源的利用率和利用效率的提高。需要注意的是,在上述各類服務模式的實際應用中,還需要科技資源協同服務機制的支撐,如資源統一描述機制、服務調用機制、激勵機制、利益分配機制等,以更好地促進分布式科技資源服務平臺的推廣和使用。