999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

專利分析報告內容要素標引質量控制機制研究

2017-06-03 09:30:25張靜
現代情報 2017年5期
關鍵詞:質量控制機制

〔摘要〕專利分析報告是針對世界上最大的技術信息源專利而進行的情報分析產品,能為決策者提供較為全面的技術信息。而專利分析報告內容要素全面準確的揭示則是其價值最大化發揮的重要基礎。本文總結了中文專利分析報告需標引的內容要素及其特點,根據其內容要素文本特征來選取相應的標引方式,并分析了中文專利分析報告標引質量的影響因素,從而構建科學合理的標引質量控制機制。

〔關鍵詞〕專利分析報告;內容要素;標引;質量控制;機制

DOI:10.3969/j.issn.1008-0821.2017.05.006

〔中圖分類號〕G25553〔文獻標識碼〕A〔文章編號〕1008-0821(2017)05-0033-04

A Study of Indexing Control Mechanism for the

Content Elements of the Patent Analysis ReportsZhang Jing1,2,3

(1.Library of Chinese Academy of Sciences,Beijing 100190,China;

2.University of Chinese Academy of Sciences,Beijing 100049,China;

3.Archives of Chinese Academy of Sciences,Beijing 100190,China)

〔Abstract〕Patent analysis reports are carried out to provide more comprehensive technical information for policy-makers according to patent,the worlds largest technology information source.The fully and accurately indexing for content elements of the patent analysis reports is an important foundation to maximize its value.The content elements required indexing and its characteristics of Chinese patent analysis were summarized to select the appropriate indexing method.Then the factors affecting the indexing quality were found to build a scientific and rational indexing control mechanism.

〔Key words〕patent analysis report;content elements;indexing;quality control;mechanism

戰略決策的制定必須依據一定數量的可靠信息[1]。而專利是技術創新和科學技術發明的產物,是世界上最大的技術信息源,全世界技術成果的80%都能在專利文獻中找到[2]。相比其他信息資源,專利文獻具有內容新穎、系統詳盡、格式規范、分類科學等特點[3],是重要的戰略情報分析數據來源。通過專利分析能夠為決策者提供較為全面的技術信息:產業發展現狀、技術背景信息、關鍵發明技術路線、核心研究團隊、主要競爭者及其技術布局等內容,能有效地支撐決策者評估技術前景、發現新的人/物等技術資源、認知自己現有技術的改進點、發現解決特殊技術問題的方法或途徑、預見未來技術布局重點等。

作為專利情報分析的主要產品,針對專利分析報告進行長期保存,有利于維護已有研究成果,便于研究方法與成果的交互與共享,為后續相關研究及決策提供借鑒與數據支持,減少科研資源的重復配置,更充分地發揮已有成果的價值。而種種目的能夠達成的基礎在于,能夠針對情報研究人員及決策者的使用目的,持續、有效地對專利分析報告進行標引。而針對專利分析報告的利用更多的是基于內容要素的,因此需要對專利分析報告內容要素的標引管理機制進行科學合理的設計與規劃。

1專利分析報告內容要素及其特點

專利分析報告是對專利說明書與專利公報中大量的專利信息進行分析、加工、組合,并利用統計學方法和各種信息處理技術將之轉化為具有總攬全局及預測功能的情報[4]產出,是專利情報分析人員與技術專家合作分析產出的智力成果,具有主題集中、分析數據來源多樣、報告格式較為規范、分析層次多、技術分析內容豐富、分析結論較為正式等特點。

整體來說,專利分析報告內容的特點為:①基于不同的分析目的,分析框架會有所不同;②通常一份報告會涵蓋多數據庫、多檢索策略;③包含針對技術的細分框架;④可視化形式多樣;⑤技術專家的參與對分析方向有重要作用;⑥包含核心/重點專利著錄與內容信息;⑦縮寫及技術領域等編號內容較多。通過總結,可以發現中文專利分析報告需要標引的內容要素及其子要素,見表1。表1專利分析報告需標引的內容要素及其子要素

內容要素子要素時間數據采集時間、分析完成時間人員分析人員、技術專家分析領域上位領域、子領域、技術框架分析框架——檢索策略數據源、檢索式分析指標統計性、描述性、趨勢性、組合指標圖柱/條等統計圖、地形圖、氣泡圖、引證圖等表二維表、三維表……文字技術背景、圖表解釋、結論核心專利信息專利號、題名、申請時間、授權時間、法律狀態、同族信息、專利權人等技術領域IPC、MC、EC、UPC等縮寫國家代碼、文獻類型代碼、機構名稱縮寫、專有名詞縮寫等

21標引方式選取原則

人工標引與自動標引兩種主要方式中,人工標引能有效利用人的智能,識別程度較高,但Cleverton[5]指出,人工標引存在較高的標引一致性的問題,并且完全人工標引已經無法適應信息時代的信息增速;而自動標引在規則內可以有效解決一致性與工作量的問題,但卻存在準確率與召回率不高的問題。黃紹杉等采用條件隨機場方法對英文專利摘要信息進行自動抽取,提交第八屆日本國立信息學研究所信息檢索和獲取系統測試集(NTCIR-8)評測會議的參賽結果為準確率接近04,召回率尚不到016[6]。考慮到專利分析報告涵蓋的內容遠多于專利摘要的信息,且中文資料尚有分詞等獨特問題的存在,針對專利分析報告的完全自動標引質量尚有待商榷。

正如Lancaster和Warner所說,自動標引技術距離完全實際應用仍有很長的距離,只有機器具有足夠智能,才能完全替代人類完成這項重要工作[7]。因此在目前的技術條件下,專利分析報告的標引不能完全直接依賴自動標引技術,應通過人的監管,保證標引結果一致性與完備性的同時,通過機器學習等手段,在標引工作中不斷豐富完善基礎知識庫,以實現自動標引系統的長期完善。只有人工和自動標引相結合,才能提高標引效果與標引效率,才有利于標引工作的持續發展。

總的來說,專利分析報告標引方式的選取需要遵守以下幾個原則:①不盲目追求“全自動”,要以提高標引質量,便于長期保存和用戶再利用為首要目標;②在標引人員監控下,由計算機完成的工作是較為可靠的;③計算機做不好的,要由標引人員來做,如對戰略情報研究成果的主題詞標引;④計算機做得不好的,標引人員要給予輔助;⑤采取各種手段,如機器學習等,讓計算機做更多的工作,逐步提高自動化水平。

22專利分析報告內容要素文本特征及標引方式

專利分析報告的內容要素具有如下文本特征:①技術領域通常有一個不斷細化的過程,具有相應的上下位關系;②技術領域作為分析的重點,是專利分析報告的核心信息,會在報告中反復出現;③時間、人員、檢索策略等內容要素具備明確的指示文本標志,通常也都在特定位置出現;④分析指標多樣、表述方式多樣、展示形式多樣、涉及計算方法、含義、解釋等多方面的信息內容。

總體來說,中文專利分析報告格式較為規范,除文字描述關鍵信息及分析指標外,其他內容要素多有相對穩定的文本特征,見表2。

表2中文專利分析報告內容要素文本特征及標引方式

內容要素文本標志位置適合的標引方式時間數據采集時間截止到、檢索時間、檢索日期摘要/檢索策略附近自動分析完成時間——報告封面下方自動人員分析人員負責人、完成人、分析人員……報告封面自動技術專家院士、教授、博士……致謝、完成人員中自動分析領域上位領域領域報告標題、分析內容反復出現自動+人工子?領?域領域、技術方向一級標題、相應部分反復出現自動+人工技術框架——內容分析表格、標題層次自動+人工分析框架——目錄、摘要、報告起始部分自動+人工表2(續)

內容要素文本標志位置適合的標引方式檢索策略檢索策略、檢索式、數據來源腳注、附錄自動分析指標——圖/表標題、相應部分多次出現自動+人工圖、表圖、表正文中的圖表標題自動文字技術背景——報告開始部分的定性描述自動+人工圖表解釋見圖、見表……正文圖表標題上下自動+人工結論結論、建議、啟示摘要、小結自動+人工專利專?利?號專利、國家代碼縮寫+數字自動其他著錄信息——專利信息一覽表格、正文專利號

后的描述文字自動+人工技術內容采用……解決……、主要……專利號后的文字描述、列表自動+人工技術領域IPC、MC、EC、UPC……表頭、表名注釋、正文自動縮寫——列表解釋自動

結合前述標引方式的選取來看,時間、人員等有相對固定位置及文本標志的內容要素適合采用自動標引的方式進行抽取,人工適當檢驗即可,可以減少人員工作量;技術領域、框架及解釋性文字關鍵信息的抽取就必須加入人工干預,以在保持標引結果一致性的基礎上,提高對關鍵技術信息揭示的準確與完備程度。值得注意的是,專利分析指標的分析內容與層級是專利分析報告定量分析的核心,雖然分析指標的種類與數量在一定時間內具有窮舉性,但其表述及展示方式的多樣性決定了它必須增加人工干預進行指標表述方式的歸一化處理,同時不斷完善分析指標表述及展示庫,以提升自動標引系統的能力。

3專利分析報告標引流程及質量影響因素

專利分析報告的標引工作遵循文獻標引工作的一般流程,包括5個基本步驟:查找并利用已有標引成果、主題分析、轉換標識、標引記錄和標引成果著錄、審核[8]。這是一項復雜的技術性工作,標引質量受各個工作環節的制約。

使用5M因素分析法,經過頭腦風暴,并與專家討論后,得出圖1所示的影響專利分析報告標引質量的相關因素:標引人員、專利分析報告、進行標引工作的技術平臺,以及制度環境。圖1專利分析報告標引質量影響因子

1)標引人員是與標引質量直接相關的重要人物因素。標引工作是一項需要耐心與細致的工作,標引人員的工作態度好,用于標引工作的時間足夠,則工作會比較細致,標引質量會較高。標引人員關鍵信息識別能力越高,則能更準確地把握專利分析報告內容的核心,對其內容要素的描述也就更到位。

2)專利分析報告是標引的“原料”。其標引的格式規范程度越高、信息點越完備,專利情報研究及決策者所需信息揭示得越充分,其日后的利用價值也越高。

3)標引工作進行的技術平臺是標引工作的硬件條件,系統設計的越細致、越規范、越易用,則越有利于標引工作的規范性開展,有利于提高標引質量;系統的可擴展性越強,越有利于針對新出現的問題隨時修改,有利于標引流程與規范的完善;更為重要的,自動標引系統中針對專利分析報告關鍵信息的文本特征庫越完備,越有利于提高系統自動標引的準確性。

4)環境因素主要包括與標引工作相關的管理規范與要求。管理層越重視標引工作、對標引工作的工作量與績效設置越合理,就越能激發標引人員的工作積極性;標引規則越完善、質量控制流程越合理,越有利于規范標引人員的工作,能夠提高標引質量。

4專利分析報告標引質量控制機制

有效提升專利分析報告標引質量的關鍵在于針對影響標引質量的因素構建相應的關鍵環節質量控制機制,見圖2。

圖2專利分析報告標引質量控制機制

1)標引方式的選取是有效進行標引質量控制的核心。針對不同內容要素及其文本特征,選取恰當的標引方式。能夠在減少人工工作量,提高標引效率與標引結果一致性的同時,提高關鍵信息的標引結果準確性與完備程度。

2)構建嚴格合理的標引工作流程,設置相應崗位,是減少系統誤差的重點。①針對不同環節設定專職或兼職崗位,明確各個崗位的職責及細致的操作規范,責任到人;②在各環節的崗位職責上,下一環節有責任檢查上一環節工作;③計算機與人工檢查相配合進行質量控制;④美國國會圖書館提出了書目社會化的構想,在Web20時代,專利分析報告的標引工作也可以逐步吸引用戶參與,以便更貼近用戶需求。

3)制定嚴格的標引規則,是提升人工標引一致性和自動標引內容完備性的重要手段。針對專利分析報告,必須標引哪些內容要素,不同內容要素的標引規范及加工標準都需有細致考慮,并在實際工作中不斷完善。

4)內容要素文本特征庫的構建與完善機制是不斷提升人工標引與自動標引質量的重要前提。內容要素文本特征是人工標引與自動標引過程中的重要參照標準,在很大程度上會對標引結果的一致性及完備性產生重要影響,因此在人工干預過程中,需要對計算機識別有問題的文本特征進行糾正,并補充進入新的文本特征供機器學習及其他人員共享。

5)制定科學合理的管理規范,創造良性標引工作環境,是專利分析報告標引工持續發展的重要保障。管理規范涉及多方面內容:人員績效考評機制、人員培訓提升機制、對技術平臺維護和升級的相應規定、各規定的完善機制等。

5小結

針對世界上最大的技術信息源專利而進行的情報分析產品,即專利分析報告,能為決策者提供較為全面的技術信息。而專利分析報告內容要素全面準確的揭示則是其價值最大化發揮的重要基礎。

自動標引是信息時代標引工作的發展方向,但現階段的技術水平決定了目前專利分析報告的標引工作需要根據需標引的內容要素特點及其文本特征選取標引方式,即某些關鍵信息的標引必須加入人工干預。

因此,為了實現標引結果一致性與完備性的最優,專利分析報告標引需要針對各環節的質量影響因素構建合理的標引流程,設置相應崗位,制定細致明確的崗位規范與標引規則,構建相應的內容要素文本特征庫并不斷完善,按照科學合理的管理規范來實現專利分析報告標引工作的持續發展。

參考文獻

[1]唐煒.面向戰略決策服務的專利分析指標研究[D].北京:中國科學院文獻情報中心,2006.

[2]MBlackman.Provision of patent information:a national patent office perspective[J].World Patent Information,1995,17(2):115-123.

[3]胡阿沛,張靜,張曉宇.基于專利文獻的技術演化分析方法評述[J].現代情報,2013,33(10):172-176.

[4]賴院根,朱東華,胡望斌.基于專利情報分析的高技術企業專利戰略構建[J].科研管理,2007,(9):156-162.

[5]Cleverton,CW..Optimizing Convenient Online Access to Bibliographic Database[J].Information Services and Use,1984,(4):37-47.

[6]黃紹杉,喬曉東,桂婕,等.基于條件隨機場的專利摘要信息抽取研究[J].數字圖書館論壇,2010,(9):7-12.

[7]Lancaster,FW.and Warner A.Intelligent Technologies in Library and Information Ser-vice Applications.Medford,NJ,Information Today,2001.

[8]劉湘生,汪東波.文獻標引工作[M].北京:北京圖書館出版社,2001:46-60.

猜你喜歡
質量控制機制
構建“不敢腐、不能腐、不想腐”機制的思考
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
定向培養 還需完善安置機制
中國衛生(2016年9期)2016-11-12 13:28:08
高層建筑主體結構施工技術及質量控制研究
淺析建筑工程施工管理
淺談機車總風缸的制作質量控制
科技視界(2016年21期)2016-10-17 17:58:28
淺談在公路橋梁施工環節的質量管理及控制
科技視界(2016年20期)2016-09-29 13:11:33
淺談石灰土基層施工及質量控制
科技視界(2016年20期)2016-09-29 13:10:51
黃土路基臺背回填的質量控制
科技視界(2016年20期)2016-09-29 13:10:08
破除舊機制要分步推進
中國衛生(2015年9期)2015-11-10 03:11:12
主站蜘蛛池模板: 美女无遮挡免费视频网站| 欧美国产综合视频| 极品尤物av美乳在线观看| 黑人巨大精品欧美一区二区区| 国产中文在线亚洲精品官网| 无码粉嫩虎白一线天在线观看| 亚洲狼网站狼狼鲁亚洲下载| 99热这里只有精品5| 少妇精品在线| 亚洲综合国产一区二区三区| 亚洲第一区在线| 国内精品久久久久鸭| 九九视频免费在线观看| 在线播放真实国产乱子伦| 亚洲 日韩 激情 无码 中出| 国产日韩欧美视频| 国产一区二区影院| 成人在线观看不卡| 国产精品私拍99pans大尺度| 日韩a级片视频| 影音先锋亚洲无码| 制服丝袜国产精品| 精品小视频在线观看| 欧类av怡春院| 91精品啪在线观看国产91| 国产精品一区二区在线播放| 亚洲女人在线| 一区二区欧美日韩高清免费| 性欧美久久| 99久视频| 精品无码一区二区在线观看| 91国语视频| 欧美在线伊人| 国产中文在线亚洲精品官网| 视频一区视频二区日韩专区| 精品在线免费播放| 爽爽影院十八禁在线观看| 色妞www精品视频一级下载| 亚洲视频欧美不卡| аⅴ资源中文在线天堂| 一区二区三区四区日韩| 日韩中文无码av超清| 午夜福利视频一区| 婷婷六月在线| 88av在线| 色天堂无毒不卡| 女人18毛片一级毛片在线 | 欧美精品影院| 高潮爽到爆的喷水女主播视频| 中国丰满人妻无码束缚啪啪| 蜜桃视频一区| 日韩成人午夜| 色综合网址| 综合社区亚洲熟妇p| 就去吻亚洲精品国产欧美| 国产色网站| 亚洲免费成人网| 四虎在线高清无码| 日韩欧美国产成人| 亚洲天堂区| 亚洲国产看片基地久久1024| 最新国产高清在线| 中文字幕精品一区二区三区视频 | 人妻少妇乱子伦精品无码专区毛片| 美女扒开下面流白浆在线试听| 99热精品久久| 亚洲AV色香蕉一区二区| 久久精品日日躁夜夜躁欧美| 一本大道视频精品人妻| 五月激情婷婷综合| 永久免费无码日韩视频| 精品无码视频在线观看| 99热这里只有精品在线观看| 国产精品主播| 亚洲AV无码一二区三区在线播放| 亚洲av无码牛牛影视在线二区| 久久不卡国产精品无码| 成人国产小视频| 欧美色香蕉| 九九精品在线观看| 日韩国产 在线| 国产日韩欧美精品区性色|