劉壯 謝文亮 張悅
[摘要]基于區塊鏈技術去中心化、分布式存儲、智能合約、可追溯和不可篡改等特征,醫學期刊可將其應用于用戶畫像研究中。研究分別從用戶畫像數據收集、處理、存儲和安全四個方面,闡述區塊鏈理念在醫學期刊用戶畫像研究中的具體應用策略。研究結果有助于推動醫學期刊用戶畫像數據在文章投稿、精準推送和學術不端等方面的具體應用,促進醫學期刊采編系統從傳統投稿和審稿服務向價值服務轉變,從而為構建融媒體時代下醫學期刊的智能出版提供有力支撐。
[關鍵詞]區塊鏈;醫學期刊;用戶畫像;智能出版
近年來,隨著互聯網技術的飛速發展,用戶畫像(User Persona)在電子商務、社交媒體、金融、醫療保健及圖書館等領域的應用越來越廣泛。用戶畫像的概念最早由交互設計之父Alan Cooper提出。用戶畫像是在目標用戶的一系列真實行為的基礎上進行數據挖掘,通過對用戶構建標簽化的模型,推測用戶的真實需求和偏好,從而為用戶提供個性化的服務[1-2]。在社交媒體中,用戶畫像可以幫助運營者全面了解用戶的喜好及行為規律,進而精準劃分用戶類別,為用戶提供精準推送服務[3]。在圖書館智慧服務中,用戶畫像可再現讀者的樣貌、挖掘其閱讀需求與價值,管理者可基于此有針對性地調整管理策略,提升圖書館讀者管理服務體驗[4-5]。出版社將用戶畫像應用于期刊出版工作,可以充分挖掘期刊用戶相關數據,發現目標用戶并分析用戶需求,為期刊用戶提供精準、個性化的服務。醫學期刊的用戶畫像是在深入了解醫學期刊用戶的行為特征及其真實投稿需求的基礎上,對用戶特征標簽化并構建模型,有助于醫學期刊實現智能出版,為醫學期刊用戶提供精準化的知識服務。
目前,醫學期刊用戶畫像的應用面臨較嚴峻的現實困境。為進一步拓展醫學期刊用戶畫像服務的深度和廣度,文章引入區塊鏈(Block Chain)技術作為解決方案。區塊鏈概念最早由中本聰(Satoshi Nakamoto)
在其學術論文中提出,其本質是綜合了分布式數據存儲、點對點傳輸、共識機制和加密算法等計算機技術的一種新型應用模式[6]。區塊鏈可以為數據和交易的各個環節提供安全、不可篡改的記錄方式,在各個節點通過共識機制解決彼此信任的問題,醫學期刊利用區塊鏈技術來存儲數據將更加安全和可信[7]。
區塊鏈技術作為中國數字經濟發展的新動能[8],為醫學期刊用戶畫像的應用提供了強有力的技術支撐,而國內尚未有學者對區塊鏈技術在醫學期刊用戶畫像中的應用進行相關研究。因此,文章試圖從用戶畫像數據收集、處理、存儲和安全四個方面分析區塊鏈技術在醫學期刊用戶畫像中的應用,并提出具體的思路和方法,為醫學期刊建構新型用戶畫像的數據服務模式提供參考。
一、區塊鏈技術和用戶畫像概述
(一)區塊鏈技術概述
區塊鏈利用共識算法與分布式技術,通過加密形成相互關聯且保存每次交易記錄的數據塊,在此基礎上驗證信息的有效性并生成下一個區塊,并以此建立一種新型的信任機制[9]。目前,區塊鏈技術已在金融、物流、醫療保健業和教育等領域廣泛應用,與各行各業的創新性融合正加速進行,為各產業發展賦予新的動能。
目前,區塊鏈在學術期刊出版領域的應用受到研究者的重視。區塊鏈的去中心化、加密管理、共識機制和智能合約等功能,可以讓醫學期刊的出版過程更加安全、公平和可信,為醫學期刊出版流程的標準化提供技術支持,有利于實現醫學期刊出版服務的規范化管理[10]。羅飛寧針對學術期刊中的學術評價體系建設、著作權精準識別、學術資源共享和學術不端治理等方面探索了區塊鏈技術的應用[11]。賀月月等人分析了區塊鏈技術在科技期刊出版中可能的應用場景,并探討了區塊鏈技術應用于科技期刊出版面臨的難點和挑戰[12]。黎麗華通過研究,發現區塊鏈技術是數字時代發展的基礎,在助力學術期刊高質量發展方面大有可為,為學術期刊產業發展帶來革命性的影響[13]。
總而言之,區塊鏈技術對學術期刊出版業的重塑是前所未有的。去中心化是區塊鏈最突出的特有屬性,區塊鏈不依賴中心化的第三方機構,而是基于協商一致的規范,各節點數據自我驗證、存儲、維護和傳輸。時間序列指區塊鏈的鏈式區塊結構數據帶有時間戳,可驗證和可追溯。區塊鏈采用非對稱加密技術,可確保數據的不可篡改和不可偽造。可編程性使區塊鏈技術通過靈活的腳本代碼為用戶研發高級智能應用提供技術支持。可以看出,區塊鏈技術對提高醫學期刊出版效能具有重要的現實意義與實踐價值。
(二)用戶畫像概述
用戶畫像又稱為用戶角色或人群畫像,指通過收集與分析用戶的個人屬性、生活習慣和行為特征等信息,全方位、立體化地對用戶標簽化的過程[14]。用戶畫像通過一系列真實數據,可挖掘用戶需求和構建特征模型,能夠清晰地代表和區分不同群體。構建用戶畫像的主要目的是深度了解用戶,推測用戶的現實和潛在需求,進而向用戶推送精準化、個性化的信息[15]。
學術期刊構建用戶畫像能夠全方位地了解核心讀者、作者以及專家群體,掌握用戶群體的特征信息,為用戶提供精準服務。目前,國內已有學者對用戶畫像的數據收集和標簽化進行了相關研究,并總結了用戶畫像的特征。閔甜等人對科技期刊用戶畫像實現微信公眾號精準推送的可行性和實踐策略進行了深入研究,發現基于參與視角和用戶畫像的科技期刊微信公眾號的精準推送可操作性強,且精準推送效果優于全用戶推送效果,有利于科技期刊微信公眾號的高質量運營[16]。
韓云惠分析了基于用戶畫像的學術期刊精準服務的意義、價值和理論內核,并闡述其運行機制,在此基礎上提出基于用戶畫像的學術期刊精準服務策略[17]。
(三)醫學期刊的用戶畫像概述
醫學期刊的用戶畫像數據主要分為以下4類:一是基礎信息,主要包括醫學期刊用戶注冊期刊采編系統時填寫的姓名、性別、單位(學校)、職稱、出生日期、居住地等基礎信息;二是研究動態信息,主要包括論文、基金資助、所獲專利、研究方向、論著、科研項目等信息;三是行為特征信息,主要包括投稿記錄、投稿時間、頁面瀏覽頻次、內容搜索關鍵詞、登錄時間段等信息;四是社交信息,主要包括用戶使用微信公眾號的行為數據、閱讀喜好、點贊次數、評論內容以及轉發次數等信息。數據信息是構建用戶畫像的關鍵要素,只有建立在客觀真實的數據信息基礎上所生成的用戶畫像才能夠精確有效[18]。
二、應用區塊鏈技術構建醫學期刊用戶畫像的可行性分析
(一)區塊鏈技術在醫學期刊用戶畫像數據收集中的應用
在醫學期刊用戶畫像數據收集過程中,區塊鏈技術中的點對點(Peer to Peer,P2P)網絡協議能夠突破期刊用戶畫像數據采集的客觀限制條件[19],使醫學期刊能夠從采編系統中獲取可體現用戶個性特征與行為的數據信息,并捕捉用戶畫像的即時變化。醫學期刊還可通過采編系統或微信公眾號收集用戶的投稿數據、行為日志數據和交互數據,借助區塊鏈P2P網絡協議的挖掘功能和數據庫功能,基于Socket通信語言的數據采集標準方法構建出用戶群組數據信息間的關聯規則[20]。區塊鏈全方位、低延遲、零誤差的用戶信息采集方式,可極大提高醫學期刊用戶畫像的數據收集能力。
(二)區塊鏈技術在醫學期刊用戶畫像數據處理中的應用
醫學期刊用戶畫像數據處理可通過區塊鏈一致性中的哈希(Hash)算法為每一項待處理的畫像數據信息添加不可隨意篡改的數字標簽,以打造專業的期刊用戶畫像數據處理系統[21]。在區塊鏈的核心技術中,一致性哈希算法具有簡化數據發散和可信共識的特性[22],能夠充分挖掘用戶畫像數據,是提高醫學期刊用戶畫像數據處理效能的有力工具。將區塊鏈共識機制引入醫學期刊用戶畫像,可以讓醫學期刊在達成一致性共識的前提下合理挖掘期刊用戶畫像數據。醫學期刊通過構建區塊鏈管理平臺,利用區塊鏈的共識機制,從質量、特征和屬性等方面對用戶畫像數據進行集成化深加工,分別計算外層與內層的哈希值。外層哈希值指醫學期刊對結構化的期刊用戶畫像數據進行組織加工的一般權限,內層哈希值指醫學期刊對非結構化及半結構化的期刊用戶畫像數據進行精細化處理的特征權限。在內外層哈希值的協同作用下,醫學期刊可解決用戶畫像數據處理的可靠性問題。
(三)區塊鏈技術在醫學期刊用戶畫像數據存儲中的應用
醫學期刊用戶畫像數據存儲可通過區塊鏈技術中的超級賬本(Hyperledger Fabric)功能,合理配置期刊用戶畫像數據的存儲路徑和存儲空間[23]。為了防止期刊用戶畫像數據出現“信息孤島”和空間局促的現象,醫學期刊可采用區塊鏈秘鑰管理、隱私保密和完整性保護功能,以此保證自身在區塊鏈超級賬本的監管下運行。醫學期刊可嘗試與Siacoin區塊鏈云存儲平臺合作開展期刊用戶畫像數據的存儲工作,依托Siacoin云儲存功能,實現期刊用戶畫像數據的個性化存儲,同時利用區塊鏈存儲的防篡改特性,動態監測期刊用戶信息的存儲記錄,保障用戶畫像數據的存儲穩定性和系統性[24]。此外,區塊鏈中Bucket樹技術可實現醫學期刊用戶畫像數據的分布式結構存儲。Bucket樹是區塊鏈賬本模型的核心技術之一,其利用哈希表進行底層數據的維護工作,可保證離散分布的用戶畫像數據作為Bucket樹的葉子節點被結構化存儲,避免醫學期刊出現用戶畫像數據存儲紊亂和失衡的問題。
(四)區塊鏈技術在醫學期刊用戶畫像數據隱私安全中的應用
區塊鏈技術的多重加密特性在保障醫學期刊用戶畫像數據的安全性方面起到重要作用[25]。醫學期刊利用區塊鏈的隱私保護技術,可對用戶畫像數據的采集、傳輸和存儲等環節進行加密,可有效保障用戶畫像數據的隱私安全。醫學期刊用戶畫像數據采集可利用區塊鏈的非對稱加密技術來提高數據采集的安全管理效能。針對用戶畫像數據傳輸中的安全問題,醫學期刊可考慮采用區塊鏈脫敏技術并結合用戶畫像數據傳輸過程中的具體情景,通過數據脫敏和隱匿性標簽技術對涉及的用戶隱私信息進行轉換處理,切實解決用戶畫像數據隱私安全的問題。同時,醫學期刊可借助JavaScript區塊鏈節點加密方法即時隱秘地傳輸用戶畫像數據,避免一些中介機構竊取作者信息等問題[26]。
三、基于區塊鏈技術的醫學期刊用戶畫像應用策略
(一)基于區塊鏈技術的醫學期刊用戶畫像結構設計
在作者注冊投稿的過程中,醫學期刊一般通過采編系統簡單記錄其相關信息,如姓名、性別、出生日期、單位、聯系方式、專業、研究領域等,缺少對作者專業研究進展和科研成果的動態追蹤記錄。而在區塊鏈技術的賦能下,醫學期刊有可能與其他期刊聯合共同維護和記錄同一個作者的所有科研成果。作者的最新相關信息會被分發到每一個區塊鏈節點上,相關人員可在合理權限下查詢作者信息變動。此外,醫學期刊可基于區塊鏈存儲的作者用戶畫像數據,如作者的研究領域、發表內容以及科研成果等,分析作者的用戶畫像。醫學期刊的作者用戶畫像被不斷建立并動態更新,對醫學期刊的智能出版和可持續發展具有深遠的影響和重要的作用。
為了保證醫學期刊的作者用戶畫像數據不被篡改,醫學期刊可對用戶畫像數據進行哈希處理后得到哈希摘要,將用戶畫像數據和哈希摘要作為作者記錄的內容信息添加到區塊體中。醫學期刊為區塊體加上時間戳、前一區塊哈希以及Merkle根等信息,生成當前區塊鏈表頭,并根據6個數據協議進行驗證[27],驗證通過后將當前表頭鏈接到前一個表頭后;驗證不通過則無法鏈接到區塊鏈中。
(二)基于區塊鏈技術的醫學期刊用戶畫像全流程監管架構
基于區塊鏈技術的醫學期刊用戶畫像全流程監管架構的總體由用戶層、應用層和底層區塊鏈組成。用戶層包括醫學期刊編輯、作者、讀者等;應用層包括醫學期刊用戶的身份管理、交易管理、投稿智能合約和賬本管理4個模塊。其中,身份管理用于管理用戶對期刊用戶畫像數據的訪問權限;交易管理指管理各用戶對用戶畫像的處理信息行為;投稿智能合約則定義了期刊用戶畫像構建過程中的規則和流程,實現用戶畫像的自動執行和強制執行;賬本管理是提供查詢和獲取區塊鏈上的用戶畫像記錄信息,并存儲于分布式賬本中。醫學期刊用戶畫像的底層區塊鏈屏蔽了用戶畫像構建過程中的技術實施細節,采用超級賬本完成用戶畫像記錄的全過程。超級賬本是Linux基金會于2015年發起的推動區塊鏈數字技術和交易驗證的開源項目,在出版行業區塊鏈平臺具有一定的應用價值[28]。
四、結語
綜上所述,區塊鏈技術對醫學期刊出版業的業態重塑是前所未有的。醫學期刊出版業態將會更加多元化,醫學期刊不能僅停留于編輯和校對層面,而是要積極探索新的發展道路。根據區塊鏈技術的核心特征及其在醫學期刊用戶畫像數據中的應用特點,文章探索區塊鏈技術與醫學期刊用戶畫像融合發展的方法和路徑,以實現醫學期刊從傳統出版服務向精準個性化服務的轉變,為廣大醫務工作者和研究者提供更為有效的出版供給服務。
[參考文獻]
[1]Hong R, Zhang L, Tao D.Unified Photo Enhancement by Discovering Aesthetic Communities From Flickr[J].IEEE Transactions on Image Processing,2016(03):1124-1135.
[2]曾鴻,吳蘇倪.基于微博的大數據用戶畫像與精準營銷[J].現代經濟信息,2016(16):306-308.
[3]安璐,胡俊陽,李綱.突發事件情境下社交媒體高影響力用戶畫像研究[J].情報資料工作,2020(06):6-16.
[4]蔣蘭君.基于用戶畫像的圖書館智慧閱讀服務研究[J].圖書館界,2022(01):1-6,14.
[5]明海,楊曉農.面向用戶畫像的數字圖書館精準服務體系建設[J].出版廣角,2022(03):89-92.
[6]袁勇,王飛躍.區塊鏈技術發展現狀與展望[J].自動化學報,2016(04):481-494.
[7]仇新紅.區塊鏈技術發展現狀及前景探究[J].合作經濟與科技,2020(06):58-60.
[8]謝文亮,曹渝,蔣美仕,等.科技期刊基于區塊鏈的審稿全流程監管機制研究[J].中國科技期刊研究,2021(12):1490-1497.
[9]王赫彬.區塊鏈技術與應用前瞻綜述[J].科技創新導報,2020(14):126-127.
[10]張新新.區塊鏈技術在新聞出版業的應用原理與場景展望[J].中國傳媒科技,2020(05):7-13.
[11]羅飛寧.區塊鏈技術在學術期刊中的應用[J].韶關學院學報,2021(06):76-80.
[12]賀月月,李亭亭,邵施苗.區塊鏈技術在中國科技期刊出版中的研究現狀及可能的應用探析[J].傳播與版權,2021(11):70-73.
[13]黎麗華.以區塊鏈技術助推學術期刊高質量發展[J].中國傳媒科技,2021(08):39-41.
[14]劉海鷗,張靜,李源,等.微博群體用戶畫像模型及其信息耦合傳播機理研究[J].電子商務,2018(11):50-51.
[15]丁偉,王題,劉新海,等.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(03):64-69.
[16]閔甜,孫濤,賴富饒,等.用戶畫像在科技期刊微信公眾號精準推送中的應用[J].中國科技期刊研究,2021(12):1549-1555.
[17]韓云惠.基于用戶畫像的學術期刊精準服務研究[J].編輯學報,2021(02):142-146.
[18]向颯,楊媛媛.基于用戶畫像的學術期刊精準化知識服務策略[J].科技與出版,2021(02):103-107.
[19]王曉晨.區塊鏈技術及其應用前景分析[J].數字通信世界,2019(09):115-116.
[20]羅孟儒,袁小一,崔永.基于“區塊鏈”的高校數字教學資源共建共享[J].高校圖書館工作,2020(02):34-38,50.
[21]楊勛.基于區塊鏈技術的云存儲安全研究[J].電子測試,2020(20):76-77,105.
[22]韓瑋,王玉皞,秦東.共識機制的身份認證算法研究[J].電測與儀表,2020(10):13-23,99.
[23]王慶樂.基于區塊鏈技術的高校數字圖書館科研數據安全管理策略研究[J].圖書館工作與研究,2021(12):63-69.
[24]王永剛.基于區塊鏈的云存儲數據訪問安全控制算法[J].河北北方學院學報(自然科學版),2021(11):7-12.
[25]譚作文,唐春明.區塊鏈隱私保護技術研究綜述[J].廣州大學學報(自然科學版),2021(04):1-15.
[26]陳鵬,韓斌,洪華軍.基于深度學習和區塊鏈的JavaScript惡意代碼檢測系統[J].計算機系統應用,2021(05):99-106.
[27]謝人強,張文德.基于區塊鏈的數字資源確權與交易方案研究[J].企業經濟,2022(01):65-73.
[28]陳曉峰,云昭潔.區塊鏈在學術出版領域的創新應用及展望[J].情報工程,2017(02):4-12.