999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社交媒體歸檔工具的功能分析與設計

2022-01-04 10:21:10蘇州大學社會學院
浙江檔案 2021年11期
關鍵詞:內容用戶功能

張 雪 周 毅/蘇州大學社會學院

信息時代,社交媒體的影響力日益增加,2020年社交媒體用戶超過38億[1]。社交媒體作為發布權威信息以及與公眾交流的重要平臺,其內容在構建社會記憶、留存歷史憑證、提供決策支持方面發揮重要作用[2]。2019年1月1日實施的《機關檔案管理規定》指出機關檔案包括業務數據、公務電子郵件、網頁信息和社交媒體檔案,肯定了社交媒體信息的歸檔價值并賦予社交媒體檔案一級門類代碼,為該類檔案管理實踐提供指導。

社交媒體的動態內容、龐大數據集和富媒體增加了歸檔難度,Archive Social、Archive It等歸檔工具應運而生,為機構組織提供專業的歸檔服務。學界對這類工具的研究分為三種:第一種是針對后續利用和管理痛點對歸檔工具的功能進行考察評估[3];第二種是針對檔案歸檔不同階段的社交媒體歸檔工具進行分析和比較[4][5];第三種是基于不同社交媒體平臺特性進行歸檔工具的研發和功能探討[6][7]。從總體上看,現有研究多是在歸檔的某個環節上進行社交媒體歸檔的功能設計,以及實現從捕獲—保存—利用的社交媒體全流程歸檔工具的功能設計。因此,本文在解析國外主流社交媒體歸檔工具的實踐與應用進展基礎上,從全流程上探討社交媒體歸檔工具設計的原則和功能要求,以期為我國社交媒體文件歸檔軟件的開發提供指導。

1 國外社交媒體歸檔工具應用進展分析

目前在實踐中使用的社交媒體歸檔工具主要有以下幾種:由存檔主體自行開發的網絡存檔工具;使用技術公司、國際網絡存檔組織開發的開源工具;將不同開源工具組合使用以實現自身網絡存檔目標等。這些工具在社交媒體檔案的捕獲、保存和利用等不同階段發揮著不同作用。

1.1 社交媒體歸檔工具的捕獲功能分析

不同捕獲工具在捕獲方式、捕獲內容、捕獲格式、捕獲數量、內容安全保護、操作難度上各有不同。歸檔工具對于內容的捕獲包括調用API接口、網頁快照、網頁爬行三種方式,捕獲的內容以HTML網頁、圖像、音視頻文件為主,分為多格式內容捕獲和單格式內容捕獲;部分工具僅支持靜態內容的捕獲。對于圖片、音視頻等動態內容,需溯源社交媒體平臺獲取其數據,若存檔主體對其動態內容進行刪除、更改等操作,這些內容面臨丟失的風險,因此單格式內容的捕獲往往同其他開源工具組合使用。大部分工具都支持WARC格式和ARC格式,部分工具提供定期檢測和更新存檔內容功能。相比Httrack等工具需用戶手動輸入指令監測并更新,Archive Social能夠自動檢測隱藏和刪除的內容,并實時記錄。在捕獲內容的數量方面,部分工具受社交媒體平臺自身和瀏覽器的服務限制,捕獲內容數量和速率受到限制。如TAGS允許消費者賬戶每日捕獲20000條記錄,政府和教育機構用戶的上限更高。捕獲準確性受檢索方式和內容權限影響,如Heritrix爬行未經授權訪問網頁時可能會破壞爬行結果,導致文件刪除、損壞、替換。TAGS采取關鍵詞檢索方式獲取記錄,檢索結果查全率低。在操作難度方面,部分工具需要用戶掌握IT專業知識,操作難度高。Web Curator Tool、Archive Social由圖書館和存檔服務公司自行開發,降低了對用戶的技術要求,其工具界面設置簡易、操作便捷,并且功能設計模塊化,允許用戶根據其需求調用不同組件組成業務模塊,供不同功能使用。

1.2 社交媒體歸檔工具的保存功能分析

社交媒體歸檔工具的保存功能涉及歸檔內容安全管控和保存期限兩方面,其中歸檔內容的安全管控包括時間戳認證、權限訪問和備份。社交媒體記錄存檔應當保障內容完整且未經修改。大部分工具在生成數據記錄時附帶生成時間戳,這一時間戳格式符合官方認證的時間戳標準,保證記錄的存在性和完整性。可訪問性方面分為兩種,一種是用戶通過身份驗證后對所有內容進行訪問和更改等操作;另一種用戶的操作權限依用戶等級而定。就后者而言,操作權限通常分為三種:安全管理員權限、只讀管理員權限和社交媒體賬戶所有者權限,其中安全管理員可以訪問所有存檔內容并進行更改、刪除等操作;只讀管理員僅可訪問存檔內容;社交媒體賬戶所有者只能對自身賬戶內容進行相關操作。部分工具考慮到安全風險會導致數據丟失,對數據庫進行定期快照備份,并將這些文件旋轉到二級存儲環境,幫助用戶在風險發生后快速重建。在保存期限方面,部分工具設置了靈活的保留規則,如Mirror Web和Archive Social允許用戶設置記錄的保留規則,并且當用戶注銷賬號時仍然在一定期限內為用戶保留記錄。

1.3 社交媒體歸檔工具的利用功能分析

社交媒體歸檔工具利用功能側重于記錄的查找和導出,部分工具提供了基于記錄的分析功能。歸檔工具提供關鍵字、日期、網絡、用戶名、內容類型、全文檢索或標簽等多種檢索途徑,可在組織的所有社交媒體上進行搜索。過濾器可以快速細化結果,查找范圍包括已刪除的存檔記錄。不同檢索方式的查全率和查準率也不同,如SFM等工具支持關鍵詞檢索,檢索結果僅顯示推文中包含了檢索詞的記錄,查全率低;Mirror Web對所有數字資產進行完全索引,提高了檢索的速度和準確性。在格式輸出方面,各工具將歸檔記錄以PDF、HTML和Excel多種格式導出,用戶按需執行導出,并生成具有突出顯示的搜索結果和詳細導出描述的演示文稿[8]。

除了檢索、格式導出等基本功能,部分工具還有償提供高級功能,如元數據分析、可視化、輿情監測控制等。Archive Social等工具提供存檔記錄的元數據,并根據元數據分析生成高級抓取報告,其中包括MIME類型的完整細分。TAGS安裝了Nodexl和Gephi插件,通過標簽和記錄分析能夠找到最具影響力的用戶。數據可視化方面,Web Curator Tool提供Heat Map功能,顯示一段時間內的預定收獲。TAGS安裝了谷歌地圖插件,能夠顯示twitter貢獻者地圖。為總結各類不同歸檔工具的功能差異,在此我們對國外主要社交媒體歸檔工具的功能特點通過表1方式進行比較。

2 社交媒體歸檔工具設計原則

基于上文對國外社交媒體歸檔工具功能及其基本特點的分析,可以看出社交媒體歸檔工具的功能始終圍繞社交媒體記錄內容恒久且可讀、證據效力保全、檢索提取便利展開。本文結合上述實踐案例,總結出了社交媒體歸檔工具設計的基本原則。

2.1 真實性。真實性指歸檔文件的內容和形成過程記錄真實完整。社交媒體文件逐漸成為電子證據的主要組成部分,但其證據效力仍然受到質疑,真實性是歸檔的社交媒體文件行政有效性和法律證據性的基礎。電子文件成為電子證據需要具備兩個條件:一是內容真實,二是形成過程可靠[9]。對于社交媒體文件來說,首先保障社交媒體文件記錄完整性,即社交媒體記錄內容、背景和結構信息真實,在記錄生成、保管、遷移過程中保持原有的信息固化形式,確保內容完整。其次保障社交媒體文件記錄真實性。社交媒體記錄的形成過程被認可,歸檔記錄傳輸、保管等一系列數據變更操作可驗證和回溯,保證歸檔內容未被篡改。

2.2 有效性。有效性指信息使用的有效性,即保存的記錄能夠被永久地讀取[10]。存儲格式的公開化和標準化是保障社交媒體歸檔文件持久生命力的必要條件,社交媒體歸檔文件應依據公開的格式標準進行存儲和記錄,公開的標準能夠保障文件的長期可訪問性,減少歸檔機構由于自身制定的規則不符合規范導致電子文件不可訪問的可能性。

2.3 通用性。通用性指社交媒體文件在保存的過程中,文件存儲格式被相關行業的認同度和現有軟件的支持力度,即該格式能否得到商業使用者和開發資源者的廣泛支持。目前國內提出《網絡資源歸檔格式標準》《文獻管理長期保存的電子文檔文件格式第一部分:PDF1.4(PDF/A—1)的使用》等文件,規范電子文件長期保存格式。社交媒體歸檔工具應該充分了解權威機構和行業規范,選取行業內認可度高的格式標準作為歸檔文件捕獲、描述和存儲的標準格式,并在用戶使用時將這類格式設置為默認推薦格式。除了歸檔文件的信息內容格式需符合國家標準化組織(ISO)標準和行業規范,歸檔記錄的歸檔內容格式、數字簽名和時間戳等底層數據格式也應該符合相關權威標準。

2.4 靈活性。靈活原則指社交媒體歸檔工具為用戶服務時,考慮到用戶需求不同,為用戶提供靈活的處理和保留原則。社交媒體文件歸檔時,由于歸檔文件重要性不同,其保留期限會有所變化。社交媒體歸檔工具在設計時應盡可能考慮用戶需求,為用戶提供選擇范圍,允許用戶根據自身需求靈活處理和保留歸檔文件。

表1:國外社交媒體歸檔工具功能分析簡表

2.5 便利性。便利性原則指社交媒體降低工具使用難度,提高用戶使用效率和用戶體驗。社交媒體歸檔工具界面應盡量做到頁面簡潔、功能設計直觀,可以提供相關功能使用說明或者界面導航功能;在頁面上插入文字、圖片等多樣化元素,豐富頁面內容;在頁面返回等地方設置醒目引導標識,引導用戶快速熟悉內部功能。此外,在歸檔文件利用方面,該工具應支持多途徑、智能化的檢索功能,如提供自定義標簽、歸檔時間、歸檔主題、用戶等多個途徑檢索相關歸檔文件,提高用戶的檢索效率。

3 社交媒體歸檔工具的功能需求及其設計

本文參照上文有關國外社交媒體歸檔工具的應用進展、功能特點和設計原則,結合數字檔案信息的完整性、可用性以及證據性的目標[11],從以下方面對社會媒體歸檔工具的功能需求進行表達和設計。

3.1 歸檔范圍和深度鏈接設置

通過歸檔范圍和深度鏈接設置幫助機構用戶自定義歸檔范圍。在歸檔范圍層面,社交媒體頁面不僅包含機構賬戶發布內容,也包含其他賬戶評論、回復與私信等互動內容。不同機構由于需求不同,所需歸檔范圍也不同,盲目地將所有頁面內容捕獲歸檔會增加存儲空間和內容管理的壓力,造成資源浪費。社交媒體捕獲工具應提供多種歸檔范圍供機構用戶選擇,將最常用的歸檔范圍設置為默認范圍,當用戶沒有設置歸檔范圍類型時,系統默認按照標準格式進行捕獲。以Archive Social為例,該工具嚴格按照用戶指定的社交媒體賬戶和頁面范圍捕獲內容,以社交媒體賬戶為單位進行捕獲,不僅可以捕獲目標賬戶中評論、回復和私信等完整的社交媒體活動信息,還可以追溯該賬戶建立之初的信息[12]。

深度鏈接包括同一站點的內部深度鏈接和外部深度鏈接兩種類型。由于深度鏈接的作用不同,一些深度鏈接作為補充內容,幫助用戶更加明確直觀地了解發布內容,也有一些鏈接用于廣告營銷[13]。因此社交媒體歸檔軟件在設計功能時,應允許用戶根據鏈接的有效性和重要性選擇是否歸檔。此外,在歸檔時應考慮深度鏈接的可用性。Web Preserver.com以PNF和HTML靜態頁面格式呈現捕獲內容,子頁面信息和超鏈接內容無法查看,給用戶訪問利用深度鏈接內容帶來不便。因此社交媒體歸檔工具應該以正確格式捕獲鏈接,同時提取該鏈接網頁快照,保證歸檔后的深度鏈接能夠通過內部跳轉實現訪問和利用,如果該鏈接網頁由于刪除等原因無法跳轉,用戶可通過網頁快照瀏覽其內容。

3.2 集成多源捕獲渠道

社交媒體歸檔工具應豐富其信息捕獲渠道,支持多個主流社交平臺,幫助用戶全面搜集關聯賬戶內容。社交媒體歸檔工具應考慮兩個問題:一是社交媒體記錄場景多樣。社交媒體已成為政府、企業和個人線上活動的主要場所[14]。為了提高宣傳和互動效果,用戶在多個社交媒體平臺上發布內容,而這就為信息收集歸檔工作帶來困難。因此,應該根據用戶要求,既能夠對單個平臺信息內容進行捕獲,又能夠即時且持續地捕獲關聯同一賬戶的多個社交媒體平臺信息內容,解決由多平臺發布信息導致信息捕獲不全面、不同平臺信息獲取規則不同等問題,實現同一組織機構賬號不同平臺信息內容的全面收集。二是多賬號持有者的社交媒體組合。傳統社交媒體信息歸檔需要獲取管理者登錄信息和信息訪問權限才能進行信息的捕獲歸檔,但一些組織機構的社交媒體組合分布在多個部門或者由單人管理,這為歸檔內容的真實性、私密性和安全性帶來隱患。社交媒體歸檔工具可以通過快速關聯相關賬戶捕獲信息解決這一問題,無需獲取登錄和訪問權限,實現低成本且高效的集中社會媒體存檔。

3.3 實時高效捕獲信息

社交媒體歸檔工具應注重社交媒體信息捕獲效率,高效捕捉動態的社交媒體信息,這主要體現在信息捕捉持續性、即時性和準確性三個方面。首先,社交媒體信息存在于組織網絡之外,具有高度動態性,信息內容的產生和刪除具有不確定性。社交媒體歸檔工具應提供連續存檔解決方案,24小時自動捕捉并保存新的社交媒體記錄,降低丟失已刪除記錄的風險。其次,社交媒體信息內容更新速度快,社交媒體歸檔工具應持續跟蹤關聯賬戶更新內容,即時捕捉更新監測信息內容。最后,在注重信息搜集速度的同時,也要保障捕獲信息質量。持續對目標賬戶的社交媒體歷史進行重復驗證,以確保即使網絡停機或社交媒體平臺設置更改能準確、完整地捕獲社交媒體賬戶信息。

3.4 格式多樣化操作

社交媒體歸檔工具應注重歸檔格式可持續性。格式可持續性是數字檔案資源長期保存的目標之一,直接關系到檔案資源的真實性、完整性和可靠性[15]。因此,在歸檔信息捕獲、保存、輸出三個環節都需要考慮格式問題。捕獲階段支持多種記錄格式的信息捕捉。社交媒體網絡的數據傳播格式包括結構化數據和非結構化數據,應準確捕捉社交媒體記錄使用的各種數據格式,并直觀地顯示結果記錄。保存階段,真實且完整地記錄文件格式。捕捉歸檔社交媒體記錄時,不僅對記錄拍攝HTML快照,同時記錄社交媒體記錄的底層數據,以便后期利用時還原檔案。

利用階段,提供可用格式記錄的定位和生成功能。社交媒體記錄格式多樣,根據用戶的使用要求提供不同輸出格式選項,讓用戶能以各種靜態格式導出記錄。此外,數字簽名、本機格式、圖像等底層數據內容也應允許用戶根據自身需要選擇性地輸出。

3.5 歸檔文件保全

社交媒體歸檔工具必須保全歸檔記錄的證據效力。社交媒體信息作為社會記憶,有利于在未來重現過去的文化規范、對話、趨勢和事件[16]。只有當社交媒體歸檔記錄的證據效力得到保障,該記錄在司法鑒定審查時才可以被法律接受。因此,主要從三個方面入手:一是保證社交媒體文件的原始性。捕獲社交媒體文件時,應以原生格式捕獲并保留數據,保證社交媒體文件與生成時狀態一致,內容完整且沒有被篡改。二是社交媒體文件的完整性。捕捉社交媒體記錄時,不僅需要拍攝HTML快照,還應提供記錄的底層數據格式,內容包括記錄內容、結構、背景信息和記錄機構長期保存行為與活動的詳細記錄。如Archive Social允許用戶按時間順序查看之前所有的編輯行為,確保用戶擁有可以合法提交的認證記錄[17]。三是社交媒體文件的真實性。社交媒體記錄不能使用網頁編輯器、圖像處理軟件或其他手段偽造。社交媒體歸檔工具應對歸檔中的每個記錄應用一個可信時間戳,處理數據格式時,時間戳被打包進社交媒體記錄的底層數據。可信時間戳作為數字簽名證明歸檔記錄在歷史上特定時間存在,并且沒有被編輯或以任何方式偽造,從而確保捕獲社交媒體記錄具有真實性。

3.6 歸檔數據深度分析

社交媒體歸檔工具應注重歸檔數據的價值挖掘。社交媒體已成為社會情緒的主要宣泄場地[18],數據背后體現了用戶的熱門關注內容、評論者情緒趨勢、參與度、平臺使用情況等內容,因此社交媒體歸檔工具的功能不應局限于記錄的捕獲和歸檔,而是應當提供歸檔數據的分析功能以挖掘歸檔記錄的價值。使用捕獲的數據記錄幫助組織執行其社交媒體政策并快速回應問題,分析數據中背后的評論者情緒趨勢、參與度、平臺使用情況等內容,將定制的監控和警報功能與可視化報告相結合,增強機構對整個社會媒體組合的控制、響應能力和洞察力。如Archive Social重視挖掘歸檔數據深度價值,該軟件有償提供管理和分析(Archive Social's Risk Management And Analytics)套件,該套件允許用戶利用預填充字典自定義設置關鍵字警報,RMA持續監控某一社交媒體組合,并在發現特定的單詞、短語或模式時發出警告,從而減少風險。此外該套件將檔案中捕獲的數據轉為動態報告,清楚地展示社交媒體活動的影響,幫助機構尋找潛在合作者。

3.7 歸檔記錄定位

社交媒體歸檔工具提供高級檢索和標簽功能,實現歸檔記錄再利用。從檔案的生命周期來看,歸檔記錄的再利用是社交媒體歸檔的最終目的。在數量龐大、格式多樣的社交文件記錄中快速且準確地定位所需記錄,需要復雜搜索引擎和社會化標簽系統的支持。高級檢索功能允許用戶按照內容類型、日期范圍、網絡、關鍵字、參與者或者標簽進行搜索,過濾器幫助用戶快速優化檢索結果,提高用戶檢索效率。標簽標注功能實現歸檔內容的組織和過濾。用戶制定分類標準,并提交Tag標簽,檢索系統根據用戶自定義標簽來決定歸檔信息內容組織方式,幫助用戶自由組織歸檔[19]。此外,社會化標簽功能還能夠幫助組織機構過濾用戶。Tweet Archivist為每個活動提供哈希主題標簽,當用戶發布活動相關推文就會自動攜帶活動主題標簽,通過分析所有攜帶主題標簽的用戶的影響指數,尋找最有影響力和發言權的用戶尋求合作[20]。

3.8 個性化處理和保留

個性化處理保留功能可為用戶提供更多選擇空間。首先,在信息捕獲環節,用戶根據需求自行設置捕獲記錄內容、頻次、日期,捕獲內容可以是某個標簽、用戶、復雜查詢、布爾邏輯搜索、術語等,并根據用戶的設置提取記錄。其次,部分社交媒體文件由于文件類型、內容的不同在保留和處理時需要特別考慮,應允許用戶根據需要定制的處置規則,這些規則包括保留規則名稱、歸檔文件描述、保留時間范圍設定、文件所有者設定等內容,且設置記錄在系統后臺可以查看。最后,用戶能夠設置黑名單和白名單權限,快速、安全地進行數據遷移,搜索重放內容,查看報告和通知。

猜你喜歡
內容用戶功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
關于非首都功能疏解的幾點思考
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
中西醫結合治療甲狀腺功能亢進癥31例
辨證施護在輕度認知功能損害中的應用
主站蜘蛛池模板: 国产激情在线视频| 亚洲色图另类| 国产在线精彩视频二区| 91精品小视频| 久久精品国产精品青草app| 欧美午夜视频| 亚洲男人的天堂在线| 亚洲乱码在线视频| 夜夜操国产| 97在线免费| 超级碰免费视频91| 国产区免费精品视频| 国产精品视频系列专区| 嫩草国产在线| 在线中文字幕日韩| 不卡无码网| 日韩无码真实干出血视频| 婷婷综合缴情亚洲五月伊| 亚洲精品不卡午夜精品| 国产精品亚洲欧美日韩久久| 亚洲精品卡2卡3卡4卡5卡区| 欧美激情第一欧美在线| 国产丝袜精品| 久草热视频在线| 免费人成在线观看成人片| 国产幂在线无码精品| 91口爆吞精国产对白第三集| 91精品国产情侣高潮露脸| 国产女人爽到高潮的免费视频| 亚洲无码在线午夜电影| 熟妇丰满人妻| 国产成人高清亚洲一区久久| 欧美精品亚洲日韩a| 午夜色综合| 国产精品漂亮美女在线观看| 久久五月天国产自| 日本在线免费网站| 欧美日韩一区二区三区四区在线观看| 狠狠久久综合伊人不卡| 国产区成人精品视频| 麻豆精品在线视频| 青青青伊人色综合久久| 就去吻亚洲精品国产欧美| 精品国产aⅴ一区二区三区| 青青青草国产| 特级毛片8级毛片免费观看| 国产a在视频线精品视频下载| 伊人久久久久久久| 国产精品林美惠子在线观看| 尤物在线观看乱码| 日韩A∨精品日韩精品无码| 色视频国产| 综合天天色| 91麻豆国产精品91久久久| 国产精品久久久久久久久久久久| 国产超碰一区二区三区| 91精品久久久久久无码人妻| 91在线高清视频| 九九热精品免费视频| 色成人综合| 国模私拍一区二区| 久久国产精品麻豆系列| 国产精品免费电影| 无遮挡国产高潮视频免费观看| 国外欧美一区另类中文字幕| 日韩第八页| 久久永久精品免费视频| 亚洲成a人片| 在线观看国产黄色| 国产成人无码久久久久毛片| 九色91在线视频| 国产一二三区在线| 成人在线观看一区| 99在线免费播放| 国产无码精品在线| 午夜a级毛片| 激情综合网激情综合| 亚洲人成影院午夜网站| 91黄色在线观看| 在线观看国产小视频| 69视频国产| 国产高清国内精品福利|