荊天培嫩江縣工業和信息化局
?
對圖書資料存儲方式自動轉換的探討
荊天培
嫩江縣工業和信息化局
【摘要】在數字化圖書館的建設過程中,圖書資料存儲方式的自動化轉換實現了圖書資料的科學化存儲,全面提高了圖書館的工作效率。本文對HTML表格向XML文檔轉換的圖書資料存儲方式進行分析和研究,以促進圖書館工作效率的提升,僅供相關人員參考。
【關鍵詞】圖書資料;存儲方式;自動化轉換;HTML表格;XML文檔
圖示資料是社會科技文化信息交流的重要方式,在數字化、網絡化大環境下,傳統的圖書資料存儲方式難以滿足社會群體對知識獲取的實際需求,因此改善圖書資料存儲方式和服務模式,實現HTML表格向XML文檔的自動化轉換,有助于提高圖書資料的實際應用效果,從而推進數字化圖書館的建設發展。
當前圖書資料管理過程中,HTML表格主要是通過HTML文檔來由數個標題組成,并且每一行中包含多個單元格,通過table來對其進行描述。單元格內部包含多元的數據信息,通過科學化的分類,來保證圖書資料管理更具便捷性和高效性,促進圖書資料管理效率的提升。隨著網絡化、數字化技術的有效應用,HTML表格的有效利用,使得圖書資料數據管理更具規范性和可操作性,推進HTML表格圖書資料管理逐步邁向規范化的發展道路,在一定程度上減輕圖書資料管理人員的工作量,并提高圖書資料檢索的便捷性,如表1所示。

表1 新書架題錄索引
(一)識別HTML表格的表頭。表頭是HTML表格來對不同圖書資料進行準確識別的重要方式,通過合理的表頭格式設置,數據信息顯示準確,圖書資料識別的精準度更高,便于圖書資料管理系統自動按照有限順序來對圖書資料信息進行排列。常見的表頭設置中,主要以字體、字號、數據等來進行顯示,并在合理設置標準程序的基礎上,結合行和列的特征值來對格式化的平均值進行精準的計算,以計算結果來對HTML表頭來對圖書資料進行準確的識別。在HTML表格中,假設每個單元格的特征值為0,每個單元格的字號為k,則可以得出不同的單元格特征值A。在加以準確計算后,能夠對表格的行頭和列頭的特征值進行有效的區分,以任意兩列的特征值為基礎,可以計算出列頭和數據的分解線。在明確HTML表格行頭和列頭的基礎上,應當在HTML表格的右上角表明單元格的屬性,并及時加以修改,進一步明確數據單元格的實際屬性,從而促進圖書資料存儲的總體效果的提升,為圖書資料的檢索和調閱提供更大的便利。
(二)HTML表格數據轉儲于數據庫文件。在明確HTML表格中各數據單元格及其相應表頭屬性的基礎上,可以結合表頭的屬性和單元數據屬性來對HTML表格的屬性進行系統化分析,在采用有關數據庫中數據理解HTML表格屬性值語言層次的基礎上,以HTML表格規范化后的表格屬性值作為主要數據資料,并對其進行準確的記錄,以保證圖書資料存儲的有效性。
(一)相關轉換規則。2.1.1表屬性向XML文檔轉換的規則。自開始標簽直至結束標簽的部分可以看作為XML元素,除此之外也包含其他文本、元素或二者的混合物。總的來看,元素具有一定的屬性,若以表元素的特征描述作為關系屬性,則能夠實現索引屬性值向表格元素和子元素屬性的轉化,以主鍵、外鍵和索引為例,在索引屬性值實際變化范圍較窄的情況下,圖書資料檢索則更具便捷性。2.1.2表屬性向XML子元素轉換的規則。若表屬性為元素的組成部分表述,則可以將表屬性向XML子元素轉化,在全鍵狀態下,所有的表屬性都能夠像XML子元素轉化。表屬性向XML子元素的轉化,可以在表具有嵌套特征的情況下實現轉化。除此之外,若表元組應該轉化為XML子元素的條件下,可以將每一個元組作為表元素,將其中屬性值作為子元素,此種條件下,即便關系表沒有全鍵,也能夠實現表屬性向XML子元素的轉化。2.1.3基本信息保存的規則。就數據文件向XML文檔轉換的總體情況來看,轉換具有一定的特殊性,并不是一一對應的,其中部分信息不能夠實現直接轉換,需要加以特殊處理。通常情況下,選取合適位置對附加相關文件進行特別標準,最大程度上實現無損轉換,促進關系表的重組,為圖書資料存儲方式的轉換提供可靠的基礎,便于XML文檔的高效化管理。以一個根元素來創建一個表,并以表中的每一列創建一個屬性,進一步明確表中的主鍵和外鍵之間關系,促進表元素中子元素的形成,從而為關系數據庫提供可靠的理論依據和數據支撐。
(二)轉換的實現。早在SQLServer2005中就已經提供了FORXML子元素用來實現數據庫到表格的轉換,其本質還是通過ransact-SQL語句來實現。經過重新編寫程序語言之后的SQL檢索語句中增加FORXML子句來檢索數據,實現XML轉換,并生成XML文檔,成為管理圖書資料手段的一大飛躍。當時有3種模式指定檢索生成XML的現實樣式,其中有Raw,Auto和Explicit。
(一)網絡數字化是現代社會發展的前提。現在是一個信息時代社會,社會的角落充斥著網絡。互聯網幾乎將整個世界連接在一起,成為一個大的網絡家庭。看看我們的周圍,若是沒有了網絡數字化科技的支持,在這個社會我們幾乎寸步難行。科技是社會進步的前提,圖書資料網絡數字化正是對這種現象的表現,同時也體現了圖書資料網絡數字化對促進社會發展的重要性和必要性。圖書資料的儲存應該采用HTML表格,將復雜的圖書儲存模式徹底顛覆,減輕上作人員的工作壓力,減少出錯機率。
(二)圖書資料網絡信息化成為圖書館的必要選擇。圖書館是圖書資料的最為重要的載體,也是人們獲取知識的主要途徑,傳統的圖書館服務由于自身的局限性不能給予人們對現代文化知識的需求,而圖書資料網絡信息化能有效的解決傳統圖書館在其時間、地理、人文上的限制問題。
在數字化圖書館建設過程中,HTML表格數據轉化為XML文檔是一種高效化的圖書資料轉換方式,在沒有標出表頭信息的HTML表格以及相對復雜的嵌套表格中能夠得到有效的應用,簡化了圖書館內資料存儲相關勞動,促進圖書資料管理總體工作效率的提升,推進圖書館的穩定發展。