楊勝林 聶 堅 秦 瓊 喬 磊 張建英 張 明 馬鳳麗
(1云南中醫學院基礎學院,昆明 650200;2云南省中醫醫院,昆明 650200)
Excel電子表格軟件是微軟Office套件的一個組件,其處理表格的功能強大,易于使用,是目前辦公軟件中常用的表格軟件之一,但是,Excel軟件同時也是一個具有基本數據庫功能的軟件,因此,使用該軟件不僅可以方便地進行各種表格的設計制作,而且利用其數據表的功能,還可以進行一些如排序、篩選等基本的數據操作。
中醫古籍整理工作,一是做最基本的文字校注,二是對古籍文獻內容進行歸類整理,以便于統計數據,尋找相關規律。Excel軟件在中醫古籍整理工作中主要可用于第二種情況。通過將古籍文獻內容保存入Excel工作表,再利用Excel的數據操作功能歸類整理文獻。
筆者在進行中醫古籍整理研究工作中,發現充分利用該軟件的數據操作功能,可以有效地提高工作效率和工作質量,現將具體方法簡介于下。
1.1 Word文檔原文分段 在中醫古籍文獻整理工作中,通常使用的文檔格式是Word文檔,Word軟件有強大的文字處理和排版功能,但在處理數據方面,功能明顯弱于Excel,為使用Excel處理數據,首先需要將Word文檔轉入到Excel工作薄中,這個操作可以用復制粘貼完成。要說明的是,在進行復制粘貼操作之前,需要先將Word文檔內容進行調整,在調整之前,為保持原文檔內容不受影響,可以先另存一個新文檔副本,在副本中進行分段操作。調整的方法是,逐句閱讀原文,將原文中有獨立意義的單句或一組單句分為一段,方法是在要分段的地方打一個回車即可,將整篇文檔按這個方法重新進行分段。
1.2 將分段內容粘貼入Excel數據表 分段完成后,全選文檔內容并復制,然后打開Excel軟件,新建一個工作薄,在工作表Sheet1中選中E2單元格并粘貼(不是粘貼在A1單元格,留出前面的空行、空列有其他作用)。這樣,剛才在Word文檔中分的段,在Excel工作表中就被分別粘貼在各行中了。Excel中的行,也可以稱為記錄,古籍內容被分到各行,也就相當于是輸入了數據庫的不同記錄,這樣就便于對其整理歸類。
1.3 調整規范Excel數據表內容 粘貼以后,還要對Excel數據表內容進行一些調整規范,因為Word原文檔的內容可能會有標題、空行等內容,這些也會隨著粘貼而在Excel工作表中單獨占有一條記錄,這些內容一般是統計數據時用不到的,并且還可能會對統計過程產生干擾。將標題內容分別移到工作表Sheet1中的C列和D列中,一級大標題移到C列,二級標題移到D列,并分別將對應內容的空行填充滿。例如,某一級標題下有3個二級標題,共有20行內容,3個二級標題分別有7行、6行、7行內容,那么就將這20行內容對應的C列全填寫上這個一級標題,3個二級標題分別填入其7行、6行、7行內容對應的D列中。這樣,每一行內容屬于哪個一級標題、二級標題就一目了然,將來就不會因排序而找不到原來所屬的章節,如果古籍原文標題不只兩級,可以在D列和E列之間再插入新的列存放下級標題,筆者在古籍整理工作中只用到了章節兩級標題。為了更好地找到每個內容在原文中的位置,在每條內容(每行記錄)對應的B列填入其在Word原文檔中對應的頁碼,以便于結合上下文辨析其內容,然后刪除中間的所有空行,并且在A列從第2行開始填寫,從1開始編號,順序填入每條內容(每行記錄)的編號。最后,再為每列命名,在第1行填入每列的名字,A1中填寫“序號”,B1中填寫“頁碼”,C1中填寫“章名”,D1中填寫“節名”,E1中填寫“內容”。這樣,就將原來的Word文檔轉換成了一個數據表。
2.1 逐條辨析屬性 這個步驟是將做好的數據表內容進行解析整理的過程,對所分出的每一條內容,即每一個數據記錄進行分類,例如,這條內容是講診斷還是病機,又是屬于什么具體內容,如病因的風寒暑濕燥火,病位的肝心脾肺腎,病性的虛實寒熱等。將這些屬性分別填寫在每條記錄旁邊列的對應行中,為防止混淆,這些屬性內容從第1列開始填寫,即與原文檔內容中間間隔三個空列。由于每條內容的這些屬性可能不只一個方面,故可以多設置幾個屬性,筆者在實際應用中,設置了4個屬性列,一般就足夠使用了,在I1、J1、K1、L1單元格中分別填入“第一屬性”、“第二屬性”、“第三屬性”、“第四屬性”,作為這4列的名字。以下就逐條對其屬性進行歸類辨析,分別填在每條記錄旁邊的第I、J、K、L列中,每列填寫一個屬性。有時候,可能還有些內容需要提取出來,如所涉及的方劑、藥物,在M1單元格中填入“方藥”,如果某條內容涉及方藥,就將方藥名字填入第M列中對應的行里面。
2.2 設置數據有效性 在逐條對數據屬性進行歸類時,可能會出現一些諸如“疏肝”、“舒肝”之類的同義詞,如果使用了同義詞,那么在排序時,就有可能不能將相同屬性的內容排在一起,起不到數據表的應有作用。為避免出現這種結果,可以利用Excel表的數據有效性驗證功能,在一系列的同義詞中,只允許輸入某一個名詞,而不允許輸入其他名詞,或者還可以設置一個下拉列表,可以從下拉列表框中選擇某一個屬性作為輸入。這樣的名詞術語標準化過程,保證了可以將每條內容進行正確排序。
2.3 數據排序 屬性歸類 做好以上基礎工作后,就可以利用Excel表的排序、篩選功能,將具有某個屬性的數據記錄排在一起,以便于進行計數統計。歸類的實現可以使用Excel的篩選功能,即篩選出在I、J、K、L列中出現過某字某詞的行,例如,出現過“腎”字的行,那么就是篩選出了屬性中有“腎”字的數據記錄。歸類的實現也可以使用Excel的排序功能,例如,使用O列作為排序標志,應用IF公式,按照對應的I、J、K、L列是否出現過某字詞確定O列的內容。例如,出現過“腎”字,在對應的O列就填入“有”,沒有出現過就填入“無”,然后以O列為關鍵詞進行排序,就可以得到與篩選相同的歸類結果。使用排序法歸類,更為靈活,操作也比篩選簡單,還可以進行組合排序,而且只要對單元格中的公式進行簡單的粘貼等操作,即可以對另外的關鍵詞進行歸類,如排過“腎”字了,那么將P2單元格中的“腎”字改成“脾”就可以歸類與“脾”相關的數據內容,或者也可以對“腎”和“陰”,或者“腎”和“脾”同時進行歸類,只要在R列中填入“陰”或者“脾”,在Q列粘貼入相應的公式,然后以O列和Q列為關鍵詞進行排序即可。還可以通過編寫或錄制,使排序操作更加快捷,甚至實現一鍵排序。排序歸類之后就可以進行計數統計。其中涉及的方藥等內容也可以復制出來,在另一個數據表中再進行處理,進行排序計數。
在整理中醫古籍的過程中,使用Excel數據表可以大大簡化對古籍內容歸類的工作,不僅提高了效率,也提高了質量。在做好第一個數據表之后,相關的公式操作等,都可以通過復制粘貼方便地完成,可謂是古籍整理的一大利器。但是,Excel數據表畢竟還有操作繁瑣、功能局限的不足,如果能以此思路和方法為基礎,開發出相應的古籍整理助手軟件,則可使古籍整理工作更加快捷高效。