張曉耿斐孫浩森吳芹
(山東建筑大學學報編輯部,山東 濟南 250101)
目前的工作和生活中,人們普遍采用Word 類的辦公軟件開展文字的編輯工作,但是對報紙、學術期刊、碩博畢業論文、行業標準文件等專業性的文章而言,其對文字的要求更加嚴格,而且國家也針對出版物的標點符號、量、單位和符號、參考文獻格式、科學技術名詞、表格插圖等做了一系列的標準規范,?出版管理條例?里更是明確指出:出版物的規格、開本、版式、裝幀、校對等必須符合國家標準和規范要求,以保證出版物的質量。 因此,在稿件正式刊發前,必須按照標準規范細致地加工、編輯并修改上述內容,實現語言文字的規范化。
常見的修訂軟件為國內市場上占有率最高的黑馬校對軟件,其可以檢索出錯別字、異形詞、拼寫錯誤、政治敏感詞等各類錯誤,對社科類論文更具應用價值;而針對參考文獻的善鋒軟件,可以聯網中國知網等數據庫進行檢索,依次比對后能夠將文獻修改為國家標準格式。 但此類軟件價格較高,升級維護也需要周期性的付費,有些新聞出版單位甚至未能配齊這些軟件,對于個體的文字工作者而言成本就顯得更高了。 但是,在Word 中使用共享的Visual Basic 宏語言(Visual Basic for Applications,VBA)開發計算機輔助工具則無任何經濟成本,作者或學生更加容易接受。 目前,此技術多用于解決日常重復性的文字問題[1],亦在公文處理[2]、翻譯小程序[3]、自動閱卷系統[4]等領域得到廣泛應用。 同樣地,有不少出版單位開發了免費的VBA 程序,將編輯從繁瑣的重復性勞動中解脫出來。 毛星等[5]通過VBA實現了表格圖片編號連貫性檢測、量和單位的規范化、重復語句高亮顯示等功能;王錦秀等[6]利用VBA 提升了表格的編校質量;崔玉潔等[7]實現了敏感詞、重復詞語的標注和格式的調整;鄭小光等[8]通過VBA 調用數據庫的方法,避免了量名稱、符號、科技名詞等的不規范使用;康鋒等[9]通過構建數據庫的方法實現了在Word 稿件中插入、替換、批注等文字處理。
文章采用更加簡潔的開發方式,不需要建立常見的數據庫,針對批量的文檔模板更換、常見語義修訂、科學技術名詞和敏感詞修改、空格、量單位更正、圖表序號連貫性檢查等需求開發VBA 宏程序,編程時將上述功能集中在一個宏程序“突出顯示”中實現了“一鍵操作”。 針對參考文獻中的英文人名大寫與常見格式修訂等開發了“編輯文獻”宏程序。此計算機輔助工具有助于各類文字工作者提高了文字處理的效率,快速實現了文字的規范化。
VBA 是VB 編程語言(Visual Basic)的一種標準化宏語言,是微軟公司開發的與辦公軟件Office完美結合的編程語言,具有最直接、最深層的處理優勢,掌握VBA 有助于實現辦公自動化,且其編程方式更易修改和使用,對沒有編程基礎的人較為友好[10-11]。 宏是執行一系列VBA 語句的指令集合[12],針對Word 程序,需要在菜單欄加載“開發工具”菜單,其方法是在[文件]菜單中選擇[選項],打開后選擇[自定義功能區],選中[開發工具]復選框。 宏的編制方法有2 種,即(1) 錄制宏點擊[錄制宏]按鈕后,如實現“替換”功能,只需要在文本中將替換操作一遍,即可在編輯器中自動生成宏代碼;(2) 使用Visual Basic 編輯器由于有些宏是無法錄制的,因此需要直接使用編輯器編寫代碼。 在實際編程時,多采用兩者結合的方式,能夠加快宏開發的速度。
現在辦公文字已經采用了電子文稿的方式,但很多工作者對文檔處理的還存在著重復使用格式刷的方法,尤其是批量處理文檔樣式時,這種方法費時費力且容易出錯。 而采用VBA 編程則可以將需要統一樣式的文件放于一個文件夾中,不需要打開文檔即可實現所有文檔樣式的修改。 其方法是將要求的多級標題、作者、正文、參考文獻等的樣式設置成新模板[13],再進行模板樣式套用,其步驟是打開需要編輯的文章,選擇菜單[開發工具]中的[文檔模板],進入對話框后選擇新建模板,如圖1 所示,并勾選“自動更新文檔樣式”,但此操作的前提是初始稿件采用樣式編輯了文字和標題。

圖1 自動更新樣式圖
在此基礎上,采用宏命令可實現批量文檔的樣式更改,宏命令完整代碼為


將操作過程中經常遇到的問題合并到1 個宏程序中(命名為“突出顯示”)進行處理,不需要額外建立數據庫或文檔等操作,通過啟動宏命令即可“一鍵操作”。 而且,此部分代碼完全開源,直接復制到Visual basic 編輯器中即可使用,無需任何成本。
為了方便使用者在文稿中看到計算機輔助工具改動的位置,特設置將修改的內容全部高亮標識,其主要代碼為

由上述代碼可以看出,編程語言與英文意義相同,便于理解。 此部分代碼需放置于宏程序首位,是一種全局性操作,對后述變更的內容可全部高亮顯示。
行業標準、碩博論文、科技論文等專業性文章均有嚴格的標準要求,在文檔編輯過程中,要注意敏感詞查錯修改、專業的科學技術名詞避免錯誤或使用舊制、量單位的大小寫需標準化、論文約定的格式等。 文稿憑人工檢查費時又不能避免疏漏,編程時可將需要修訂的全部常見詞匯直接編入VBA 程序,實現一鍵替換。 此類詞條在應用時設置了幾百條,均放置于“突出顯示”宏命令里。 在操作過程中不需要調用其他類型的文件,或比對數據庫的詞條。
如文稿中不允許使用舊制“公斤”,宏程序中就可以挑選出“公斤”關鍵詞修改為“kg”并高亮標識此處做過修訂,其關鍵代碼為

此代碼的實質為替換功能,通過此類模塊的堆疊即可實現“批量替換”功能。 如工具還實現了年月日的格式統一、量單位大小寫的修訂和專業名詞、常見錯別字、常見語序的一鍵修改。 部分關鍵代碼為

某些作者在寫作時存在一些的語言習慣問題,如經常使用“的”,為了使語言更有專業性,需要對此類語句進行加工處理,代碼語句為

此部分為一個代碼塊,其含義為查找2 個“的”中間連接1~5 個字的詞組,.Replacement.Text =""為空,則執行后僅對這些關鍵字高亮顯示,提示用戶重點修改此類語句。
或者文章中重復出現“對……進行……”“進行了……”等句式,那么代碼即可設置關鍵詞為“進行”去通篇查找文稿。 同樣的,使用“首先”“然后”“最后”一般都需要替換為(1)(2)(3),可讓文章條理更加清晰。 在宏中將需要修訂的語義關鍵詞采用此方式編程,可執行一鍵查找并標識。
文稿經常會出現打錯字的情況,如“的的”“本文本文”類重復字詞的情況,此類疏漏如果僅通過校對有一定的難度,仍需要借助替換功能實現批量查找。 通過高亮顯示后,用戶可以明顯地提高審核速度。 其VBA 的關鍵代碼主要為

2.5.1 量與單位的空格
根據GB 3101—1993?有關量、單位和符號的一般原則?[14]規定,單位符號應當置于量的整個數值之后,并在其間留一空隙。 此問題在自然科學類文章中較為普遍,靠手動修訂容易疏漏,通過宏命令可實現全文量與單位的空格操作。 其代碼為

其中核心語句為.Text ="([0-9])([a-zAZ])",([0-9])表示為任意數字字段,([a-zA-Z])為任意字母的字段;.Replacement.Text =" \1 \2"表示兩個字段按中間加一空格的格式排列。 此種方式認為數字后面加字母即是單位,并不嚴判字母是否為標準量的單位。
2.5.2 千分位的空格
根據GB 3101—1993[14]規定:為使多位數字便于閱讀,將數字分成組,從小數點起,向左和向右每三位分成一組,組間留一空隙,但不得用逗號、圓點或其他方式。 需要注意的是,千分位空格有時會導致數據割裂分為兩行顯示,而這并不符合國家標準,因此不能采用space 空格,而必須選擇不間斷空格(^s)。 其主要代碼為


在文稿中出現年份的情況也較多,但其不需要設置空格,因此上述程序中亦排除了年份的空格操作。
在Word 文稿中,使用圖表可以更形象地展示結果,但排版時要求圖表以及公式的序號必須按照順序編排,不能中斷[15]。 但圖由于存在分組情況,如1 個圖中分(a)(b)等子圖,圖的標題順序與圖的個數并不一致,因此對圖的編號檢查無法通過查詢圖的個數依次命名。 文章中為了簡化操作,僅高亮標識出文章中“圖*”(*表示任意內容)標注的內容,由作者或校對者依次核查正文中與圖中標注的順序是否一致。 其主要代碼為

由于表在論文中是按照表的個數依次命名標題的,因此可以通過檢查表的個數和命名的編號是否一致的思路設計宏程序[5]。 其實現步驟與完整代碼為
(1) 此模塊先將文中表格序號改為靜態,然后將所有“表*”的關鍵字段設置為高亮顯示


(2) 表的標題按照國家出版物標準,位置均在表格的上方一行,因此可以找到表的第一個單元格后再向上移動,即可找到上方的標題行。 如果標題中表的序號與表的編號一致,則取消高亮顯示。

GB/T 7714—2015?信息與文獻參考文獻著錄規則?[16]中規定:個人著者,其姓全部著錄,字母全大寫,名可縮寫為首字母。 但實際寫作過程中,作者從軟件導入或百度學術引用的參考文獻格式并不完全符合國家標準,尤其是引用外文文獻時作者的名字只有姓的首字母大寫,其他均為小寫的情況。 為此,針對作者信息部分,設想首先查找到作者名字部分高亮標識,將選中區域內容全部更改為大寫字母,再將et al 改為小寫。 關鍵代碼為


選擇名字部分內容,以序號]為開始,以第一個.為結束

另外,針對參考文獻中“年,卷(期)”的格式,直接采用軟件導入期刊格式時,“期”容易出現類似(06)的情況,而規范中采用(6)這種格式。 宏程序可以一鍵將其修改,其關鍵代碼為

上述所開發的代碼完全是免費開源的,需求者只需要將宏代碼導入到模塊中即可運行。 為了簡潔,文章創建了針對正文內容的“突出顯示”宏和“編輯文獻”宏。 其中“突出顯示”宏實現了上述的8 類功能,包含詞條近千個;“編輯文獻”宏相對較為簡單,僅修改文獻作者名、符號、格式等:基本滿足了常見語言文字處理的需求。 用戶在使用此輔助工具時,需通過開發工具菜單進入Visual Basic 編輯器,在模塊位置點擊右鍵選擇導入文件,即可將宏程序安裝到Word,如圖2 所示。

圖2 導入宏程序圖
為調用程序方便,還為宏命令設置了快捷鍵,由于不是通過“錄制宏”可以直接選擇“鍵盤”,因此需要選擇菜單[文件]—[選項]—[自定義功能區]—[鍵盤快捷方式:自定義],打開選項卡,如圖3 所示。 選擇宏類別,再選擇要設置快捷鍵的宏,在“請按新快捷鍵”位置按下要設置的快捷鍵,指定后即可設置成功。 通過此方式,僅需打開Word 文章,啟動快捷鍵(如Ctrl+Shift+Z)即可實現一鍵編校。

圖3 快捷鍵設置圖
計算機輔助工具集合了文字工作者經常遇到的格式、單位和語言標準化、自動編號等問題,將其集中到一個宏程序里,提供了批量處理各類問題的一鍵式解決方案。
批量處理樣式在運行時,會看到文檔快速地打開與關閉,最終會提示“已套用模板”,若文件在傳輸給他人時,由于其沒有樣式模板會導致樣式缺失,因此需要將文檔模板里的“自動更新文檔樣式”復選框取消,才可在他人電腦上正常顯示。
正文、參考文獻的部分編校結果如圖4 所示,可以看出,當文中出現所設置的常見問題時,宏程序會更正或提示錯誤并高亮顯示,提示用戶有重點地編修,減少了重復索味的工作,將更有助于其關注于文章的內容審核與提升。

圖4 輔助工具運行結果展示圖
針對報紙、期刊、學位論文等稿件中常見的語言與格式問題,文章基于Word VBA 開發了計算機輔助工具,能夠使文稿根據常見的國家出版物標準進行批量規范化處理。 此計算機輔助工具開發代碼完全開源,無需任何成本,任何需求者均可在此代碼基礎上根據個性化需求進行實時擴展,方便快捷。 實際應用也表明,VBA 輔助工具會使復雜且繁復的工作實現了計算機自動化處理,有效地提高了文字工作者的工作效率與初稿的文字質量。 但此工具的局限性在于詞條數據達不到付費軟件的數目,僅是設置一些常見的需求,同時針對語義的修訂較少。 因此,從詞組到短句再到長句、分句、段落,能夠在語法意義上解決各類常見問題,開發更加智能的輔助工具是今后研究的重要方向。