馬 珂
符號是論文寫作過程中不可規避的問題,幾乎所有的文章,嚴謹上講,幾乎所有的學術文章都要用到符號。符號的使用可以幫助改善和提高文章的質量。運用好符號對文章的表達有事半功倍的效果,但如果運用不好符號,則不僅不能有助于文章表達,有時還會引入錯誤和混淆,阻礙了文章的表達。本文基于多年在學術期刊的編輯工作,通過總結符號使用方面的一些例子,淺談編輯加工中的符號問題,目的是在同行中進行工作上的技術交流,在讀者中引起共鳴,以促進文章中符號的正確使用,進而為文章寫作的規范和寫作質量、水平的提高起到一定的幫助和推進作用。
符號在文章中的使用有什么作用,歸納起來其實只有一點,那就是精簡和精確文章的表述,從而使文章的表達更加準確和簡潔,讓讀者的閱讀更加直觀和流暢。但是,在真正的文章寫作中,發現很多符號的使用往往背離了這些目的,產生了各種各樣的問題。本文對所處理過的文章中的符號問題進行歸納和整理,將文章中的符號問題歸納為4 個大類,對每一類中涉及的符號問題逐一舉例和解析。
在文章的表述中,有些地方適當改用和添加符號,可以使文章的表達清晰、簡潔,同時也能指代明確,起到前后統一的作用。舉例如下。
例1 文獻[1]的2.2.1 節的3)分項中,在分析步驟(4)中的函數APPEND_U()的執行過程中有一條程序語句:
如果|tA|=ALL 或者|tB|=ALL,則|t|=|tB|或者|tA|,U=U∪ {t}。
上述語句雖然不是標準的程序代碼,但在寫法上同樣要遵守程序語言規范。“|t|=|tB|或者|tA|”的寫法是不規范的,需要在“|tA|”的前面添加“|t|=”,把語句寫完整。改動如下:
如果|tA|=ALL 或者|tB|=ALL,則|t|=|tB|或者|t|=|tA|,U=U∪ {t}。
1.2.1 不同符號表示不同概念
一篇文章中,不同的符號代表不同的含義,且在全文都遵循這個規則,以便符號指代明確,不會產生混亂和混淆。然而,多年加工經驗發現,這本是常識性的知識卻是最容易產生問題的地方。在一篇文章的某個段落或某個章節內,容易遵守這個規則,能夠區分不同符號的使用。但跨越到其他段落或章節,往往就忽略了這個規則,會使用之前用過的符號表達不同的概念,或者用其他不同的符號來表達之前出現過的相同概念。舉例如下。
例2 文獻[2]的1.3 節中有一段話:
MAC 運算表示為T=MAC(Kmac,m)。其中,Kmac為發送方與接收方共享的密鑰,m為任意長的消息,T為輸出的一個定長的認證標簽。在此方案中,為了檢測云服務器返回的文件是否為top-m個文件,分別為每個關鍵詞、包含此關鍵詞的每個文件以及當前文件在包含此關鍵詞的文件集中的排名計算一個MAC 值。
從這段話中可判斷,幾次出現的m,其含義是不同的。“m為任意長的消息”中的m表示的是消息,“top-m”中的m表示的是個數。為了不產生混淆,給出如下改動:
MAC 運算表示為T=MAC(Kmac,M)。其中,Kmac為發送方與接收方共享的密鑰,M為任意長的消息,T為輸出的一個定長的認證標簽。本文方案中,為了檢測云服務器返回的文件是否為前m個文件,……。
將表示“消息”的m改用大寫的M表示,很好地解決了混淆的問題。
1.2.2 根據內容確定符號的正確使用
符號是學術文章的語言元素,使用符號時如果不經推敲隨意使用,有時就會隱藏錯誤,干擾了文章的正確表達。
例3 文獻[3]的3.1 節中有一句話:
OmniLedger 可提供Visa 級別的吞吐量和秒級的延遲,同時保持了完全的去中心化并抵御拜占庭敵人。
這句話中,“Visa 級別的吞吐量”令人費解。吞吐量是指對網絡、設備、端口、虛電路或其他設施,單位時間內成功地傳送數據的數量(以比特、字節、分組等測量)[4]。那么“Visa 級別的吞吐量”是什么概念呢?事實上,Visa 是一個信用卡品牌[5],文獻[3]在這里把信用卡支付公司的應用直接當作吞吐量的單位來使用,顯然是不妥當的。根據文獻[3]的上下文,發現這里的吞吐量是指每秒處理的交易筆數,以符號“tps”來表示。因此,這句話應改成:
OmniLedger 分片協議可提供數千tps 的吞吐量和秒級的延遲,同時保持了較好的去中心化并能較強地抵御拜占庭攻擊。
1.2.3 不用無意義符號
文章中也會出現一些符號,不使用這些符號不會對文章的表達有任何影響;如果使用,對文章的表達反而起到干擾作用。這種情況下,最好刪去這些無意義的符號。
例4 文獻[6]的3.1.2 節開頭有一句話:
對于外包數據庫D中的每一個表,取T中的任意兩列第i列和第j列構建認證樹。如果一個數據庫中有n列數據,則需要構建n2個認證樹。
這里用符號T來表示一個表,會方便在其他地方引用,但是在文獻[6]中,除了這段話中提到表T之外,其他地方均未再出現符號T。根據上下文,發現不使用符號T,也能把文章含義表達清楚,這里提到的表,只是一個泛指的概念,因此改動如下:
對于D中的每一個表,取表中的任意兩列第i列和第j列構建認證樹。如果一個表中有n列數據,則需要構建n2個認證樹。
1.2.4 符號的表示范圍
符號代表的是一個特定對象還是一類對象,需要根據上下文進行判斷,因此在寫作時需要注意符號范圍的表述問題。
例5 文獻[7]的2.1 節中有一句話:
1)系統建立(SETUP)。輸入系統安全參數,輸出系統所需要的各種參數PP。
根據前文可知,在這句話中,文獻[7]本意是想用符號PP來概括各種系統公開參數,但在PP前加了修飾詞“各種參數”,卻產生了范圍歧義。PP到底是一個參數,還是各種參數呢?各種參數怎能用一個符號來表達呢?在這里,去掉限定詞“各種”,改用泛指的概念“系統公開參數”來表達,就很好地解決了范圍歧義問題。改動如下:
2)系統建立(SETUP)。輸入系統安全參數,輸出系統所需要的系統公開參數PP。
1.2.5 符號的單位
符號通常是帶有單位的,有時根據文章內容需要表達出來,而這個問題往往被忽略。
例6 文獻[8]的第2 章中有一句話:
協議中,Alice 試圖共享一個n長的秘密S給Bob1,Bob2,…,Bobm-1,當且僅當這m-1個代理人利用他們各自的子秘密P1,P2,…,Pm-1共同合作才能恢復出秘密S。
計算機語言里,長度可以是bit(比特)或byte(字節),而在量子領域,還有一種長度單位是dit(笛特)。上面這句話中,“n長的秘密S”中的n的單位就沒有給出,造成含義模糊且不規范。其實這里n的單位是dit。因此,這句話改成:
協議中,Alice 試圖共享一個ndit(經典笛特)長的串(秘密S)給Bob1,Bob2,…,Bobm-1,當且僅當這m-1個代理人利用他們各自的子秘密P1,P2,…,Pm-1共同合作才能恢復出秘密S。
編輯加工中常用一句話叫“圖文一致”,除了是指文字方面的一致外,當然也包括符號使用的一致性,而這方面的統一有時就會疏忽。
例7 文獻[9]中的圖2 上面有一句話:
圖2 反映了s隨Δt-T變化的圖像,其函數取值在[0,1]之間。
然而,在文獻[9]的圖2 中,給出的橫坐標變量卻是w。根據文獻[9]的上下文,發現符號w只出現在圖2 中,其他地方并未引用。在圖2 所屬的2.2節,對Δt、T以及Δt-T都有明確的定義,且其他地方引用的也都是Δt-T。因此,需要將圖2 中的w改為Δt-T,做到圖文一致。
文章中使用符號是為了精簡和精確文章的表述,然而有的時候根據文章的需要卻要適當添加中文,或者換用中文。當符號和其對應中文同時出現時,符號和其對應中文也要根據規范正確使用。
1.4.1 符號后適當添加中文
例8 文獻[10]的2.1.1 節中有一句話:
基于Alexa 和100 萬DGA 樣本,實驗從3 個層面說明了生成數據的有效性。
看到這句話,也許不知道Alexa 指什么?事實上,Alexa 是美國一家專門發布網站世界排名的網站。Alexa 每天在網上搜集超過1 000GB 的信息,不僅給出多達幾十億的網址鏈接,而且為其中的每一個網站進行了排名[11]。這里是想用“Alexa”來指代這些網址信息,因此在“Alexa”后面加上中文“數據集”,含義就能立刻清晰明了。同樣,在這句話中,“DGA”是指用DGA 算法生成的DGA 域名。因此,在“DGA”后面加上中文“域名”,也讓含義更加清晰。改動如下:
基于Alexa 數據集和100 萬條DGA 域名樣本,實驗從3 個層面說明了生成數據的有效性。
1.4.2 符號和對應中文的使用
例9 文獻[12]的2.3.1 節中有如下一段話:
1)在一個時間間隔內,每個節點的相位角θ的變化差異在一定閾值內Δθ;
2)在一個時間間隔內,每個節點的電壓U的變化只會在額定ΔU小范圍浮動;
3)在一個時間間隔內,每個節點的有功P的變化應小于經驗值的閾值ΔP;
4)在一個時間間隔內,每個節點的無功Q的變化應小于經驗值的閾值ΔQ。
從這段話中可以獲得如下信息:θ表示相位角,Δθ表示相位角差異閾值,U表示電壓,ΔU表示電壓變化閾值,P表示有功功率,Q表示無功功率,ΔP表示P 的經驗值變化閾值,ΔQ表示Q的經驗值變化閾值。
在文章寫作時,當中文和其對應符號第一次同時出現時,符號應出現在緊跟中文之后的括號中,這里的括號起到注釋的作用。文章之后再有對該中文的引用,可以直接使用其對應的符號。根據這條編輯加工規范,上面這段話應改為如下形式:
1)在一個時間間隔內,每個節點的相位角(θ)的變化差異在一定閾值(Δθ)內。
2)在一個時間間隔內,每個節點的電壓(U)的變化差異在一定閾值(ΔU)內。
3)在一個時間間隔內,每個節點的有功功率(P)的變化應小于經驗值閾值(ΔP) 。
4)在一個時間間隔內,每個節點的無功功率(Q)的變化應小于經驗值閾值(ΔQ)。
文章中的符號使用問題說難不難,說復雜也不復雜,但真正使用起來,問題還是層出不窮、五花八門,也是無法杜絕的。寫作過程和編輯加工過程中,真正處理好符號問題并不容易,需要細心和耐心,更需要對文章有較為透徹的理解。本文只拿出了少量例子來交流,更多實際問題還要在工作中發現,還要依靠同行積極分享和交流。本文只是拋磚引玉,處理好文章中的符號問題還需要大家共同努力,以促進文章質量的提高和文章寫作水平的提升,從而促進文章的閱讀和交流。