王德貴 丁大為
上一期我們介紹了Base64編碼的基本知識和應用在文本編碼中的實例,下面繼續(xù)學習Base64編碼在圖片和聲音中的應用,以及信息審核中的原理解析。
1.圖片編碼
由于圖片的大小不一,Base64編碼文件可能特別大,可以將圖片等比例縮放,這要下載一個圖片轉換插件“TaifunImage”(圖1)。

這里調用了一個過程“resizeimage”,在AppInventor中,也叫函數(shù)(圖2)。

用這個函數(shù)將任意大小的圖片,轉換成寬度為300,高度按原圖成比例的新圖片,便于轉碼。

圖片來源可以是照片,也可以是圖像文件。經(jīng)過縮放處理后,點擊“查看”按鈕,即可看到圖3的效果。這里顯示的編碼大約是全部編碼的1/25。
2.聲音編碼
把3秒的音頻文件,轉換為Base64編碼(圖4)。

點擊錄音后調用錄音機實時錄音3秒,錄音格式默認為“3gp”,也可選擇其他音頻文件進行轉換,這里不再說明,有興趣的朋友可自行研究。這里將音頻文件的Base64編碼顯示成文本,文件越大,編碼也就越長,傳輸也就會越慢(圖5)。

1.文本審核
(1)基本測試:Base64編碼,是處理發(fā)送和接收信息的基本編碼,隨時都在使用的。比如在文本審核時,過濾一些敏感詞語。組件設計如圖6,組件屬性隨意設置,能測試即可。

(2)敏感詞匯代碼:輸入敏感詞匯,然后提交,就會在下方顯示其Base64編碼。延時1秒(1000毫秒)是因為文件管理器是異步保存文件,保存后才進行編碼(圖7)。

(3)待審文本代碼:輸入待審文本,然后提交,就會在下方顯示其Base64編碼。延時后保存文件,然后進行編碼(圖8)。

(4)文本審核代碼:敏感詞匯和待審文本提交后,才能進行文本審核,用紅色背景提示包含敏感詞匯。
比如“敏感詞匯”輸入“流氓”,“待審文本”輸入“誰是流氓”,提交后顯示如圖9左圖,再點擊“文本審核”,即顯示圖9右圖。
通過實例,我們看到Base64編碼可作為比較文本內容的一個方法。
2.圖片審核

如果是文字圖片,先識別文字后,直接審核文字無需轉碼。普通圖片則需要轉碼后與敏感圖片的編碼進行比較,這個比較不是單純地比較重復代碼,而是需要提前進行機器學習(AI神經(jīng)網(wǎng)絡學習),獲取敏感圖片的特征編碼,再用于審核待審圖片的編碼。想要開發(fā)自己的審核程序可以參考相關AI神經(jīng)網(wǎng)絡學習的開放平臺的說明(百度、騰訊、阿里等),本文不做探討。
3.音頻審核:一般是將音頻文件進行語音識別后,通過文本比較進行審核。
4.視頻審核:視頻如果是人工審核,則需要大量人力和時間,一般采用的方法是在視頻中抽取一定數(shù)量的幀,變成圖片后再進行審核。
實際應用中,對信息的審核是根據(jù)內容和算法的不同,而采取了不同的審核方法,主要是利用AI(人工智能)進行自動審核,除了自己開發(fā)應用程序外,現(xiàn)在很多網(wǎng)站也提供了相應的服務,有興趣的朋友可以上網(wǎng)查詢一下相關資料。