Base64編碼及其在AppInventor中的應用

2021-07-01 18:54:47王德貴丁大為

電腦報 2021年5期

關鍵詞：詞匯文本

王德貴丁大為

上一期我們介紹了Base64編碼的基本知識和應用在文本編碼中的實例，下面繼續(xù)學習Base64編碼在圖片和聲音中的應用，以及信息審核中的原理解析。

一、編碼應用實例

1.圖片編碼

由于圖片的大小不一，Base64編碼文件可能特別大，可以將圖片等比例縮放，這要下載一個圖片轉換插件“TaifunImage”（圖1）。

這里調用了一個過程“resizeimage”，在AppInventor中，也叫函數(shù)（圖2）。

用這個函數(shù)將任意大小的圖片，轉換成寬度為300，高度按原圖成比例的新圖片，便于轉碼。

圖片來源可以是照片，也可以是圖像文件。經(jīng)過縮放處理后，點擊“查看”按鈕，即可看到圖3的效果。這里顯示的編碼大約是全部編碼的1/25。

2.聲音編碼

把3秒的音頻文件，轉換為Base64編碼（圖4）。

點擊錄音后調用錄音機實時錄音3秒，錄音格式默認為“3gp”，也可選擇其他音頻文件進行轉換，這里不再說明，有興趣的朋友可自行研究。這里將音頻文件的Base64編碼顯示成文本，文件越大，編碼也就越長，傳輸也就會越慢（圖5）。

二、AI智能審核原理解析

1.文本審核

（1）基本測試：Base64編碼，是處理發(fā)送和接收信息的基本編碼，隨時都在使用的。比如在文本審核時，過濾一些敏感詞語。組件設計如圖6，組件屬性隨意設置，能測試即可。

（2）敏感詞匯代碼：輸入敏感詞匯，然后提交，就會在下方顯示其Base64編碼。延時1秒（1000毫秒）是因為文件管理器是異步保存文件，保存后才進行編碼（圖7）。

（3）待審文本代碼：輸入待審文本，然后提交，就會在下方顯示其Base64編碼。延時后保存文件，然后進行編碼（圖8）。

（4）文本審核代碼：敏感詞匯和待審文本提交后，才能進行文本審核，用紅色背景提示包含敏感詞匯。

比如“敏感詞匯”輸入“流氓”，“待審文本”輸入“誰是流氓”，提交后顯示如圖9左圖，再點擊“文本審核”，即顯示圖9右圖。

通過實例，我們看到Base64編碼可作為比較文本內容的一個方法。

2.圖片審核

如果是文字圖片，先識別文字后，直接審核文字無需轉碼。普通圖片則需要轉碼后與敏感圖片的編碼進行比較，這個比較不是單純地比較重復代碼，而是需要提前進行機器學習（AI神經(jīng)網(wǎng)絡學習），獲取敏感圖片的特征編碼，再用于審核待審圖片的編碼。想要開發(fā)自己的審核程序可以參考相關AI神經(jīng)網(wǎng)絡學習的開放平臺的說明（百度、騰訊、阿里等），本文不做探討。

3.音頻審核：一般是將音頻文件進行語音識別后，通過文本比較進行審核。

4.視頻審核：視頻如果是人工審核，則需要大量人力和時間，一般采用的方法是在視頻中抽取一定數(shù)量的幀，變成圖片后再進行審核。

實際應用中，對信息的審核是根據(jù)內容和算法的不同，而采取了不同的審核方法，主要是利用AI（人工智能）進行自動審核，除了自己開發(fā)應用程序外，現(xiàn)在很多網(wǎng)站也提供了相應的服務，有興趣的朋友可以上網(wǎng)查詢一下相關資料。

Base64編碼及其在AppInventor中的應用

一、編碼應用實例

二、AI智能審核原理解析

二、AI智能審核原理解析