摘"要:"文章緊抓新一代人工智能發展背景和機遇,按照煙草行業數字化、網絡化、智能化要求,融合行業雙中臺,研發管控技術標準,思考研究構建一套“統一人工智能模型編碼、統一行業特征數據訓練、統一人工智能算力輸出、統一研發管控對接標準”的模數雙驅動人工智能平臺(簡稱“AI中臺”)及算法模型,運用語音識別、語義識別、圖像識別等多種AI技術,對營銷、專賣、物流、企業管理等各業務智能化場景進行集中AI能力輸出和管控,實現人工智能與新型數字基礎設施的深度融合。
關鍵詞:人工智能;煙草商業;平臺建設
中圖分類號:F721文獻標識碼:A文章編號:1005-6432(2025)"11-0195-04
DOI:10.13939/j.cnki.zgsc.2025.11.049
1"研究背景
業務人員及管理人員智能化需求龐雜分散,各個業務單元對智能化的需求越來越多樣化,具體業務場景如:客戶經理指導零售客戶圖片或視頻盤庫、在線巡店、非煙商品及無碼商品入庫等[1-2],專賣人員開展現場語音智能錄入、案卷質檢、案件智能研判等,物流園區開展智慧園區建設等,綜合管理人員智能會議等,這些領域都需要人工智能的輔助加持。
針對以上需求,基于國家局研發管控平臺、數字中臺的技術標準基礎之上,研究構建一套統一人工智能模型編碼,統一行業特征數據訓練,統一人工智能算力輸出,統一研發管控對接標準的煙草商業企業人工智能平臺,平臺整合圖像識別、多模態、語音、語義識別、深度學習、ChatGPT開源代碼等技術,對各業務單元(業務子系統)的智能化需求進行集中管理與規劃,與實際業務深度融合,提高工作效率,降低人力成本。
2"研究內容
文章基于煙草行業研發管控平臺、數字中臺的技術標準基礎之上,研究構建統一的人工智能平臺及算法模型,整合圖像識別、多模態、語音、語義識別、深度學習等技術,對于各業務單元的智能化需求進行集中管理與規劃,與實際業務深度融合。文章能夠促進各部門之間對人工智能的協同應用,提高公司整體的效率和競爭力,進一步推動企業數字化轉型及高質量發展。文章希望通過平臺,實現AI能力的統一管理和資源共享,為公司提供更加高效、準確和智能的解決方案。同時,文章也將致力于保障平臺的安全性,確保數據和信息的保密性和完整性。主要研究內容包括以下五個部分。
2.1"煙草商業企業人工智能平臺構建
煙草商業企業AI中臺是統一的AI能力生產平臺,主要包含能力開放、能力納管、運營管理、數據標注和模型訓練等平臺功能,滿足行業對通用性AI能力的統一數據接入、統一標準服務、不同系統相關方的納管需求。
AI能力開放平臺:基于AI平臺研發人工智能和成熟能力廠商引入服務能力,包括以上煙草行業通用AI能力及后續擴展通用AI能力等,對煙草行業生產經營管理各業務單元提供標準、統一的API服務。
能力納管平臺:提供統一的AI模型和引擎的管理,提供對AI能力統一接入、AI能力標準協議制定、AI能力測試等功能,提升AI能力的復用效率。
運營管理模塊:提供統一的運營功能及業務流程,包含租戶管理、項目管理、權限管理、統一認證、日志管理等基礎管理功能。
數據標注平臺:研究基于煙草行業的文本、圖像、音頻和視頻等數據進行高質量、高精度的標簽處理,來滿足機器深度學習的需求。
模型訓練平臺:研究基于AI開發工具低碼或者無碼開發[3],通過簡單拖拽完成數據挖掘到模型生成的過程,支持不同模型效果評估來選擇最優模型。
2.2"AI中臺與行業雙中臺、一體化平臺的對接路徑研究
文章將打通業務中臺、數據中臺和AI中臺之間的通道,實現多平臺協同對接、數據共享和流動,數據中臺可以提供高質量的數據源和處理能力,支持AI中臺的算法和建模工作,AI中臺則直接對接一體化平臺的各子系統,為各業務提供智能化的服務和功能,以提高業務的效率和競爭力,更好地支持企業的業務發展和數字化轉型。
2.3"煙草商業企業AI能力模型算法研究
(1)煙草商業企業通用AI能力研究。圍繞行業“上云、用數、賦智”要求,聚焦煙草行業當前共性、急需、核心的人工智能能力建設需求,綜合運用文獻綜述、案例分析等方法,研究從OCR(optical"character"recognition,光學字符識別)類、智能語音類、NLP(natural"language"processing,自然語言處理)類歸納煙草商業企業的具體通用AI能力,并進行技術實現。
基于OCR技術的基礎圖像內容挖掘:多項OCR能力集成,以實現基礎圖像內容的信息挖掘,包括但不限于表格文字識別、身份證識別、增值稅發票識別、營業執照識別以及煙草專賣證OCR識別、圖片識別等方面的基礎和AI應用能力。
基于智能語音技術的煙草語音智能分析:針對煙草應用環境,構建在行業各業務語境下的短語音識別等方面的AI技術和應用能力,實現機器“能聽會說”,滿足行業各業務場景下對智能語音能力的需求。
基于NLP技術的文本糾錯等應用AI能力。
(2)煙草商業企業專有AI能力探索研究。結合通用AI能力,以及煙草現有的知識、數據,聚焦當前共性、急需、核心的人工智能建設需求,研究煙草行業專有的AI能力模型。
第一,基于深度學習的煙草文本差異提取方法研究。文章針對煙草行業的文本差異提取問題,提出一種基于深度學習的文本差異提取模型。該模型的主要思路是,首先對待比較的文件進行預處理,將其轉換為標準的文本格式,然后利用中心詞提取模型,將兩個文件中的描述語句進行匹配,找出相同或相似的語句對。接著,對每個語句進行分詞和詞性標注,根據詞性和語義信息,將語句切分為若干個部分,識別出其中存在的差異點,并將差異點以標記的形式輸出[4]。該模型可以廣泛應用于煙草行業的各類文件差異提取,包括煙草標準、技術指導文件、管理文件等。通過該模型,可以幫助煙草行業的工作人員快速、準確地發現文件之間的差異,提高工作效率和質量。
第二,基于情感分析關鍵技術實現市場輿情分析研究。文章考慮到行業本身存在較高風險性質,并且受到社會輿論影響比較大等因素,將針對煙草的網絡文本輿論進行格式化清洗和分析,獲取當中的情感信息,建立一個情感微觀劃分與細致量化模型,使得該行業更好地理解目標客戶群體對于產品品牌形象評價、健康問題等議題上態度傾向,從而使得公司能夠快速調整營銷策略并推出符合市場趨勢的活動計劃。
第三,基于命名實體識別的煙草市場實體關系挖掘方法研究。文章提出一種針對煙草行業的市場的實體挖掘方法模型,該模型涵蓋了多個方面,包括煙草制品銷售網絡模型、煙草市場輿情監測、煙草品牌分類定位分析。煙草場景下的命名實體識別研究內容涉及識別和提取與煙草相關的實體,如品牌名稱、煙草種類、煙草制品名稱、煙草成分、煙草制品銷售渠道等。通過對這些命名實體的識別和提取,可以幫助煙草行業進行市場調研、產品定位、銷售分析等工作,也可以為煙草相關法規的制定提供數據支持。同時,命名實體識別技術也可以應用于煙草行業的輿情監測和品牌形象管理等方面。在煙草場景中,復雜實體的標注及文本多特征表示研究內容涉及對具有多個屬性和關系的實體進行標注和表示的技術和方法,以便煙草行業進行市場調研、產品定位、銷售分析等工作。
第四,煙草復雜網絡市場分析研究。通過分析煙草市場、煙草消費者和煙草品牌,提出了一種針對煙草行業的市場分析模型。該模型涵蓋多個方面,包括市場規律指標體系分析模型、零售終端店鋪經營分析模型、消費者標簽網絡分析模型、煙草品牌競爭網絡分析模型。這些都是構成市場分析的關鍵因素,可以幫助企業更好地了解市場需求和競爭情況,從而制定更好的營銷策略和供應鏈管理策略,提高企業的市場占有率和經營效益。
其中:市場規律指標體系分析模型是一種基于PMI(purchasing"managers’index)的市場敏感度分析工具,用于卷煙市場的各方面敏感度分析。該模型從卷煙消費者、產品、商圈、城市、經濟、客流等各方面指標出發,構建復雜網絡,動態分析各個指標之間的關聯性和影響因素,從而找出卷煙市場的規律和趨勢。這有助于卷煙企業從物流管理、庫存管理、生產計劃和銷售等方面提高供應鏈的整體性、實時性和穩定性。該模型可以幫助企業制定合理的市場策略,提高企業對煙草市場的整體洞察能力。
零售終端店鋪經營分析模型是一種終端運營狀態分析模型,用于分析終端全商品的動銷與庫存關系和商品與消費者匹配度,從而診斷終端運營生態的健康狀態。該模型通過對終端在銷各品類商品動銷率分析,構建品類經營風險評估模型,實現終端品類優化的目的。通過對銷售數據進行匯總分析構建商品關聯度評估模型,提出店鋪商品關聯陳列建議。該模型通過對主銷商品產品屬性和消費者偏好進行關聯分析建模,實現終端核心消費者群體畫像,進而對全店鋪商品與核心消費者匹配度分析,給出全店鋪商品優化建議。該模型以終端銷售數據為基礎,以提升終端經營利潤為目的,向終端經營者以及對應一線營銷工作人員推送分析結果。該模型可以幫助終端經營者實現店鋪經營優化智能提醒,也可以為一線營銷人員的終端經營指導提供數據參考,提高終端經營能力的同時提升一線營銷人員客戶服務專業化水平。
消費者標簽網絡分析模型是一種多維度建模工具,用于針對煙草行業的消費者行為分析。該模型包括消費者的基本屬性、消費頻率、興趣愛好、購買渠道、價值觀等方面的信息,構建復雜網絡,補充完善消費者標簽畫像。通過對各類型消費者的關聯路徑以及歷史數據的分析,合理規劃各品類煙草產品的供應量、供應地區等指標。該模型還具備關聯路徑挖掘、網絡快速拼接技術和網絡壓縮技術等功能,可以實現消費渠道消費模式的有效發現,通過對消費者信息的深度挖掘分析提高企業的運營效率。
煙草品牌競爭網絡分析模型是一種市場品牌分布分析模型,用于分析卷煙市場中各品牌的競爭關系和市場份額分布,從而識別卷煙品牌和國產雪茄煙的市場風險和機會。該模型通過對卷煙品牌的產品構建市場風險評估模型,實現卷煙品牌和國產雪茄煙的市場風險感知。該模型以卷煙品牌及旗下的產品為節點,以市場份額為邊連接,可以構建產業鏈供給預測模型,實現根據市場趨勢對商業企業煙葉產、銷、存給出合理預測。該模型可以幫助卷煙企業計劃市場策略,提高企業的市場占有率,增強企業的競爭力。
2.4"煙草商業企業AI中臺應用標準體系研究
在技術開發的同時,研究在國家局數據標準建設要求下,建立煙草AI能力接入、自動化測試、統一服務接口的標準化研究。
(1)研究制訂AI能力接入標準:支持不同的廠商及煙草新增的算法模型進行不同方式的接入,包括但不限于算法引擎、API等方式,快速集成并接入煙草AI能力體系。
(2)AI能力自動化測試標準研究:根據協議生成的自動化測試用例以及用戶編寫的測試用例,自動在測試環境中進行部署測試驗證,協助用戶保障服務的穩定性。
(3)AI能力標準協議研究:研究構建AI能力的標準協議(API接口),僅需進行簡單的能力標準協議適配,即可實現內部AI能力的統一規劃調用,通過AI中臺屏蔽因不同能力提供廠商帶來的接口差異,提升能力復用率。
2.5"煙草商業企業AI中臺網絡安全體系研究
人工智能的應用越廣泛,對網絡安全的要求就越高,文章旨在建設網絡安全機制,以保障煙草商業企業在人工智能平臺建設過程中的信息安全和數據保護[5]。研究內容包括以下三方面。
(1)私有化部署:研究AI中臺本地化部署。在數據安全及模型訓練方面,將非敏感數據在公有云上進行訓練,結果反饋至本地服務器中,與企業業務數據相結合。
(2)網絡訪問控制:實施完善的網絡訪問控制機制,包括身份認證、授權和權限管理等,確保只有經過授權的用戶才能訪問敏感數據和功能。
(3)網絡備份恢復:建立可靠的數據備份技術和恢復機制,定期對關鍵數據進行備份,以應對意外數據丟失或系統故障的情況。
通過以上網絡安全機制的建設,確保人工智能平臺在建設過程中具備高水平的信息安全保障措施,保護公司的敏感數據和業務運行的安全性和可靠性。而隨著網絡加密與安全審計的建設,將構建陜西煙草公司牢不可破的網絡安全線。
3"技術路線
文章基于云原生技術為底座,以企業級數據中臺數據為來源,對數據的清洗、融合、標注、訓練等過程定向調優,對AI能力進行接入、管控、監控、運營全方位管理。基于行業專屬的語音識別能力、OCR和自然語言處理技術,實現煙草商業企業文本信息抽取、文本差異成分匹配、文本情感細粒度強度分析和文本語義結構發現等煙草行業業務的研究。技術路線如圖1所示。
4"研究優勢及創新性
(1)在數據管理與質量控制方面,建立智能化平臺數據庫或者數據倉庫,將商業企業業務與管理產生的大量數據整合起來,對數據進行統一存儲、管理、清洗和訓練,確保數據質量。實現數據自動標注、去重和標準化,提高數據可用性,為企業決策提供有力支持。
(2)在AI算法庫構建方面,建立人工智能模型代碼編寫標準,采用統一平臺對構建的模型進行編譯。整合多種成熟的AI算法,如深度學習、自然語言處理、多模態、智能語音識別、OCR圖像識別等,
圖1"技術路線
對各業務領域智能化場景進行集中AI能力輸出和管控。
(3)在模型構建與訓練評估方面,基于人工智能訓練成果,構建了行業特有的“GPT”后臺,建立了具有行業特征的多模態數據預訓練模型,提供了豐富的模型訓練、調優和評估工具,快速搭建、優化和部署AI模型,并結合自動化技術(如自動化腳本、工作流引擎等)簡化各業務單元AI項目的實施過程,有效降低人力成本。
(4)在行業調用及融合平臺方面,按照行業研發管控技術標準的要求,實現管控數據實時上報。同時,提供統一的API接口,為行業一體化平臺各業務子系統(營銷、專賣、物流、綜合管理)提供統一的智能算力輸出及標準API接口服務,促進內部各業務系統之間交互,各業務人員之間的溝通協作,實現人工智能技術的全面推廣與應用。
(5)在標準的建立及創新方面,將數字化、智能化與標準化同步開展,建立“四統一”AI中臺相關技術標準和管理標準,為研究成果深入推廣應用提供配套的標準支撐。
(6)在可擴展性與推廣性方面,為平臺設計可擴展的架構,支持行業一體化平臺對接及未來業務發展技術演進的需求。設計靈活的接口配置選項,便于根據不同業務單元場景和需求進行調整。
5"結論
文章研究了基于煙草商業企業的“四統一”人工智能平臺及算法模型,能夠支持各種AI業務需求,促進各業務系統間的AI交互,為行業一體化平臺各業務子系統提供統一的智能算力輸出及標準接口服務,增強了行業數字化、智能化發展能力,大大提升了員工的工作效率和知識邊界。
參考文獻:
[1]馬宗澤,李劍鋒,陳越昆,等."卷煙新零售模式及其大數據平臺構建和應用[J].云南師范大學學報(自然科學版),2024,44(1):45-50.
[2]付二局,魯鐘情,張超.基于大數據和人工智能技術的貨源投放模式探索[J].中國信息化,2023(7):90-91.
[3]潘囿丞,侯永帥,楊卿,等.大規模語言模型的跨云聯合訓練關鍵技術[J].中興通訊技術,2023,29(4):49-56.
[4]羅鵬程,王一博,王繼民.基于深度預訓練語言模型的文獻學科自動分類研究[J].情報學報,2020,39(10):1046-1059.
[5]趙月,何錦雯,朱申辰,等.大語言模型安全現狀與挑戰[J].計算機科學,2024,51(1):68-71.
[作者簡介]通訊作者:劉佳(1989—),女,碩士,現就職于陜西省煙草公司西安市公司信息中心,科員,研究方向:通信與信息系統、網絡安全與信息化等。