999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

BI工具嵌入編程語言助力企業數字化管理決策
——以某運營商的體驗問卷數據分析為例

2023-06-07 04:53:56
中國新技術新產品 2023年5期
關鍵詞:可視化文本

胡 琴

(上海郵電設計咨詢研究院有限公司,上海 200092)

1 現狀

1.1 企業管理決策面臨的問題

大數據背景下,企業管理決策的環境越來越復雜,存在決策滯后的風險。雖然企業可以通過問卷調查、購買以及采集等各種方式獲取多種多樣的海量數據,制定基于數據驅動的管理決策方案,但是大數據的數據信息在不斷更新,會加大企業篩選具有價值信息的難度,使企業決策環境更復雜[1]。低效率的管理決策程序會降低決策的效果,影響企業的發展,因此企業應簡化決策程序,以提高決策價值[1]。

1.2 BI 工具助力企業數字化管理決策

BI 工具流程簡便,可以實現數據自動更新,只需要簡單的幾個操作就可完成。BI 工具不僅可以通過自嵌的智能算法進行趨勢預測,而且還可以通過嵌入Python、R 編程語言的算法包進行數據挖掘。BI 工具不僅能提高企業中高層的決策水平和效率,而且還能使企業的每個員工都成為決策者。如何進一步加快大數據分析技術應用,構建適應管理決策研究特點規律的定性與定量相結合、數據分析與專家知識相互滲透的數據驅動技術工具和模型,提高基于數據的管理決策分析質量和能力,是未來該領域研究的重點方向之一[2]。

2 數據分析工具助力企業數字化管理決策

2.1 數據分析工具

在數字化轉型的浪潮下出現了各種數據分析工具,性能較好的數據分析工具見表1。

表1 數據分析工具統計表

數字化時代,大多數企業都會擁有自己的信息系統,其中積累了大量的數據。信息系統中的原始數據價值很小,只有通過智能化的數據分析方法抽取其中的精華,才能轉變為信息“金礦”,為人類造福[3]。數據的智能化分析是通過建立數據模型實現重復操作的模塊化。一般智能數據分析會通過各種數據統計、數據分析、數據挖掘以及數據可視化等工具來實現。

2.2 Tableau

Tableau 是企業比較常用的一款BI 數據分析工具,其擁有非常強大的數據可視化功能。為了在已有功能的基礎上進一步擴展編程語言的功能,Tableau 在2016 年發布了一個可以在Tableau 工作簿中運行Python 代碼的新API——TabPy。并且從第八個版本開始,Tableau 增加了R 語言的接口,R 腳本也可以在Tableau 中運行,自此R 強大的數據統計、挖掘功能也能在Tableau 中實現了。科學合理的決策源于數據,借助世界一流的BI 分析工具能讓企業做出更明智的管理決策。

2.3 BI 數據分析工具嵌入編程語言

編程語言隨著信息技術的發展已逐步進入BI 數據分析工具,例如通過內嵌Python、R 編程語言的算法包(jieba 中文分詞、K-Means 聚類等),可以實現對BI 數據分析工具中的數據進行挖掘分析的功能。

該文在Tableau 中嵌入Python 編程語言的中文分詞工具——jieba 庫,實現了對調查問卷中文本的關鍵詞進行提取的功能。通過在Tableau 中嵌入R 編程語言的K-Means 聚類算法,實現了根據客戶評分對31 省的評分進行聚類分析的目標。

3 Tableau 嵌入Python 進行BI 數據分析

3.1 分析體驗問卷中的文本

在某運營商人工客服體驗項目中,當對體驗問卷中的文本進行分析時,會遇到需要利用工具來對文本中的關鍵詞進行提取的問題。為了解決該問題,該文采用嵌入Tableau 中的Python。Python 編程語言一直都是最受歡迎的編程語言之一。該文采用Python 中的jieba 庫,jieba 庫中的jieba.analyse.extract_tags 函數可以從字符串中提取關鍵的地名、名詞、動名詞和動詞。文獻[4]、文獻[5]利用 Python 對中文文本進行分析研究。

提取關鍵詞后,需要借助工具對關鍵詞進行詞云呈現,該文采用最受歡迎的BI 工具之一——Tableau。

3.2 Tableau 嵌入Python 提取文本中的關鍵詞

3.2.1 在Tableau 中安裝Python 環境

找到tabpy_server 的安裝目錄,該文的目錄在D:Pycharm ProjectsPythonProject Libsite-packages abpy_server。具體參考安裝目錄,如果是Windows 系統,就運行startup.bat;如果是Linux 或MAC 系統,就運行startup.sh。也可以在tabpy_server 的安裝目錄下運行CMD,然后在彈出的窗口中輸入“Python tabpy.py”和“startup.bat”。

該文使用的是Windows 系統,并把tabpy 部署在本機。顯示“Web service listening on port 9004”這個信息代表服務器啟動成功,開始監聽9004 端口。

3.2.2 在Tableau 中連接tabpy 服務器

打開Tableau,在“幫助”欄單擊“設置和性能”,再單擊“管理外部服務連接”,在彈出的窗口中的“服務器”框選擇“localhost”,“端口”框輸入“9004”。單擊“測試連接”,彈出“成功連接到TabPy 服務”的窗口,說明已成功連接,單擊“確定”,就成功設置了客戶端連接服務器。

3.2.3 導入體驗問卷數據,提取文本中的關鍵詞

某運營商的人工客服體驗問卷“建議”字段中的文本數據(部分)內容如圖1 所示。

圖1 人工客服體驗問卷“建議”字段中的文本數據(部分)

在該案例中總共收到了來自31 省的1 108 條建議數據,將其導入Tableau 中,單擊“建議”字段右上角的“▼”按鈕,下拉菜單選擇“創建計算字段”。

在彈出的窗口中,將字段命名為:標簽,鍵入函數如下。

SCRIPT_STR(“

# 導入jieba 中文分詞庫

import jieba.analyse

# 導入re 正則表達式

import re

#使用正則表達式過濾掉不可見的字符,如換行等,以避免報錯

ctn = [re.sub(‘s’,’’, str) for str in _arg1]

#使用jieba 從內容提取關鍵詞,只提取權重最高的1 個名詞

tags = [jieba.analyse.extract_tags(c, topK=1, allowPOS=(‘n’)) for c in ctn]

#將提取結果的格式處理成字符串,以返回給Tableau

result = [‘,’.join(r) for r in tags]

return result”,

attr([建議]))

在工作表中將字段“序號”“建議”拖放至行,“標簽”拖放至文本。關鍵詞就從文本中提取出來了,Tableau 中的界面如圖2 所示。

圖2 “從”建議“中提取出權重最高的1 個名詞

如果對體驗問卷中的“建議”文本數據進行了變更,只需要在對應連接路徑的Excel 表格中進行更改,然后在Tableau數據源中單擊“刷新數據源”就能一鍵實現數據的智能化更新功能。

3.3 Tableau 對關鍵詞進行詞云呈現

對“標簽”中提取出來的詞進行頻數統計,在Tableau中將“標簽”拖放到顏色、文本,“計數”拖放到大小。詞云呈現結果如圖3 所示。

圖3 Tableau 對關鍵詞進行詞云呈現

4 Tableau 嵌入R 進行BI 數據分析

4.1 對體驗問卷中的省份進行聚類分析

在某運營商人工客服體驗項目中,當對體驗問卷中的31省根據評分進行聚類分析時,會遇到需要利用工具來進行聚類分析的問題。為了解決該問題,該文采用嵌入Tableau 中的R。R 語言是完全免費且開放源代碼的,其標準的安裝文件自身就帶有許多模塊和內嵌統計函數,安裝好后可以直接實現許多常用的統計功能,大多數最新的統計方法和技術都可以在R 中直接得到。該文使用R 語言中的K-Means 聚類算法,K-Means 算法是聚類算法中的經典算法,其原理簡單、實現快速,當簇與簇之間有明顯區別時,其聚類效果會比較好。但是,K-Means 算法需要事先給出需要生成簇的個數,不適用于簇差別很大的情況。

在對省份進行聚類分析后,最好能對31 省的評分進行可視化呈現,這里用到的是Tableau。

4.2 Tableau 嵌入R 進行聚類分析

先下載并安裝R,然后打開R,在其中運行以下腳本。

install.packages(“Rserve”)

library(Rserve)

Rserve()

打開Tableau,在“幫助”欄單擊“設置和性能”,再進去“管理外部服務連接”,在彈出的窗口中的“服務器”框選擇“localhost”,“端口”框輸入“6311”,單擊“測試連接”,彈出成功窗口。連接成功后,單擊“確定”,就可以成功設置客戶端連接R 服務器。

某運營商的人工客服體驗問卷31 省評分數據(部分)如圖4 所示。

圖4 人工客服體驗問卷31 省評分數據(部分)

將其導入Tableau 中,在Tableau“分析”欄下單擊“創建計算字段”,在彈出的窗口中,將字段命名為:簇,鍵入函數如下。

SCRIPT_REAL('

fit <- K-Means(data.frame(.arg1,.arg2,.arg3,.arg4,.arg5),centers=5);

fit$cluster',

SUM([回復內容清晰易懂]),SUM([業務熟練度]),SUM([服務態度]),SUM([客服響應及時性]),SUM([整體服務評價]))

在工作表中,將“體驗省份”拖入列,計算字段“簇”拖入行、顏色和文本,最終呈現結果如圖5 所示。

圖5 將31 省根據評分聚類為5 大類

4.3 Tableau 對31省評分進行可視化呈現

在Tableau 中,將評分表中的“體驗省份”拖入列,將“回復內容清晰易懂”、“業務熟練度”、“服務態度”、“客服響應及時性”以及“整體服務評價”拖放到行,并將標記類型設置為“區域”,添加平均值參考線后可視化呈現結果如圖6 所示。

圖6 對31 省評分數據進行可視化呈現

5 結語

在數字化生活背景下,傳統的管理變成或正在變成數據的管理,傳統的決策變成或正在變成基于數據分析的決策。企業在開展決策管理工作的過程中,可立足于數據挖掘技術對各類數據進行篩選和提煉。也就是說,通過問卷調查、購買數據以及網絡爬蟲等方式對數據進行采集,獲取的數據經系統清洗后進行分類,分類后的數據存儲在數據倉庫中。然后可以通過ETL 等工具對已有的數據進行提取、轉換以及加載等預處理,再使用聚類、決策樹以及預測等相關大數據分析方法進行數據挖掘,從而采取可視化、商業智能(BI)等技術為企業數字化管理決策提供幫助。

猜你喜歡
可視化文本
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 亚洲高清在线播放| 亚洲精品无码久久久久苍井空| 日本欧美一二三区色视频| 免费国产小视频在线观看| 久久国产热| 日本在线免费网站| AV在线天堂进入| 91黄色在线观看| www欧美在线观看| 热久久这里是精品6免费观看| 全色黄大色大片免费久久老太| 国产成人麻豆精品| 色有码无码视频| 亚洲精品第一页不卡| 在线不卡免费视频| 午夜欧美理论2019理论| 亚洲日本一本dvd高清| 亚洲人成网线在线播放va| 免费国产在线精品一区| 日本精品αv中文字幕| 日本高清在线看免费观看| 亚洲日韩国产精品无码专区| 国产美女视频黄a视频全免费网站| 高h视频在线| 91po国产在线精品免费观看| 午夜少妇精品视频小电影| 高清色本在线www| 亚洲永久色| 国产精品自在拍首页视频8| 在线无码私拍| 欧美精品二区| 亚洲三级a| 国产精品无码在线看| 亚洲精品第一在线观看视频| 久久夜夜视频| 久久免费看片| 天天做天天爱天天爽综合区| 成人在线不卡视频| 免费一级毛片在线观看| 亚洲AⅤ永久无码精品毛片| 久久天天躁狠狠躁夜夜2020一| 日韩在线欧美在线| 亚洲欧美一区二区三区蜜芽| 欧美午夜在线观看| 亚洲无码电影| 婷婷综合亚洲| 亚洲黄色成人| 国产综合精品日本亚洲777| av在线手机播放| 91青青草视频| 欧美国产菊爆免费观看| 91国内在线观看| 啪啪国产视频| 色噜噜狠狠狠综合曰曰曰| www成人国产在线观看网站| 亚洲综合第一区| 中国国产高清免费AV片| 亚洲欧美国产高清va在线播放| 亚洲性日韩精品一区二区| 国产在线专区| 亚洲无码精品在线播放| 色偷偷综合网| a毛片在线播放| 综合网天天| 国产欧美日韩综合一区在线播放| 久久久久免费精品国产| 欧美乱妇高清无乱码免费| 日本精品中文字幕在线不卡| 欧美第一页在线| 亚洲人成电影在线播放| 国产在线观看精品| 婷婷亚洲最大| 国产免费久久精品99re不卡| 国产成人一区在线播放| 欧美日韩国产综合视频在线观看| 日韩无码视频专区| 国产亚洲视频在线观看| 日韩精品专区免费无码aⅴ| 999精品在线视频| 制服丝袜一区| 国产成人在线无码免费视频| 99久久人妻精品免费二区|