廖繼東 林 風
(河南省總工會干部學校 鄭州市 45002)
黨的十九大報告指出,加快建設創新型國家,建設科技強國、質量強國、航天強國、網絡強國、交通強國、數字中國、智慧社會。第一次提出了“智慧社會”這一概念。追本溯源的話,“智慧社會”是對前幾年提出的“智慧城市”的擴大版和升級版,而“智慧城市”則是美國科技巨頭IBM 公司提出的“智慧地球”的中國化和城市化。2008年,美國將“智慧地球”定為國家戰略,接下來,很多發達國家也提出了自己的智慧國家戰略。例如2012 年9 月,韓國政府提出了“智慧韓國”的發展目標。中國在面對第三次產業革命和即將到來的第四次產業革命,也同樣做出建設智慧社會這一重大戰略部署。
智慧社會中,“智慧”是核心。智慧從何而來呢?我們認為智慧就是國家治理者的決策,決策水平的高低代表了智慧的高低。目前蓬勃發展的各種信息化技術,為國家治理者、工會工作者提供了非常重要的技術支撐。2019 年,習近平總書記在第六屆世界互聯網大會的賀信中說到:“當前,新一輪科技革命和產業變革加速演進,人工智能、大數據、物聯網等新技術新應用新業態方興未艾。”黨的十九大報告中指出推動互聯網、大數據、人工智能和實體經濟深度融合。
在這些信息技術中,互聯網、移動互聯網、物聯網是數據采集、加工、傳輸的技術;云計算是用來構建信息系統的平臺技術;而能給決策者直接提供決策幫助的是人工智能和大數據技術。
在目前人工智能技術尚未成熟的情況下,大數據是智慧社會中智慧的重要源泉,一個國家、一個社會、一個城市想要“智慧”,離不開對大數據的利用和分析。
為了更好地利用大數據,2015 年,國務院出臺了《促進大數據發展行動綱要》。隨后,國家決定實施“國家大數據戰略”,許多省市也紛紛成立了大數據管理局,規劃建設大數據產業園,加快推進本地的數據共享融合。預計中國的大數據市場產值將很快超過萬億元。
在黨的《加強和改進黨的群團工作的意見》出臺后,工會組織正在主動進行自身改革創新,以改革推動群團組織提高工作和服務水平,努力開創黨的群團工作新局面。其中建設網上工會,打造智慧工會,正是工會改革創新的重要組成部分。
如果說“工會上網”是“互聯網+工會”的初級階段,屬于工會工作的初步信息化和網絡化,其特點主要是在工會工作中利用網絡,如電子郵件,網絡檢索信息,通訊軟件,提升工作效率和降低工作成本等;那么“網上工會”就是“互聯網+工會”的中級階段,就是把工會工作盡可能地延伸到網上,拓展工會工作的新空間,增加工會工作的新手段,更好地團結和聯系職工;而“智慧工會”則是“互聯網+工會”的高級階段,它是運用大數據分析、人工智能、數據挖掘,深度學習以及機器學習等技術,及時、準確地把握工會會員的情況和需求,決定工會工作的下一步方向。上述的這三個階段,類似于駕駛方式中的手動擋駕駛,自動擋駕駛和自動駕駛。自動擋駕駛升級到自動駕駛,是一個突破性的發展。自動駕駛中,車輛可以根據前方路段擁堵情況,自動調整重新規劃行駛路徑,這就是智慧的體現。要判斷前方路段是否擁堵,主要就是依賴大數據技術。
中國工會十七大報告中指出:“強化互聯網思維,運用大數據、云計算、物聯網、人工智能等手段推進工會工作,促進互聯網和工會工作融合發展,構建網上工作平臺,打造工會工作升級版?!盵1]從這里可以看出,智慧工會是工會運用多種信息化手段,融合工會工作者的互聯網思維,構建智能化工會工作體系。
2017 年,中華全國總工會印發了《全國工會網上工作綱要(2017-2020 年)》,其中主要任務部分中的 “四大建設”專門提到“智慧數據庫建設,……充分利用大數據與人工智能技術,建設工會決策支持系統,為廣大職工的普惠服務、職工隊伍狀況的深度分析和工會組織的高效運轉提供必要的科技手段?!盵2]這也充分說明了,中華全國總工會對大數據技術的高度重視和深入分析。
美國著名學者阿爾文·托夫勒(Alvin Toffler)將大數據認為是“第三次浪潮的華彩樂章”。盡管現在很多政府部門和公司,認為海量的數據就是大數據。但是基于學術觀點,大數據應具有:容量大、多樣化和速度快的特征,也就是3V(Volume,Variety,Velocity)。
容量大指的是海量的數據規模。Google 前CEO 埃里克·施密特(Eric Schmidt)曾說,現在全世界兩天所產生的數據量,相當于人類2003 年以前所有的數據量的總和。數據量大既是優點也是缺點,優點是龐大的數據使我們決策不再依賴于小范圍的抽樣數據,這樣我們的決策會更加精準;而缺點是這些龐大的數據里面包含著大量的無用無效的數據,不是拿來就可以用的,而是需要人們去分析和挖掘。
多樣化指的是數據的格式和來源越來越多樣化,包含了文本、音頻、多媒體等數據。而分析出這些多樣化數據之間的相關性,正是大數據的神奇之處。例如供水公司通過分析某個區域的供水數據,可以推算出該區域的交通擁堵時段(早上用水高峰后,再過40 分鐘左右,路上可能會擁堵)。同樣通過供電公司的電網數據,統計寫字樓集中關燈時間,可以估算出晚上堵車時段。
速度快是指數據的產生和處理是自動化和實時性的。隨著5G 的到來,移動互聯網,特別是物聯網的迅速普及,數據的產生變得更為多樣、自動、實時。例如,“熱搜”榜反映了人們普遍關切的話題,而且傳播極快,影響極大。2019 年的“無錫高架垮塌事件”、“李心草事件”等都是登上了熱搜榜,而當地相關部門對移動互聯網的特點不熟悉,反應回應不及時,造成一些不良影響。因此工會工作者要時刻注意“熱搜榜”是否出現了損工事件,從而及時做出正確回應。
繼幾千年前的實驗科學、數百年前的理論科學和數十年前的計算科學之后,大數據已被定義為科學探索的第四范式。大數據功能和作用,可以概括為兩個,一是統計,二是預測。
1. 大數據的統計功能。政府、企業、個人在做決策的時候,要么基于經驗,要么基于數據,而基于數據的決策被證明優點要多于基于經驗。
在小數據時代,我們采用的是隨機抽樣的方法,即力求用最少的樣本數據得到最為精準的結論。這是因為,在互聯網時代之前,抽樣通常是發放紙質調查問卷和上門走訪等方式,獲得數據非常困難。另外,由于很多職工群眾認識不到位、擔心隱私泄露等原因,不樂意參加統計調查樣本,所以填寫的調查內容并不能真實有效反映職工的情況。這種方法的缺點是,獲得的樣本數量和質量不能讓人滿意。常會出現少數人的意見決定多數人的需求,少數地區的特點代替多數地區的特點。
在大數據時代,得益于移動互聯網和物聯網的發展,數據通常可以實時、便捷的得到,甚至自動產生。這些具備規模大和自動化特點的大數據,正好可以彌補抽樣調查中局部、片面數據的缺點。
例如:人民網的“兩會調查”的熱詞調查就是基于大數據。2019 年度參與調查的網民人數超過447 萬人,發現老百姓最為關心的問題是正風反腐、依法治國以及社會保障。百度導航、高德導航等導航系統,都是通過分析用戶手機上傳的數據,分析出實時路況,再進行出行路徑的實時調整;Google 公司分析用戶搜索流感的大數據,判斷出美國流感疫情的現狀,在時間上比美國疾控中心發布的還要快兩周。
由此可見,工會工作者可以借用互聯網和移動互聯網手段,進行大規模的職工需求調查,摸清職工各方面的需求,比如個人基本情況、工資福利、技能培訓、勞動保護、安全衛生、思想動態等方面,為工會謀劃工作思路提供參考。
2. 大數據的預測功能。大數據預測主要是圍繞目標對象,基于它過去的大數據和相關因素,進行數據分析,提前做出預警。網絡科學學會的創始人巴拉巴西教授認為:如果數據充分,人類93%的行為是可以預知的。
2016 年,美國洛杉磯警察開始與加州大學洛杉磯分校合作,分析了過去上千萬起案件,匹配相關的模型和算法,進行犯罪預測,成功將該地區的犯罪率降低了30%。
再例如目前商業機構常用的用戶畫像技術,就是基于用戶的歷史行為數據,將他們區分為不同的類型,推斷出用戶可能的喜好和需求。淘寶網通過大數據技術將你可能需要的產品推薦給你,今日頭條將你感興趣的新聞資訊推送給你,而Google 和YouTube 則利用大數據對用戶進行精準的廣告投放。
同樣,如果工會組織能夠對職工的行為數據進行深入分析和挖掘,給不同的年齡、工種、地區的職工做出職工畫像,做到比職工更了解自己的需求,這樣我們的工會工作就真正能夠達到智能化。
3.在大數據應用方面存在的誤區。目前,很多工會工作者對大數據不是很了解,常出現兩種思維誤區,走入兩個極端。一是認為大數據就等同于傳統數據統計的加強版;二是認為大數據不再需要傳統抽樣分析。
第一個誤區,將大數據等同于傳統數據統計。雖然大數據具有傳統數據統計的功能,但是通過數據統計得出準確判斷,只是大數據的一個基礎功能。大數據不但可以做數據統計和分析,還可以找出原本看似風馬牛不相及的兩個事物之間的內在聯系,例如沃爾瑪“啤酒+尿不濕”大數據相關性的經典案例。因此說大數據最重要和特別的功能就是預測功能。
第二個誤區,認為大數據不需要科學抽樣分析。大數據的“大”不僅是其數據體量本身很大,更重要的是大數據相對于傳統數據的一個本質特征就是大數據“不是隨機樣本,而是全體數據”。但是全體數據卻常常是理想狀態,在現有條件下很難實現。
單純的體量大,并不能代表是全體數據,很多時候會存在“樣本偏差”等狀況,這樣即使將把體量很大的數據提取出來分析,其預測結果也不一定準確。例如:1936 年“蘭頓總統”事件。1936 年美國總統大選,《文學文摘》開展了一次民意調查,共發放調查問卷1000 萬份。調查結果顯示蘭頓的支持率是57%,而羅斯福的支持率是43%。但最終的結果是羅斯福以61%的得票率當選美國總統。這其中最主要的原因就是抽樣框選擇不當,《文學文摘》的調查樣本是從美國當時的電話簿和車牌登記名單中選出的,這大概只覆蓋了全美35%的人口,而當時能開汽車用電話的都是高收入人群,他們在政治上偏保守,大多對羅斯福的新政持反對意見。
因此,現實數據是含有系統偏差的,數據源的優先級應該是全體數據>好的采樣數據>不均勻的大量數據,在這里好的采樣數據是越大越好,數據越多,分析的結果就越精準。
智慧工會與傳統工會工作之間的區別在于,它是基于互聯網、移動互聯網技術,來全面感知職工的多樣化需求,再通過人工智能和大數據分析技術做出正確的針對性響應。
首先我們要有數據源(用戶群體),然后搭建智慧平臺,并在智慧平臺對職工提供各種智慧服務,這些服務對職工數據進行感知、收集、存儲,工會組織對這些職工大數據進行分析,做出決策和預測,改進和豐富智慧平臺上承載的智慧服務,而升級后的平臺和服務也會繼續感知和產生新的職工數據,工會工作者再對這些新數據進行分析,改進服務。這樣整個體系就形成了一個智能化的閉環。

智慧工會的運作環
截至2017 年9 月底,我國職工總數3.14 億,工會會員3.03 億人,工會基層組織280.9 萬個。這些龐大的會員和組織基數是工會大數據的根本支撐,沒有了他們,“智慧工會”的智慧就成了無源之水無本之木。
根據全國工會網上工作綱要(2017—2020年)任務中的“一體推進、兩個覆蓋、三網并用、四大建設、十類應用”,其中三網并用、四大建設都是屬于智慧平臺。
習近平總書記說到“網民來自老百姓,老百姓上了網,民意也就上了網。群眾在哪兒,我們的領導干部就要到哪兒去,不然怎么聯系群眾呢?”我們工會工作者要深刻理解習總書記的講話,工會要上網,而且要注意群眾在哪里上網?目前工會工作的智慧平臺比較流行的是“兩微一端”的微平臺。由于互聯網行業競爭激烈,產品更新換代快,比如現在今日頭條、抖音短視頻等在職工群體中喜愛度和利用率已經超過了傳統的微博。工會工作者要注意緊跟發展趨勢,及時更新改進工作平臺。
2018 年,中國工會第十七大通過的《關于〈中國工會章程(修正案)〉的決議》,對工會的基本職責增加了竭誠服務職工群眾。這說明做好工會會員服務工作是工會工作的基礎,也是下一步工作創新的重點。
在新媒體、自媒體時代,網絡逐漸成為職工工作、生活、學習以及娛樂的主要場所。但是正是由于自媒體的高度發展,網絡上每個人都有了麥克風,任何人都可以對當前社會的現象發表看法。大家的政治、文化、道德水平都不同,很可能對一些社會現象和社會熱點問題產生不準確甚至是錯誤的看法,工會就需要及時正確引導職工的思想,弘揚正能量。
工會在提供智慧服務的同時,也是收集數據的過程。在收集數據的時候,要注意數據的準確性和實時性。按職工所需和工會所能原則,定期開展線上活動,活動形式多樣化,尤其是要符合移動互聯網的特點。注意多和職工互動,對職工的要求要及時反饋。實現線上線下有獎互動,寓教于樂,把職工吸引到我們的智慧平臺上。這樣,隨著智慧工會的進一步建設,在工會智慧數據庫里存儲的會員基本信息、會員活動數據以及會員反饋信息將形成龐大的工會會員大數據。
運用大數據技術,對智慧平臺感知和收集來的會員、職工的各類大數據進行分析,用數據分析的結果指導工會工作。
工會正在積極推進普惠化服務。然而不同地區,不同企業,不同工種,甚至不同年齡的職工他們的需求是不一樣的,比如富士康的工人和東風集團的職工需求肯定是不一樣的,美團外賣騎手和建筑工人的需求也是不同的。如何去挖掘出他們的不同需求,提供差異化和精準化的普惠服務呢?要做出智慧決策,我們就要充分利用已經擁有的龐大會員和組織的行為數據,對這些數據進行分析,挖掘出職工正確的需求,而不是從自己的工作經驗出發,用自己的想法代替職工的需求。
例如在工會勞動保護工作方面。通過分析比對近幾年內來自勞動監察部門、安全生產監督部門和工會自有的大數據信息,明確不同地區、不同類型企業的工傷比例的數據,從而提供個性化的勞動保護和安全生產教育等服務[3]。
與此同時互聯網已經成了意識形態領域斗爭的主戰場,因此各級工會組織應該對工會各種網絡系統中的會員行為如實記錄(比如留言,發帖,瀏覽,聊天等)進行分析,及時掌握用戶的思想動態、對其行為進行預測。這對穩定職工隊伍思想和引導網絡輿情有著至關重要的作用。
大數據思維作為重要的互聯網思維,是工會工作者必須要具備的。但是目前一些領導對于快速發展的新技術不適應,又懶于學習,思維還停留在“前互聯網時代”,認為“群眾跑腿越少、數據跑腿越多,權力的含金量也越低?!痹谶@種思想指導下建設的網站和手機APP,內容單調空洞,辦的會員卡也沒有多少實惠和實用功能,很難吸引廣大職工群眾,最終成為 “僵尸網站,僵尸卡”。這些平臺和軟件一整年下來,可能也收集不了多少數據,更談不上數據的實時性了。
我們調查了很多地方工會的微信號,瀏覽量常常都是300 ~500,這顯然和其工會會員基數是不匹配的。但是通過分析,我們發現一些職工喜聞樂見的活動,瀏覽量會明顯提升,說明在工會APP 和工會微信公眾號的欄目和項目中,需要設置真正吸引職工的內容。要有互聯網思維中的用戶思維、粉絲思維、平臺思維,以用戶的需求為出發點,做好工會核心業務,同時利用和借用其他資源,為職工提供所需服務,做職工的娘家人,把會員變成工會的粉絲。
數據是21 世紀的石油和金礦。既然是金礦,就需要挖掘和提煉,不是有了數據,就有了智慧。目前,在大數據方面大多存在一個問題,都知道大數據是寶貝,每個行業每個部門都在收集數據,但收集來的數據,卻不知道怎么分析利用。導致了一個現象:數據太多,智慧太少。
由于大數據分析需要較高的IT 成本,所以目前對大數據分析應用較好的只是幾家大型的銀行、保險、電信和電商。其他企業和行業,在大數據分析方面,暫時都是處在起步階段。
目前工會本身不具備較高的IT 技術,我們可以和國內知名企業合作,比如阿里和騰訊,對工會大數據進行分析,建立合作共贏機制。
首先加強工會內部數據共享。2017 年5 月,中華全國總工會發布了《工會組織和工會會員實名制管理工作方案》,提出到2020 年底建成以?。ㄗ灾螀^、直轄市)為基本集成單元的分布式工會實名數據庫。把全國三億多的職工數據整合在一起,這是工會運用大數據的基礎工程。
其次是加強與外部部門的共享。推進與政府相關部門,比如人社、民政、公安、銀行等進行有關數據的對接和共享,力爭接入國家大數據中心。例如,工會和銀行部門合作,對工會幫扶的困難職工的消費購物情況,進行監控分析,確保幫扶資金落在實處。由于政府部門的數據資源都有自己的體系,在數據格式上不兼容,無法直接對接;另外有些數據涉及機密和個人隱私,不能直接共享,這些都需要頂層設計、規劃和協調。
大數據和任何技術一樣,都是一把雙刃劍。我們在享受大數據帶來便利的同時,也要面對新的問題,包括數據泄露、數據濫用以及隱私安全等問題。例如成都市某社區工作人員,利用職務之便,泄露新生兒信息50 萬條;南京某公務員,泄露82 萬條公民信息。類似安全事件的發生給國家信息安全敲響了警鐘。
習近平總書記對處理安全和發展的關系高度重視,特別指出“沒有網絡安全就沒有國家安全,沒有信息化就沒有現代化?!薄洞龠M大數據發展行動綱要》中專門強調,要“科學規范利用大數據,切實保障數據安全”。
我國工會會員基數龐大,而且工會數據庫里往往還存儲著家庭成員的個人隱私數據。根據麥肯錫公司的測算方法,省級工會的職工數據庫價值近千萬,而國家政府部門的大數據價值在 10萬億以上。
隨著互聯網、移動互聯網以及物聯網和我們的工作、生活結合越來越密切,工會系統也和各個部門之間業務來往增多,數據之間的互聯共享是不可避免的,這樣數據更易受到攻擊感染。因此,要合理制定安全防護級別標準,完善網絡安全管理制度體系,采用完備可靠的軟硬件安全措施,保證工會網絡信息系統的安全運行[4]。
我國的工會組織擁有多達3 億的龐大會員數量,加上全國、地方、產業工會所構建的智慧平臺,以后必定會獲得海量的職工數據,這蘊含著巨大的價值。各級工會組織要對工會大數據進行認真深入的收集和分析,既可為黨政提供決策幫助,又可為職工提供精準的服務,更好地履行工會竭誠服務職工群眾的職責。