“老許,市里新成立的大數據局正面向全社會招聘各種急需崗位呢!其中最特別的崗位是數據分析師,據說待遇是最高的……”。
還真設置了這個崗位?某委辦局信息中心的許主任雖然沒有競聘上大數據局主管的崗位,但是在競聘環節就遇到過數據分析與數據挖掘方面人才如何培養的議題,自己當時也是準備不充分,只是泛泛談了談自己的理解,現在看來也許就是對這個問題的重要性認識不足,導致了最終競聘失利,早知當初,應該多做些功課,畢竟自己本科學的可是數學呀!
隨著消費互聯網持續向產業互聯網演進,基于大數據基礎上的客戶消費行為分析,借助數字化轉型的旗號,正從互聯網行業開始向各行業滲透,對數據分析與數據挖掘人才的爭奪也越演越烈,數據分析師儼然已成為職場中的香餑餑。那么,這到底是個什么職業呢?且讓我們揭開它神秘的面紗。
這里所稱的數據分析師,是指不同行業中,專門從事行業數據搜集、整理、分析,并依據數據做出行業研究、評估和預測的專業人員。
需要指出的是,這不是個新職業,在沒有形成大數據技術熱點的時候就已經出現了,只不過因為相對小眾,又屬于輔助工種,因此并沒有引起社會的廣泛關注。比如,傳統公共部門的統計員、傳統企業的BI(商業智能)分析與應用人員,傳統的會計/審計咨詢師都屬于這個范疇和類型。
相對于傳統的數據統計與分析人員,大數據時代的數據分析師更強調想像力和創造性,以及對業務的驅動作用,這就賦于他們更高的關注度,如果用時下流行的說法,他們應該是數據領域的KOL(注:關鍵意見領袖),應該能夠引領和影響相關行業的發展方向。
既然這個崗位這么重要,那一定應該能夠創造可觀的商業價值。這就涉及到這個信息時代對知識工作者最重要的評價標準,那就是知識工作者(注:數據分析師是典型的知識工作者)的產出(注:思想、概念、信息等)必須要帶來外部商業價值,也就是說對數據富有想像力的解釋一定有助于接受者具備產生更大、更多財富的能力。
從這個衡量標準來看,數據分析師至少要能做好如下幾個事:一是對業務的梳理。即通過所掌握的管理咨詢方法論,深入理解業務及需求;二是對數據的甄別。即通過熟悉的ETL(數據清洗)工具及對業務的理解,有針對性地選擇多維度的數據來源,以及足夠統計量的數據集(注:依據信息熵的原理,不確定性越多需要的信息量越大,自然所需分析的數據樣本量也可能更多);三是建模及對模型的解釋。即通過各類算法的有機組合,構建出適宜的模型,并給出富有說服務力的解釋。
一是要具備五個能力:先說對業務洞察的理解力。如果不能很好地了解業務,再精妙的算法和模型也派不上用場;再談對管理理論的實踐力。如果只會紙上談兵,很難獲得客戶的認可;還有對算法模型的統籌力。在紛繁復雜的算法中,科學選取是做好這項工作的基本功;再加上對分析工具的應用力。針對各類數據建模與分析工具,要非常清楚各自的適用領域和局限性,有機地組合運用;最后是對展示設計的表現力。數據分析的交付成果一定要圖文并茂,不能光靠嘴說,這是檢驗交付成果說服力指數極為重要的評判標準之一。
二是要有三心:先是對科學技術的“虔誠之心”,要相信數學、相信概率統計學科的既有成果一定可以幫助我們深入理解業務的規律;再是對領域跨界的“學習之心”,要用謙卑的心態對待所研究的業務領域,才能獲取業務人員的信任和配合;還有對探索未知事物的“敬畏之心”,要充分認識到人類認知的局限性,大膽想像,但要小心求證,持續迭代。
三是要有職業成長規劃:同任何職業一樣,做為一個數據從業者,自然也要有個人的職業規劃,按照技能水平從低到高來劃分,可以有這樣的進階路徑,既從數據分析員起步,經過數據分析師的歷練,向數據科學家邁進。不同的階段,對技能的要求、所提供的服務、創造的價值也有很大的區別,比如數據分析員要會讀數據,而數據分析師要會建模型,到數據科學家層面就要能研究基礎算法,這有點類似于大學(要會讀書)、碩士(要會選題)、博士(要能研究未知的領域)的區別。
IT 語錄:數據分析師是發現數據之美的人!
“爸爸,有好幾個公司都給我發了offer,雖然我學的是數學,可是我想去這個IT公司,因為他們提供的是數據分析師的崗位,挺有前景的……”
下期預告:這是現實版的“真假美猴王”嗎?