鮑燁童

依靠非結(jié)構(gòu)化大數(shù)據(jù)做支撐,通過(guò)自主研發(fā)的語(yǔ)義分析技術(shù),訊庫(kù)在數(shù)據(jù)挖掘和分析的全面性、可靠性和實(shí)時(shí)性上已經(jīng)先于同行邁出一大步。
隨著大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng)興起,社會(huì)進(jìn)入了“原子”傳播時(shí)代。在這個(gè)時(shí)代里,過(guò)去由媒體壟斷的傳播資源,今天被數(shù)以?xún)|計(jì)的個(gè)體所分享;不同的傳播媒介在不斷融合與分化的狀態(tài)中推動(dòng)了輿情的發(fā)展。由此衍生的情形是,政府和企業(yè)的形象在互聯(lián)網(wǎng)上以碎片化方式不斷地呈現(xiàn)出來(lái)。
有媒體報(bào)道,近年來(lái)輿情監(jiān)測(cè)和危機(jī)公關(guān)在企業(yè)管理成本中所占比重越來(lái)越大。尤其是商業(yè)力量引發(fā)的負(fù)面輿情,使效益好、知名度高的企業(yè)不斷陷入輿情風(fēng)波,付出了短期和長(zhǎng)期的代價(jià)。
不久前轟轟烈烈的“阿里巴巴假貨門(mén)”事件,就體現(xiàn)了企業(yè)身處輿論風(fēng)暴的無(wú)奈。
由此來(lái)看,如何幫助企業(yè)建立輿論對(duì)沖機(jī)制,與風(fēng)險(xiǎn)共舞,成為輿情管理要解決的命題。
隨著大數(shù)據(jù)技術(shù)的發(fā)展,將輿情事件中的人、環(huán)境、社會(huì)關(guān)系等多個(gè)因素聯(lián)系起來(lái)進(jìn)行多維度的考察,對(duì)于提升輿情研究和服務(wù)的決策參考具有重要價(jià)值。利用大數(shù)據(jù)進(jìn)行分析和解讀,成為管理輿情和維護(hù)聲譽(yù)的必要手段。
“北京麥克斯泰科技有限公司(以下簡(jiǎn)稱(chēng)“麥克斯泰”)存在的意義在于,讓政府、企業(yè)及其他機(jī)構(gòu)可以快速了解自媒體、社會(huì)化媒體上的人民意愿。比如,對(duì)于民眾在微博上發(fā)布的關(guān)于某工廠排污的資訊,環(huán)境保護(hù)部門(mén)就可以快速了解,進(jìn)行處置。”
麥克斯泰是中關(guān)村海淀園的一家公司,創(chuàng)始人初曉光是北京“海聚工程”入選者。這家公司擁有全中國(guó)數(shù)據(jù)量最龐大、更新速度最實(shí)時(shí)的資訊監(jiān)測(cè)預(yù)警平臺(tái)——訊庫(kù)。無(wú)論在反貪反腐還是廣納民智層面,訊庫(kù)都是幫助政府高效執(zhí)政的工具。
“正是輿情產(chǎn)業(yè)的發(fā)展,在自媒體、社會(huì)化媒體興起之后,推動(dòng)政府變得更加主動(dòng)、開(kāi)放和透明。”初曉光強(qiáng)調(diào)。
創(chuàng)新才能生存
面對(duì)輿情產(chǎn)品的同質(zhì)化傾向,輿情監(jiān)測(cè)機(jī)構(gòu)一直在謀求品牌競(jìng)爭(zhēng)的差異化、細(xì)分化,更加注重對(duì)輿情研判方法和技術(shù)的投入力度,在早期單一的輿情報(bào)告產(chǎn)品的基礎(chǔ)上,開(kāi)發(fā)出輿情監(jiān)測(cè)平臺(tái)、咨詢(xún)和培訓(xùn)服務(wù)、主題活動(dòng)和展覽等多種業(yè)務(wù)模式。
有人指出,輿情產(chǎn)業(yè)方興未艾,擁有巨大的發(fā)展?jié)摿Γ赡艹蔀閺V告模式衰微之后,媒體向信息服務(wù)業(yè)轉(zhuǎn)型的重要方向。而在移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)迅猛發(fā)展背景下,產(chǎn)業(yè)洗牌將不可避免,只有創(chuàng)新才能生存。
在輿情監(jiān)測(cè)領(lǐng)域,訊庫(kù)因?yàn)槿齻€(gè)優(yōu)勢(shì)位列第一梯隊(duì)。
首先,“訊庫(kù)”實(shí)時(shí)監(jiān)測(cè)著全球數(shù)千個(gè)中文報(bào)紙、期刊、門(mén)戶(hù)網(wǎng)站、論壇、博客,每天更新數(shù)百萬(wàn)條資訊,并擁有自1998年以來(lái)的數(shù)十億條資訊數(shù)據(jù)庫(kù)。“只需幾分鐘,我們就可以把客戶(hù)所需求的信息進(jìn)行選取分析之后精準(zhǔn)地推送到達(dá)。”初曉光說(shuō)。
其次, 訊庫(kù)互聯(lián)網(wǎng)資訊傳播評(píng)測(cè)體系,為用戶(hù)的市場(chǎng)和公關(guān)活動(dòng)提供全程的量化評(píng)測(cè),讓用戶(hù)可以隨時(shí)掌控各項(xiàng)活動(dòng)的情況和效果。
第三,訊庫(kù)在云計(jì)算、自然語(yǔ)言處理、人工智能等領(lǐng)域擁有多項(xiàng)自主知識(shí)產(chǎn)權(quán)。通過(guò)持續(xù)的技術(shù)研發(fā)和合作,訊庫(kù)陸續(xù)推出了新的產(chǎn)品和服務(wù)。
從技術(shù)上來(lái)看,訊庫(kù)采用了SaaS軟件運(yùn)營(yíng)模式,它將應(yīng)用軟件統(tǒng)一部署在公司的服務(wù)器上。用初曉光的話(huà)說(shuō),“訊庫(kù)3.0實(shí)時(shí)搜索云Saas服務(wù)系統(tǒng),一切盡在云端,無(wú)需下載軟件,無(wú)需更新系統(tǒng),只要一臺(tái)可以上網(wǎng)的電腦就可實(shí)現(xiàn)云辦公。”
瞄準(zhǔn)非結(jié)構(gòu)化大數(shù)據(jù)
在信息社會(huì),信息都可以被分為兩類(lèi),一類(lèi)信息能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,如數(shù)字、符號(hào)等,被稱(chēng)為結(jié)構(gòu)化大數(shù)據(jù);另一類(lèi)信息無(wú)法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,如文本、圖像、聲音乃至網(wǎng)頁(yè)等,被稱(chēng)為非結(jié)構(gòu)化大數(shù)據(jù)。
大數(shù)據(jù)在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域存在已有時(shí)日,卻因?yàn)榛ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。不同于結(jié)構(gòu)化大數(shù)據(jù)內(nèi)容,非結(jié)構(gòu)化大數(shù)據(jù)廣泛存在于互聯(lián)網(wǎng)上,表現(xiàn)為碎片化、非規(guī)范化的特征。
訊庫(kù)就是基于數(shù)據(jù)的某種特性,把散布在互聯(lián)網(wǎng)上的各種信息和碎片化的內(nèi)容進(jìn)行整合分析,找出其中的各種關(guān)聯(lián)性和趨勢(shì)。它打破了傳統(tǒng)的信息分類(lèi)方式,由用戶(hù)決定分類(lèi)標(biāo)準(zhǔn)。
訊庫(kù)平臺(tái)能實(shí)時(shí)從互聯(lián)網(wǎng)上采集有針對(duì)性的資訊,將這些數(shù)據(jù)放到公司的云計(jì)算中心進(jìn)行處理,再通過(guò)商業(yè)智能分析,生成結(jié)果后提供給用戶(hù)。
訊庫(kù)搜索出的結(jié)果比普通搜索引擎更多,而且每個(gè)結(jié)果都以文本形式直接呈現(xiàn)給用戶(hù);普通搜索引擎只提供排在前面幾十頁(yè)的搜索結(jié)果的鏈接,其中有一部分鏈接是無(wú)法打開(kāi)的。另外,訊庫(kù)能夠采集到搜索引擎通常搜不出來(lái)的微博、論壇中的內(nèi)容,而這些內(nèi)容恰恰是反映網(wǎng)絡(luò)輿情的關(guān)鍵信息。在每條資訊下方,訊庫(kù)都根據(jù)語(yǔ)義分析技術(shù)對(duì)其做出正負(fù)面態(tài)度判斷,判斷準(zhǔn)確率為80%。
除了簡(jiǎn)單的關(guān)鍵詞搜索,“訊庫(kù)”可以實(shí)現(xiàn)添加各種限定條件和復(fù)雜邏輯關(guān)系的高級(jí)搜索。在搜索結(jié)果出來(lái)之后,還可進(jìn)行資訊曝光指數(shù)、地域分布、預(yù)警媒體分析,并實(shí)時(shí)生成電子剪報(bào)。“深度挖掘、準(zhǔn)確研判、趨勢(shì)預(yù)測(cè)、實(shí)時(shí)推送”,是訊庫(kù)核心功能的體現(xiàn)。
這一產(chǎn)品最典型的應(yīng)用是政府輿情監(jiān)測(cè)和企業(yè)競(jìng)爭(zhēng)情報(bào)分析。在政府層面,通過(guò)互聯(lián)網(wǎng)的數(shù)據(jù)采集,訊庫(kù)把公眾的意見(jiàn)反映給政府,政府以此來(lái)提高決策和執(zhí)政水平。而在企業(yè)層面,訊庫(kù)把與企業(yè)有關(guān)的信息搜集起來(lái),通過(guò)智能分析,得出對(duì)企業(yè)有借鑒性的參考和建議。
七年經(jīng)歷了三次質(zhì)變
“訊庫(kù)團(tuán)隊(duì)是一個(gè)能打硬仗的團(tuán)隊(duì),是能夠在有限的資源和巨大的壓力下高效工作的團(tuán)隊(duì)。”
依靠非結(jié)構(gòu)化大數(shù)據(jù)做支撐,通過(guò)自主研發(fā)的語(yǔ)義分析技術(shù),訊庫(kù)在數(shù)據(jù)挖掘和分析的全面性、可靠性和實(shí)時(shí)性上已經(jīng)先于同行邁出一大步。目前,圍繞數(shù)據(jù)的分析采集與處理,公司已經(jīng)有4項(xiàng)發(fā)明專(zhuān)利,60項(xiàng)軟件著作權(quán)和4個(gè)注冊(cè)商標(biāo)。
自公司成立至今,短短七年時(shí)間,訊庫(kù)已經(jīng)歷了三次質(zhì)變。最初的1.0和2.0版本是為了解決資訊的全面、實(shí)時(shí)的問(wèn)題:第一個(gè)版本所做的是讓資訊搜集不漏;第二個(gè)版本可以在資訊出現(xiàn)后的幾分鐘內(nèi)將結(jié)果傳給客戶(hù)。而3.0版本致力于從語(yǔ)義分析層面解決用戶(hù)數(shù)據(jù)的提取準(zhǔn)確性問(wèn)題。
移動(dòng)互聯(lián)網(wǎng)的出現(xiàn)改變了用戶(hù)的使用模式,讓碎片化的時(shí)間發(fā)揮作用,資訊推送的成本更低,效果更好。為了提升用戶(hù)體驗(yàn)度,除了PC版本外,訊庫(kù)還推出了手機(jī)客戶(hù)端等移動(dòng)互聯(lián)網(wǎng)方式,用戶(hù)可以隨時(shí)登陸訊庫(kù),個(gè)性化定制某類(lèi)資訊。通過(guò)訊庫(kù)客戶(hù)端,以一個(gè)更快的方式推送給使用者,不同于現(xiàn)在的頻道、欄目訂閱,它更精準(zhǔn)地將想訂閱的資訊推送到用戶(hù)的手中。這樣做的好處是,過(guò)濾掉重復(fù)資訊和非定制化資訊,用戶(hù)看到的資訊就是他想看到的內(nèi)容。
除政府和企業(yè)客戶(hù)外,初曉光團(tuán)隊(duì)還針對(duì)個(gè)人定制化產(chǎn)品進(jìn)行研發(fā)和設(shè)計(jì),基于訊庫(kù)分析工具,用戶(hù)可以根據(jù)歷史上的大量數(shù)據(jù),通過(guò)某種運(yùn)算形式,對(duì)他所關(guān)心的問(wèn)題做市場(chǎng)調(diào)查。通過(guò)非結(jié)構(gòu)化大數(shù)據(jù)技術(shù)來(lái)挖掘互聯(lián)網(wǎng)上的數(shù)據(jù),得到某一時(shí)刻公眾對(duì)這一企業(yè)的評(píng)價(jià),讓企業(yè)實(shí)時(shí)知道這一時(shí)間點(diǎn)的公眾輿論和情感傾向,產(chǎn)生的結(jié)果往往比傳統(tǒng)問(wèn)卷調(diào)查準(zhǔn)確得多。
未來(lái),訊庫(kù)將以國(guó)內(nèi)為主要市場(chǎng),積極同擁有數(shù)據(jù)的政府部門(mén)、科研院所、社交媒體平臺(tái)開(kāi)展合作,共同探索大數(shù)據(jù)在各行各業(yè)的應(yīng)用。
初曉光的創(chuàng)業(yè)理想是,將訊庫(kù)變成中國(guó)重要的互聯(lián)網(wǎng)大數(shù)據(jù)服務(wù)商。
鏈接:初曉光,入選北京“海聚工程”,北京市特聘專(zhuān)家,北京麥克斯泰科技有限公司CEO。