文/由清慧
大數據作為“新物種”,從出現到被公眾熟悉不過短短十多年時間,正以蓬勃之勢迅速與各類業態環境融和,創造了極大的經濟和社會效益,驅動了社會各個層面的改革與進步。在當前效率和效果優先的競爭環境下,越來越多企業開始接受花錢買信息、付費買知識的新消費觀。在日常工作中,經常有客戶反饋:“這個數據在那里也能查到”“那個數據我知道在哪個網站上也有”“某國的部分數據應該是免費的”。每當這時,我們都會不厭其煩地跟客戶解釋免費數據與收費數據的區別、公開數據與免費數據的差異。作為業內領先的大數據公司,我們不制造數據,只是數據的修理工和搬運工,在線系統集成了各類大數據,如海量的進出口交易數據、幾億家企業的商業數據、天量的公開數據。我經常反問客戶和初入行業的同事:難道公開數據就無價值嗎?
經常去上海、北京的人會發現,在地鐵站、高鐵站能看到某“三查”企業的廣告(“查企業、查老板、查關系”)。經常做業務的人對于各種“查”當然再熟悉不過了,它們通過一定的算法與技術手段,實現了以3億多主體為核心、互通300多個維度的數據,打破了過去單一化的信息孤島,讓人免去逐一登錄300多個網站查詢數據的痛苦,使得我們可以更公平更快速地看清這個世界,讓普通人在面對大企業時信息盡量做到足夠透明與對稱。它們并不生產數據,只是打通了各種已經公開的免費數據資源。它們確實改變了很多人的商業習慣,我們在享受其便捷服務同時,自然也就不在乎那幾百元的會員費啦!“查查們”雖然只解決了查詢中國企業的最基本需求,但已經創造了巨大的商業價值和社會價值。
通過這個例子,我們可以發現,公開數據不僅有用,而且未來價值廣闊。金融、醫藥、物流、交通、貿易、稅務、關務、快遞、外賣等許多領域均有各種類型的海量數據被沉淀、被開發,將這些數據用一定的技術手段處理后,均可被應用到不同的工作場景,解決相關領域的用戶需求,實現來自大眾、服務社會的價值。
我們常說:沉睡的數據不值錢,流動的數據才有價值。當下各類終端通過互聯網在線化,把源源不斷的物理活動記錄和互聯起來。當數據聚合到一定規模,輔助以精密模型和先進算法,將來極有可能繼續造福社會,創造更大的價值。數據是物理終端行為軌跡的產物,數字世界永遠是物理世界的孿生記錄體。判斷數據是否有價值,與其公開與否、收費與否并無必然關系。只要是記錄真實行為結果的數據,就有價值。國家互聯網信息辦公室在2021年7月10日發文,要求掌握超過100萬用戶個人信息的運營者赴國外上市時需要進行網絡安全審查工作,審查的資料包括上市相關材料、數據出境風險,以及被國外政府影響、控制、惡意利用的風險。總之,數據不論出處,只要真實,就是有價值的。因數據的基礎性、廣泛性和隱私性,數據公開的程度必須在法律的監管下才能得以良性健康發展。
在國際貿易領域,公開數據大致有如下幾種比較常見的類型:進出口商名錄數據、各類統計數據、電話郵箱數據、社交媒體數據、工商類數據、財務類數據等。這些數據因公益性、普惠性、涉密度低等因素公開較多,相較于高收費的外貿大數據,獲取較為容易,但價值依然不可低估。尤其是公開數據在技術驅動下的價值延伸,智能化、可視化、實用性非常重要。那么,我們該怎樣使用這些數據呢?
第一,明確各類公開數據的基本要素和我們的核心需求,物盡其用。每種數據既特點鮮明,又弱點明確。永遠沒有完美的數據,只有不會駕馭數據的用戶。各種公開數據分工明確、任務單一。我們既不要埋怨聯系方式型數據庫無交易數據,也不能指責統計數據沒有交易主體的信息。沒有哪個數據能解決用戶的所有需求。這樣的數據即使有,相信也是違法所得。
第二,各種公開數據交互使用,依次補充,相互滲透。按照一定需求定期翻新,日積月累,終會收獲滿滿。
2020年,某鋁型材企業打算深度拓展南非市場,而南非的國際貿易交易數據是不可獲取的。該公司通過使用海關數據與公開數據,通過以下步驟,基本掌握了足夠多的信息,經過一年多時間,已經把南非市場研究得相當透徹。數據掌握情況如下。
1. 統計數據掌握南非實際進口量,解決是否值得深度開發的問題。
2. 公開數據搜索南非相關企業進行快速翻牌。
3. 航運數據和第三國交易數據掌握已知進口商。
4. 谷歌地圖加關鍵字,尋找相關上下游制造商。
5. 商業數據獲得南非鋁材類行業相關企業。
6. 通過歷史展會資料,獲得南非參展企業信息。
7. 通過非洲和中東其他客戶了解南非部分企業。
8. 通過一些中企駐南非相關辦事機構了解南非市場,并通過一些留學生電話核實信息。
定期重復以上8點,積累數據,整理歸檔。
雖然該企業目前仍在開發市場的漫漫征程,但已經掌握了關于南非鋁型材行業獨一無二的數據資料,且不可復制。最為關鍵的是,其掌握了一套比較系統的使用公開數據的流程與方法,可以不斷優化復制到其他市場的開發中。該企業負責人感嘆:“正是因為南非不公開交易數據,我的團隊學會了挖掘數據的新技能。”
第三,以交易數據為主,商業數據為輔,公開數據做補充。使用數據時,以某個數據為主體數據,其他數據不斷擴大,豐富主體數據的維度與寬度,形成富有自我與行業特色的獨有數據。這猶如各種普通的食材,在不同的廚師手下燒出味道各異的人間煙火。近兩年,在人工智能、大數據、高算力的支撐下,大數據越來越快、越來越準、越來越懂人心。
海量公開數據經專業技術處理加工后,往往遠超用戶需求。專業大數據公司的核心競爭力在于:數據渠道有優勢,技術更先進,操作更人性,不斷加速迭代與更新。作為用戶,不必關心獲得信息的過程,只需關注獲得內容的效率和效果就夠了,這正是環球慧思多年來的主張——把復雜留給自己,把簡單留給客戶。