楊璧菲
摘 要 大數據時代,開放數據在數字媒體領域體現出極高的利用價值。文章結合具體案例,通過對國內外開放數據在數字媒體領域應用現狀對比分析,發現我國基于開放數據的數字媒體應用尚未普及,且服務性不強,由此提出了開放數據在數字媒體領域的應用路徑,即收集高質量可機讀的開放數據集、對數據集進行整合分析、進行數據可視化呈現和交互式操作、建立基于用戶的“眾包”數據平臺。
關鍵詞 數字媒體;開放數據;應用路徑
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2019)233-0007-02
開放數據是指政府或其他組織機構向社會公布的數據,這些數據是免費提供的,并可用于任何商業或個人目的[ 1 ]。目前,國內外都進入了開放數據實踐的應用階段,尤其是在數字媒體領域,開放數據的創新性利用創造了重要的價值。本文結合具體的實踐案例來分析開放數據在數字媒體領域應用現狀,并為我國的開放數據數字媒體實踐提供應用路徑和建議。
1 開放數據在數字媒體領域應用現狀
基于政府開放數據建立起來的應用程序涉及民眾生活的方方面面,針對不同用戶需求設計,解決用戶的特定問題。移動應用程序隨著智能移動設備的快速發展得到了廣泛應用,基于政府公開數據資源的應用程序以移動應用程序作為主體,同時也包括非移動應用程序,解決了用戶生活中的實際問題、服務用戶的生活、滿足用戶特定的信息需求,大大節省了用戶檢索和分析政府公開數據的時間和精力[2]。
1.1 國外開放數據在數字媒體領域的應用現狀
目前國外利用開放數據創建的數字媒體應用程序數量很大,類別多樣,例如地理交通、醫藥衛生、教育信息、社區生活、天氣環境等。目前,美國利用政府開放數據開發了近400多個應用程序。根據美國政府開放數據網站(Data.gov)顯示,所提供的應用程序類別有政務信息、金融經濟、交通出行、地圖定位、醫藥健康、教育信息和社區生活等幾大類。以應用程序“Raids Online”為例,該應用程序是基于地方警署的開放數據建立起來的,對公眾和執法部門免費開放并對違法犯罪活動進行自動標記以提醒用戶注意個人安全。用戶可以在交互式地圖和分析儀表盤上查看和過濾犯罪類別、行為、時間、地點等犯罪數據,了解所在地的犯罪活動。同時,用戶還可以通過該應用程序,向當地執法部門發送社區犯罪活動報告或緊急報警,以幫助減少違法犯罪行為的發生[ 3 ]。以“Raids Online”為代表的這類應用程序特點包括:基于政府的開放地理信息數據,或與其他相關數據開發相結合,免費為用戶提供特定領域的信息服務。
1.2 國內開放數據在數字媒體領域的應用現狀
與國外相比,目前中國國家數據平臺(data. stats.gov.cn)尚未提供具有服務用戶功能的應用軟件。但隨著相關技術日趨成熟,公眾對此類軟件的需求不斷增長,國內地方政府在該領域做了一些積極的嘗試,例如北京市政務數據資源網提供的“游北京”和“愛健康”App;上海市政府開發了“中國上海”App,主要用于政府門戶網站發布政府信息,缺少服務為主體的內容,與普通民眾的日常生活脫節,失去了服務大眾的意義。不過,北京、上海等地政府和企業聯合舉辦的一系列開放數據創新應用大賽在開放數據數字媒體應用方面取得了一定的成果。以“SODA上海開放數據創新應用大賽”為例,從網站公布的20個典型應用的類別來看,主要有道路交通、民生服務、衛生健康、公共安全和社會發展,與政府獨立開發的應用程序來看,大賽中的作品所涉及到的數據類別更加親民,更有利于解決一些民眾切實的問題,也能引起民眾對基于開放數據應用程序的關注和使用。以倫敦大學學院Space Time Lab團隊開發的一套共享單車電子圍欄站點選址和運營優化系統為例,系統包括4個功能——最佳站點選擇、最佳容量配置、搬運策略規劃和運營效果可視化。此系統首先利用了上海政府數據開放平臺所提供的AQI數據、重點污染源監督性監測、實時雨量、水廠水質監測和食品溯源數據,再根據上海市區一個月的摩拜運營數據,建議了2 000個電子圍欄車站的最佳位置,站點間最大距離350米,每站最大容量50輛車,每周搬運一次,即可實現自平衡。如此,整個上海市區只需要7萬輛車,就可以滿足90%以上的用戶需求,這將大大提高運營效益,緩解高峰時段供需失衡,提高用戶體驗,避免單車停放無序,保持城市秩序。通過動態交互可視化,該系統可實時展示各站點的使用情況和搬運效果。方案不僅可以幫助共享單車公司優化運營,也可以協助交通部門有效地管理和評估共享單車服務[ 4 ]。
雖然這些應用程序確實有可圈可點之處,但是也存在著一些問題:我國缺少國家層面基于開放數據的數字媒體應用;政府主導的應用程序內容大多為政務信息公開,服務性較弱;政府開放數據應用大賽中創建的一些平臺和系統后續沒有真正投放到使用和進行普及,而僅停留在設計層面。
2 開放數據在數字媒體領域的應用路徑
2.1 收集高質量可機讀的開放數據集
開發應用程序的第一步是收集數據集,第一種方式是直接從政府開放數據平臺上下載原始數據,并且數據格式需要是開放和可機讀的;第二種是直接使用平臺上提供的應用程序編程接口(API接口,Application Programming Interface)。與下載方式獲取數據相比,接口使數據使用者可通過參數有選擇性地獲取所需的數據用于特定的使用目的,以實時高效滿足不同應用場景下的數據需要。開放API也是政府開放數據平臺針對應用程序開發者所提供的政府公開數據利用途徑,通過調用API,用戶可以在自己的網頁中插入某地地圖,進行公交路線和自駕導航等查詢功能。有些類型的數據如交通類型的數據API接口采集的是近乎實時的數據,利用這些數據,基本可得到城市交通數據的實時反饋。
2.2 融合技術對數據集進行整合分析
通常情況下開發者會同時收集幾個甚至十幾個類型的數據集,這些數據既有政府開放數據平臺提供的數據,也有團隊收集處理過的數據,還有來自互聯網的開放數據。這些數據有各種形式、來源和格式,這就需要對它們進行清洗、整合、挖掘和分析,通過算法技術,將龐大且繁雜的數據進行整理和串聯,形成應用系統最基礎的數據支撐。比如上海的“城市安全宜居服務系統”使用了蟻群算法、遺傳神經網絡、樸素貝葉斯分類等相關算法用于進一步整合、分析和挖掘數據,并使用空間識別技術融合了21個城市大數據,在一張交互式地圖上呈現了上海的真實面貌。
2.3 對數據分析結果進行可視化呈現和交互式操作
數據集的整合分析所得到的結果必須以可視化的方式呈現,交互式地使用才算基本完成對應用程序的開發。通過視覺的方式將復雜、抽象、難懂的數據轉化為可讀性強的圖像呈現給受眾。可視化的形式有很多,可以采用靜態的也可以用動態的呈現方式,程度的分級通常用不同的顏色來表達,例如在交通地圖類應用程序里,用綠色、黃色和紅色代表道路的擁堵程度,綠色暢通、紅色擁堵,除此之外,還可以使用密集的視覺圖像來標明事故多發地段,使用戶一目了然。除了觀看上要符合受眾的審美習慣,更重要的是操作便利性,使市民能更好地融入到系統當中,使他們能真正感受到使用這些數據帶來的便利。其中,需要強調的是操作方面的交互式體驗,交互式體驗能讓用戶有更多的自主性,能決定自己如何使用數據。同時,應用程序還應該具有良好的用戶與開發者之間的互動機制,包括如何使用更好的數據、使用開放數據的方式、可視化形式和平臺建設等,幫助開發者進行未來的規劃和策略的制定。
2.4 建立基于用戶的“眾包”數據平臺
當前的開放數據大多數來自政府,很多數據缺乏完整性、實時性和真實性。因此,不僅需要融合現有的大數據資源,還要把政府和民眾也串聯在一起,形成新的實時更新的數據庫。建立基于用戶的“眾包”數據平臺,每個人都可以是數據源,因為他們每天使用的手機等智能設備記錄了大量有價值的城市信息,因此用戶不再是被動的信息接收者,更是城市建設、管理的參與者。充分利用智能設備的數據相互連接、相互共享,將封閉的數據從信息孤島中脫離出來,使它們變成社會化數據。但是,社會化的數據不是將孤立數據進行疊加,而是可以對其進行數據分析和挖掘,發現社會運行規律,從而可以為社會更好的發展提供指導。
3 結論
在大數據環境下,開放數據將成為這個社會發展新階段重要的生產資料和創新動力,我國在利用開放數據進行數字媒體建設方面還有很大的提升空間。充分挖掘和利用高質量的開放數據,完善數據集在數字媒體應用中的可視化和交互性,使數據取之于民、用之于民,開發出更多服務性強、高質量的數字媒體。
參考文獻
[1]畢秋靈.數據新聞中的開放數據應用[J].湖北社會科學,2016(7):190-194.
[2]邸弘陽,任思琪.政府數據公開網絡平臺的數據管理與利用方式研究[J].圖書館雜志,2017(1):88-96.
[3]Raids Online Crime Mapping[EB/OL].[2019-3-4]. http://www.cityofconroe.org/departments/policedepartment-home-page/raids-online-crime-mapping.
[4]上海市政府數據服務網[EB/OL].[2019-3-4].http://www. datashanghai.gov.cn/query!queryTypicalGdsDataInfoBy Id.action?type=1&dataId=111102018006.