999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

對話:數據新聞:數據缺失怎么辦

2014-08-15 00:49:03
中國傳媒科技 2014年1期
關鍵詞:微信分析

巧婦難為無米之炊,在前面解讀了數據新聞的發展方向、選題策劃、可視化技術,甚至商業模式之后,回到本源問題上,數據缺失怎么辦?

目前數據來源主要有五個渠道:官方數據門戶、企業創建的數據平臺、社交媒體平臺采集的數據、時空和氣象數據,以及搜索引擎。

自2009年美國數據門戶網站data.gov上線以來,開放數據運動在全球范圍內迅速興起。英國,2010年創建數據開放網站data.gov.uk。2011年,巴西、印度尼西亞、墨西哥、挪威、菲律賓、南非、英國、美國等八個國家聯合簽署《開放數據聲明》,成立開放政府合作伙伴(OGP,Open Government Partnership)。截至2014年2月10日,全球已有63個國家加入開放政府合作伙伴。國際組織歐盟、經濟合作與發展組織(OECD)、聯合國(UN)、世界銀行(WB)也加入到了開放數據運動,建立了數據開放門戶網站。

另外,很多企業尤其是互聯網企業建立了自己的數據發布平臺,比如國外有Google public data、DataMarket、Guardian Data Store,國內有數據堂、阿里研究院、百度指數等。但是,目前國內的數據平臺仍然偏少,公開數據非常有限,數據缺失成為數據新聞發展的最大阻礙。

為此,本刊記者與沈陽、楊溟、張亞彬和任遠展開對話,請他們談一下對這一問題的見解。

就此問題,清華大學教授沈陽、新華網融媒體未來研究院院長楊溟、網易數讀編輯張亞彬,以及財新網數據可視化設計師任遠各抒己見。

沈陽:數據缺失是在做數據分析時非常常見的現象,大部分情況下,我們都不太可能拿到所有的數據。比如在做一個30年普法教育的選題時,需要知道互聯網出現之前,人們對普法教育的認識,那么收集這部分數據就非常困難,那個時代只有報紙的數據或者一些讀者來信上的數據。

數據缺失是一種常態,那么我們需要做的就是根據現有的數據,來比較精準地做分析和表達,不要把范圍無限地擴大,而是有多大范圍的數據就說多大范圍的事。

比如我們要分析北京地區不同地點的百姓消費水平,換個思路,我們或許就可以通過大眾點評網上各地店鋪的平均消費額來進行分析。但考慮到餐飲消費者流動性的問題,我們也可以考慮通過各地區房屋租賃的數據來分析,租房子的數據是本地居民的實際消費情況。當然,這個數據并不一定百分之百精準,所以我個人認為,在缺失數據的情況下,一定要標注準確數據來源、數據集,以及得到結論的限制條件等,這樣會更加嚴謹些。

另外,數據源單一也是比較普遍的問題,目前來說,社交媒體這塊,從微博抓取數據較為普遍,微信朋友圈和微信群的數據基本上是不可獲得的。社交網絡中有非常大一塊是社交的暗網絡,比如陌陌的數據肯定一般人都沒有。

在數據源單一的情況下,分析的某種網絡言論并不能真正地代表中國整體的情況,而且還涉及我一直強調的三個一致性問題:一是言行的一致性,分析到的結論都是一種言論,但真實情況是否如此,并不能保證,因為言行不一的行為非常多;二是公開網絡傳播和私密網絡傳播中的一致性;三是某個人或群體的前后言論的一致性。

所以在采集數據時,需要選擇性地選擇一些典型代表,如果數據源單一或某些數據是缺失的,可以找一些替代數據。比如現在有微博的數據了,微信的數據就可以用搜狗或“新媒體指數”等微信公眾號提供的微信數據,或者用一些貼吧的數據,這樣多種信息源的交叉有利于彌補一些缺陷。

未來應該會有更多的數據平臺,及更多的社交媒體數據挖掘、收集處理與分析的工具出現。

楊溟:現在我們看到的數據新聞的實踐中運用的數據,嚴格來說,都是小數據,沒有大數據。

我們在做大數據實踐時,發現最大的問題就是,真正基于社會公眾需要的數據是嚴重短缺的。現在在網絡或社交網絡中看到的數據只是很小的一部分,其實各個部門壟斷的這些信息,在有些國家可能是公共資源,是可以被作為大數據收集和分析的。但在國內,這部分信息很難獲得,所以在一些公共利益或公共信息資源的分析上存在問題。從這方面來說,數據源缺失,影響最大的倒不是數據新聞,而是數據的應用和數據的服務。

但反過來想,正因為政府部門對信息的壟斷造成數據缺失,這種缺失才給媒體創造了機會。比如在新加坡這樣政府服務非常到位和充分的社會,媒體服務的空間相對就會變小許多。

另外,目前通過搜索引擎獲取數據的方式還停留在對關鍵詞的搜索上,圖像和影像如人臉識別技術還有較大的發展空間,而對人的生理數據的挖掘和分析則是另一層意義上的“大數據”,是對人的了解的深入。

張亞彬:我們在搜集數據時,關于中國的數據我們是很希望能夠從國內渠道獲得,但是國內很多政府機構在壟斷信息資源以后沒有進行足夠的開放,所以在做一些國內專題時,我們還是會通過一些國外的網站或是從聯合國相關組織的一些報告中收集數據。

現在英國和美國是在數據開放領域做得最好的兩個國家,在英國的數據開放網站上,可以以公民的身份提交數據開放申請,只要要求是合理的,這個信息沒有涉及到國家安全等問題,網站承諾會在一定的時間之內開放數據。

我們曾經打算做一個中國城市自行車租賃狀況的選題,杭州、北京等城市在08年前后,上馬了很多這樣的公共事業,我們想看看這些自行車的利用率有多少。最終,我們只在國外一個NGO網站上看到了中國少數幾個城市的相關數據,而國內只有零星的媒體報道,比如杭州有多少輛,利用率是多少等極少的干巴巴的數字,但這不是一個系統的、全國范圍的數據。

另外,對于國家統計局等公布的一些數據,我們也保持懷疑態度,不會完全相信或完全不相信。舉一個簡單的例子,中國失業率的數據,眾所周知,國家統計局公布的是“登記失業率”,這個數字常年都維持在4%上下浮動,數字本身就是不科學不可信的。西方國家一般都是采用“調查失業率”,由調查咨詢公司或者政府機構通過調查得到數據,這樣的數據才更可信。所以,在做相關專題時,我們不可能用國家統計局上的這類數據。

考慮到開放程度和數據的可信程度,我們會采納自己認為過硬的數據來源去做選題,并且我們會將數據來源標注在相關選題的信息圖上。如果數據不過硬,我們寧可放棄選題。

任遠:有時候,數據缺失也屬于數據。我們需要尋找缺失數據的原因,在尋找過程中或許會發現新的有新聞價值的信息。比如我們之前做過一個關于諾貝爾獎的數據新聞,制作了1901—2013年所有諾貝爾獎及獲獎人的信息圖,收集數據時,我們發現二戰期間1940—1942的數據是沒有的。所以其實數據缺失可能是會有歷史意義的,它也是有價值的。■

猜你喜歡
微信分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
微信
微信
電力系統及其自動化發展趨勢分析
微信
微信
微信
微信
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 亚洲色图狠狠干| 欧美中文字幕无线码视频| 无码一区二区波多野结衣播放搜索 | 91口爆吞精国产对白第三集| 99尹人香蕉国产免费天天拍| 日韩av电影一区二区三区四区| 久久亚洲国产最新网站| 久久人搡人人玩人妻精品| 日本精品视频一区二区| 亚洲天堂色色人体| 40岁成熟女人牲交片免费| 欧美www在线观看| 91久久偷偷做嫩草影院| 在线人成精品免费视频| 精品伊人久久久久7777人| 欧美在线视频不卡| 无码国产偷倩在线播放老年人| 亚洲中文字幕日产无码2021| 91成人在线观看视频| …亚洲 欧洲 另类 春色| 国产一区三区二区中文在线| 久久香蕉国产线看观| 日本三级欧美三级| 视频二区亚洲精品| 日韩国产综合精选| 国产欧美成人不卡视频| 18禁色诱爆乳网站| 日韩毛片在线视频| 五月婷婷伊人网| 欧美在线视频不卡第一页| 国产欧美精品专区一区二区| 欧美日韩第二页| 亚洲综合极品香蕉久久网| 夜夜拍夜夜爽| 国产精品毛片一区视频播| 69av免费视频| 国产成年女人特黄特色毛片免| 久久精品人人做人人综合试看| 国产成人夜色91| 亚洲欧洲自拍拍偷午夜色| 国产成人AV综合久久| 中文字幕在线看| 色综合热无码热国产| 第一区免费在线观看| 亚洲性视频网站| 亚洲码在线中文在线观看| 国产va在线观看| 尤物在线观看乱码| 国产精品99久久久久久董美香| 在线播放国产99re| 99成人在线观看| 国产杨幂丝袜av在线播放| 综合色亚洲| 国产精品亚洲va在线观看| 国产黄色爱视频| 天天综合网色中文字幕| 国产95在线 | 日韩av资源在线| 免费看久久精品99| 精品视频一区在线观看| 成人国产小视频| 免费无码AV片在线观看国产| 精品国产免费观看| 欧美一级夜夜爽www| 国产一级二级在线观看| 亚洲一区二区无码视频| 国产精品成人不卡在线观看| 日韩免费无码人妻系列| 无码中文字幕乱码免费2| 国产激爽大片在线播放| 色综合狠狠操| 蝴蝶伊人久久中文娱乐网| 国产精品视频猛进猛出| 91精品aⅴ无码中文字字幕蜜桃| 99精品热视频这里只有精品7| 99热这里只有成人精品国产| 中文字幕乱码中文乱码51精品| 亚洲成av人无码综合在线观看| 欧美成人精品在线| 再看日本中文字幕在线观看| 成人午夜视频免费看欧美| 久草网视频在线|