/蔡肖兵
大數據,難點是求真
/蔡肖兵
大數據紛繁多樣,優劣摻雜,隨著數據規模擴大,統計結果的真實性、準確性可能大打折扣。《大數據時代》一書的作者也不諱言,大數據本身探尋的是一種趨勢,而非精準性,大數據時代需要學會接受數據的不完美。換言之,不能因為不精確而放棄大數據的應用和發展,若要無限接近統計結果的真,必須讓大數據與精細的傳統統計方法互補,而非兩者相互替代。
對科學界來講,大數據并不是一個全新的概念。與自然科學不同,社會化下的信息技術,讓大數據進入了社會層面,被賦予更多新的含義和期待。量子基金的喬治·索羅斯提出過一個“自反性”概念,認為社會系統的參與者是有思想的,在這樣的環境中,不僅觀察,就連思想和信念都會影響到我們研究的對象,從而影響我們得出的結論。索羅斯的這一概念,對于大數據研究和應用也同樣適用。
盡管日益成為大數據的享用者和制造者,人們還是應該保持主動性,不能被數據牽著鼻子走。
(人民日報)