成都正在大力發展新經濟培育新動能。在“大數據+”方面,重點拓展交通指揮調度、個性化診療、智慧化工廠管理、大通關和物流信息服務等行業應用,推動大規模數據倉庫、數據清洗、數據可視化等共性基礎技術研發。大數據來源于生活的方方面面,同時為生產、生活提供服務。成都大數據實驗室,展示出大數據在人們生活中的運用。
不會的題就選“C”?科學嗎?
大數據專家指出,其實四個選項都一樣。曾經有一句在高三學子中流傳甚廣的考試技巧——在高考中,遇到完全不會的選擇題就選“C”。這個被無數學子奉為應考“必殺技”的做題技巧,真的好用嗎?
在國家信息中心大數據創新創業(成都)基地,成都尋道科技有限公司研發主管郭斌為我們進行了相關數據分析。分析中,選取了2008年到2018年11年來的四川高考英語試題545道選擇題答案作為樣本,并用概率統計方法對其進行了排列分布規律分析,分析結果顯示,其中A選項有139道,B選項有139道,C選項有133道,D選項有134道。從分布概率來看,A選項占25%,B選項占26%,C選項占24%,D選項占25%,四個選項的分布情況差別不大。
通過逐一對每一年選擇題答案進行單獨分析,可以發現這11年以來,答案選C的選項出現頻率最低是在2013年的四川高考英語題選擇題中,為22%,出現頻率最高的是2018年的四川高考英語選擇題中,為29%,其余的年份的選擇題C答案選項分布都比較均勻,在23%~27%之間。
另外,從題型來看,除了2008年四川高考英語試題中的語法和詞匯知識題C選項占比為33%,2016年和2018年完型填空C選項占比為35%以外,其余題型C選項分布都在25%左右徘徊。
“由此可見,A、B、C、D四個答案選項分布概率都差不多,沒有哪個選項出現的頻率特別高?!惫蟊硎?,從這個分析結果可以看出,在高考出題時,出題方應該對各選項的分布都進行了綜合考慮。
大數據形成“學生畫像”
可預知未來還可精準扶貧
“在這個實驗中,我們所運用到的是大數據分析當中最基礎概率分析手段,但是真正的大數據,所涉及到的樣本是萬計甚至百萬計的,而通過分析這些樣本數據,我們可以做很多事情。”郭斌透露,從2015年起,他們團隊就在省內部分高校進行了大數據試點,“我們對學生在校的行為軌跡、消費以及進出宿舍、圖書館借閱的數據進行記錄,收集到他們的生活學習各種數據。形成完整的“學生畫像”,借助大數據分析技術,對他們進行全面的分析?!币揽窟@些數據,能夠精準地幫扶家庭困難的學生。