張記存
高中信息技術教材引導學生通過了解如何采集、存儲、組織、處理、分析與可視化表達數據,認識數據對日常生活的影響,并形成數據的安全意識。下面筆者梳理一下教材中與數據科學相關的具體內容。
數據
①定義:數據是對客觀事物的符號表示。②特征:二進制、語義性、分散性、多樣性與感知性。③來源:按照獲取渠道,可以將數據分為兩類——直接數據和間接數據。④收集方法:直接數據的收集方法,如調查法、訪談法等。間接數據的收集方法,如查閱文獻資料等。
數據采集
1.模擬信號、數字信號及相互轉換
模擬信號的值是隨時間連續(xù)變化的,波形光滑。數字信號隨時間的變化是非連續(xù)的,是離散的。通過一定的規(guī)則和方法可以實現(xiàn)模擬信號和數字信號的相互轉換,將模擬信號轉化為數字信號的過程稱作模數轉換,將數字信號轉換成模擬信號稱為數模轉換。
2.進制及轉換
在計算機科學中,除了使用二進制外,人們還經常使用八進制和十六進制。字母D表示十進制,字母B表示二進制,字母O表示8進制,字母H表示16進制。
3.編碼
(1)文本編碼
用于文本數據字符編碼的方案有多種類型,其中ASCII碼和Unicode是最為典型的兩種編碼方案。
(2)圖像編碼
圖像文件大小的計算公式為:圖像文件大小=圖像寬度×圖像高度×色彩深度/8(字節(jié))。
(3)音頻編碼
音頻文件的大小取決于采樣頻率、量化位數、聲道數和時長,音頻文件大小的計算公式為:音頻文件大小=采樣頻率×量化位數×聲道數×時長/8(字節(jié))。
(4)視頻編碼
視頻是由以一定的速度連續(xù)播放的一組靜態(tài)圖像形成的,這些靜態(tài)圖像被稱為幀。
數據存儲
計算機中存儲容量最小的單位是比特(bit)。8bit為一個基本單位,稱為字節(jié)(Byte)。常見的單位還有KB、MB、GB、TB等。
數據分析
數據分析是在一大批雜亂無章的數據中,運用數字化工具和技術,探索數據內在的結構和規(guī)律,構建數學模型,進行可視化表達,通過驗證將模型轉化為知識,為診斷過去、預測未來發(fā)揮作用。
可視化表達及數據分析報告
以圖形、圖像和動畫等方式更加直觀生動地呈現(xiàn)數據及數據分析結果,揭示數據之間的關系、趨勢和規(guī)律等的表達方式稱為數據可視化表達。
數據分析報告是項目研究結果的展示,也是數據分析結論的有效承載形式。
大數據
大數據的5Ⅴ特征:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
數據安全
威脅數據安全的因素有很多,如硬盤驅動器損壞、操作失誤等。
對于數據安全,不僅要做好防護,還應提高數據本身的安全,常見的數據校驗方法有MD5等。