保定職業技術學院 李曉敏
現在我們的生活中,許多事物的發展都與大數據分析息息相關。2020年經濟發展中的各項數據為2021年經濟發展指明了方向,也為在前一年經濟發展中容易觸發的經濟發展問題提供了更加穩妥的發展途徑。在2020年各行各業發展的巨大變化的大數據分析中,許多在2021年從事創新創業工作的人選擇了更加穩妥和抗擊風險性強的創業領域。從以上例子中我們可以看出,大數據時代下,每一個數據分析成果都是決定我們生活和未來發展的風向標,而在大數據分析過程中人工智能技術的發展又需要依托于數據分析支撐,大數據分析已經成為新一代科學技術發展產物不斷優化所必須掌握的一項分析方法。
從20世紀五十年代開始,“人工智能”這個概念第一次被提出,到現今人工智能技術的快速發展引領科技潮流,不過短短幾十年間人工智能技術的發展就成為人類生活不可或缺的一項技術。機器也能有思維,機器也能與人對話。這一觀念的不斷發展,成為現今人工智能技術發展的基礎思想。20世紀九十年代人工智能技術在經歷了科學發展低谷期后,在大數據分析技術的誕生后又煥發出新的活力,國內國外的人工智能技術不斷取得創新突破。阿里巴巴、騰訊、小米等互聯網公司在人工智能技術的研究上不斷取得較好的成績,隨著我國經濟發展不斷加快,人民生活水平的不斷提高,人工智能技術已經進入到千家萬戶,人工智能進入了新的發展時期。
“語音控制”“遠程遙控”“智能對話”已經成為現在許多電子產品和智能管理系統的標準配置,人工智能技術不僅在辦公場所、商業場所中得到應用,更進入許多家庭,“智能家居”成為現代裝修的首選。可見人工智能的發展正處在新發展階段,在不斷發展的過程中已經取得了較好的成績。
大數據分析這一技術,誕生于2005年,從這一時期開始大數據分析技術就成為許多科技產業和商業化科技產業的重要發展技術。從我國的幾個發展較為快速的商業產業來說,阿里巴巴、騰訊、小米等互聯網公司的發展依托于大數據分析技術不斷適應用戶口味,制造出符合市場需求的新興產品,快速打開數碼市場,消費增長速度持續上升。我國在十三五重點規劃項目中已經將大數據作為一項重點項目,可見大數據的應用對國家發展、社會發展以及經濟發展具有重要的作用。
大數據分析,也就是在科學技術的發展過程中對大量的信息數據進行分析,在分析這些數據的過程中將這些數據中蘊藏的信息進行提煉、分類、總結,在這些信息中尋找有價值的信息內容從而再獲得極大價值的一個分析過程。大數據分析對于國家發展及社會進步具有重要價值,對于現今各行各業的發展具有不可忽視的作用。
數據的可視化,就是將數據從簡單的數字形式的呈現方式轉變為可視化的圖表或者圖形、立體化圖案等可視化的直觀呈現方式,人們在閱讀可視化圖表或者觀察可視化數據圖案時,能夠清晰地感受到數據之間的差異,快速定位數據中需要的內容,在直觀地分析過程中理解數據內容,實現快速運用的作用。數據的可視化不僅包括數據信息的符號表達技術,還包括數據的可視化交互技術、數據可視化模型技術等,這些可視化技術成為數據表示的形象基礎建設技術。隨著我國科學技術的發展與教育水平的要求不斷提升,現代化教育方式要求科學技術與教育相融合,大數據分析技術也與教育逐漸融合,成為現今教育工作開展中將教育效果有效提升、教育方法增加的重要方式。在大數據分析的支持下,對不同地區學生的教學數據進行分析,我們可以直觀地看出學生在不同地區所學知識的差別和對知識的理解程度存在的差異性,這些數據又可以通過數據的可視化表現出來,讓負責教育工作的人員以更加直觀的效果感受數據之間存在的差異性。對于教育工作來說,通過數據分析及時找到不同地區學生之間學習水平存在差異的原因,找到阻礙教育質量提升的問題之所在,最后再整改和優化教育方法和教育內容后再對后期數據進行分析,在大數據支持下又可以直觀的了解教育工作整改的效果,這是大數據分析以及數據可視化帶給教育領域工作的一項便利。
對于學生來說,許多地區受到自然環境或者教學條件的限制,對于一些教學內容不能完全理解,這樣的現象廣泛存在于我國偏遠地區的教育工作中。使用互聯網的遠程教學能夠讓學生遠程學習來自優質教學資源的課程,但是對于一些需要親眼看到或者了解的內容卻始終難以做到讓學生感受。數據的可視化將學生的課程體驗提升了一個層次,在教學中讓學生以數據可視化的形式了解了更多與所學知識相關的數據,提升了教學興趣。
人工智能技術的大數據分析方法應用中,首先要先進行大數據的聚集,將海量的數據收集到一個數據收集算法的數據庫中,再將這些數據通過各種計算方法實現下一步的分類、篩選等步驟。大數據的聚集現今主要運用的技術有兩種,分別是MapReduce算法、K-means算法,這兩種算法都在實際應用中具有一定的應用效果。MapReduce算法能夠大幅度的提升算法的聚集效果,在計算的過程中能夠有效降低計算機計算的復雜程度,使得計算過程盡量簡單。MapReduce算法在不斷的發展中逐漸適應學習深度,在提取數據特征的過程中優化算法,使得計算過程越來越被更多使用者接受。K-means算法作為另外一種典型的聚集算法,在使用中主要將研究方向指向提升大數據處理速度以及這種算法的應用性能上。K-means算法的優化過程中,不斷改進迭代計算的不穩定性,在計算過程中減小計算誤差,也具有較為廣泛的應用面。大數據的聚集過程應用上述兩種算法使得數據收集更加便捷和快速,大數據分析邁出了第一步。
大數據的關聯分析是對大數據聚集的各種數據進行關聯以及分析的過程,在這一過程中大數據分析將找到更多有價值的信息。Apriori算法是一種常用的大數據關聯分析挖掘計算算法,在這一算法的計算過程中,主要的計算原理是先設定一個支持度閾值,在數據算法運行的過程中符合這一支持度閾值的數據將被標記關聯。但Apriori算法有兩點不足之處,由于Apriori算法的時間成本較大,所耗費的時間較長,對于快速發展的數據時代具有一定的發展局限性,二是Apriori算法在計算的廣度上有所欠缺,難以將計算出的數據的關聯性加強。FP-Growth算法的關聯分析過程,是將數據構建成一個數據樹,FP-Growth算法的計算過程通過兩次的分析能夠將數據中存在的關聯項分析并標記,大量節約了時間成本,對于大型數據庫的關聯分析計算,FP-Growth算法具有較高的應用價值。
大數據關聯計算后,經過數據分析得出已經關聯的數據進入了一個數據庫中,在這數據庫中通過并行化的算法處理將其引入數據平臺。大數據關聯的應用直接與大數據預測緊密聯系,大數據平臺中的數據經過分析后,可以直接對所需要的行業數據進行對比分析,找到需要的數據內容。將大數據平臺中的數據內容分析后得出的結論,對于指導行業發展具有較高的數據支撐作用,引導未來經濟走向。在智能網絡的應用中,數據的檢索以及數據的分析都需要利用到大數據關聯分析,在分析的過程中直接檢索出與檢索內容相關的數據,直觀的展現出數據內容。在現今快速發展的人工智能語音等科技產品種,大數據關聯應用直接與人工智能的后臺連接,當使用者說出語音指令,大數據關聯直接索引到一系列關鍵詞,在使用的過程中起到提升使用快感,提高產品性價比的作用。
在人工智能技術的大數據分析方法使用中,需要對大數據分析方法進行嚴謹試驗,保證大數據分析中使用的算法與實際需求相匹配,減少使用中出現的卡頓問題。大數據時代下,信息更新速度快,信息產生時間短,在這些信息特質下需要大數據分析方法中的各種算法具有較高的計算準確性,計算速度。例如在選擇大數據關聯分析的算法時,選擇FP-Growth算法對于未來人工智能技術的快速發展來說,更具有前瞻性。對于商業領域來說,由于投入生產的人工智能產品受到使用年限以及使用次數的限制,生產者在選擇算法時更應該選擇計算性能較為優越的算法,算法應該在計算過程中具有較為穩定的模型,具有計算深度和計算廣度,為未來科學技術發展做好準備,實現人工智能技術的優化。
21世紀科學技術的快速發展背景下,人工智能技術的應用使人們的生活更便捷化,對于現今社會發展來說具有不可替代的重要作用。從現在人工智能技術的發展速度來看,未來十年甚至只在未來五年內,人工智能技術的發展都會發生較大的變化。為了適應快速發展的人工智能技術,大數據分析方法的使用需要緊跟時代腳步,根據現有的技術手段以及算法模型,不斷優化與提升技術,使得人工智能技術的大數據分析方法有更多的發展空間,提升使用實用性。