李滕飛 孫東 王平 張曉龍 張譯心 李雷

【摘要】如今多數文章被文體語法等方面限制,自動生成文章為人們的生活提供便利和創造力,有利于解放固有思想模式,建立多元文化,提高文章的新穎性。
【關鍵詞】自動生成文章 ?深度學習 ?大數據分析 ?數學建模
一、引言
通過大數據在數據庫中提取各類所需文章進行整理,并在深度學習的技術支持下實現計算機創作出的文章的高質量,在如今快節奏的時代里能夠更多的節省人們的時間,方便人們的生活。這個項目對于短時間內需要一些高質量、創新性、廣泛性文章的人們來講是非常的高效而且實用,通過這個項目使需要新文章新思路等需求的工作人群的壓力得到緩解,更好的便民利民。
二、項目實施的意義
(一)從本項目的實際意義
如今我們的生活壓力過大,多數文章被文體語法等方面限制,在線生成文章可方便人們的生活,具體目的如下:
(1)解決家長的講故事難問題,激發孩子的想象力與語言表述能力,鍛煉孩子的外語能力。
(2)實時生成最新新聞的過程與評論。
(3)創造出新的文體文風,擴展文學領域。
(4)給無創作思路的人群提供素材模板與思想。
(5)生成提供廣告語、主持人臺詞、劇本內容、藏頭詩、結婚請柬等。
(二)從本項目的開發角度
對素材的收集的過程也是一種學習,這一過程能對統計的結果過行簡單的分析,對機器學習的過程理解的更加深刻,發展初步的應用意識。對大學的本科學生進行專業技能的綜合訓練和實踐,在已經學習過的各種專業課程,如:計算機科學與技術、程序設計語言、數據庫原理、等專業課程的基礎之上,進行多門專業課程的綜合訓練和實踐活動,讓學生在感興趣的情境中,產生統計的需求,探究收集數據的方法,感知數學和生活的聯系,對深度學習產生認知。
三、問題分析
(1)在眾多文章中能夠篩選出所需文章類型對應的素材的問題。
(2)用大數據在眾多文章中的選擇問題。
(3)計算機如何對提供的關鍵字和文體對應下的文章迅速整理生成問題。
(4)對文本生成技術和數學方面知識方面的學習,初步設計和模型的建立還需要進一步學習和了解。
(5)研究用神經網絡來表達單詞的意義和深度學習應用于自然語言處理的辦法.
四、項目研究內容
(一)深度學習
機器學習包括深度學習,但是深度學習能產生更好的效果,可以讓計算機通過學習變得越來越智能。計算機是如何進行學習的,是我們重點研究的內容。歸根結底,深度學習和機器學習都是以數學建模為工具,運用深度學習的算法分析數學模型,對大量數據進行分析,計算機從中找出規律,再把規律運用到下一次“測試”中。
深度學習,從字面意義上來看,就是計算機的自我學習,和人類學習語言有一定的相似之處。首先,先理解一下人類學習語言的過程。人類在剛開始進行語言學習時,接觸的都是一些較為簡單的字詞句,不斷學習簡單的字詞,與字詞多次見面后就記住了,再通過簡單的字詞總結出記憶方法,在簡單字詞的基礎之上進行復雜字詞的理解與記憶。而深度學習的進程,與人類剛開始接觸一門語言的過程有異曲同工之處,計算機要學習的是龐大的數據,通過不斷分析和調試參數最終得出無窮逼近結果的模型。
(二)大數據
深度學習需要以大數據為支撐,在如今科技飛速變革的時代,更需要深度學習和大數據的緊密結合。大數據,顧名思義,就是龐大的數據。現如今我們提到的大數據,是信息交換、存儲、處理的過程中產生的數據。數據來源于生活,瀏覽器的搜索引擎、社交網站、購物網站等都會產生眾多數據。
五、解決方案
(1)利用互聯網廣泛收集文章的句式、文體與語法。
(2)通過大數據分析將大量高質量的文章收集并篩選其精良的部分,利用大數據將各類型素材集中。
(3)鉆研計算機模仿人類的語言學習行為的運轉,令機器學習整理生成創作出消費者所需類型的文章。
六、結語
時代飛速發展,人們的壓力不斷增大,通過計算機的機器學習自動生成文章便利了人們的生活。解放固有思想模式,建立多元文化,提高文章的新穎性,激發孩子的想象力與語言表述能力,緩解新聞媒體編輯者壓力,豐富新聞播出內容,開拓新的文學領域,減小創作者壓力并提供共鳴與靈感,降低廣告商的支出。運用深度學習技術自動生成文章有良好的發展前景。
參考文獻:
[1][美] 伊恩·古德費洛 / [加]約書亞·本吉奧 / [加] 亞倫·庫維爾.深度學習.人民郵電出版社.
[2]Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein.算法導論.機械工業出版社.
[3]吳軍.數學之美.人民郵電出版社.
基金項目:吉林建筑大學大學生創新創業訓練項目,項目編號:201910191115 。