999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的歌詞和古詩自動生成系統設計

2021-06-28 01:04:50彭濤
現代信息科技 2021年1期
關鍵詞:深度學習

摘? 要:文本生成技術在近年開始深受研究者的青睞,其中就包括了古詩和歌詞的自動生成。文章設計了一個基于深度學習的歌詞與古詩自動生成系統。生成過程主要包括了數據預處理、歌詞和古詩生成模型搭建、歌詞和古詩生成模型訓練、使用訓練好的模型生成歌詞和古詩。通過測試,該歌詞和古詩生成系統比傳統的機器寫作系統效果更好,語義更準確。

關鍵詞:自動生成;深度學習;訓練模型

中圖分類號:TP391.41 ? ? ?文獻標識碼:A 文章編號:2096-4706(2021)01-0025-03

Design of Automatic Generation System of Lyrics and Ancient Poems

Based on Deep Learning

PENG Tao

(Jiangxi Youth Vocational College,Nanchang? 330045,China)

Abstract:Text generation technology has been deeply loved by researchers in recent years,including the automatic generation of ancient poems and lyrics. This paper designs an automatic generation system of lyrics and ancient poems based on deep learning. The generation process mainly includes data preprocessing,lyrics and ancient poems generation model building,lyrics and ancient poems generation model training,using the trained model to generate lyrics and ancient poems. Through the test,the lyrics and ancient poems generation system has better effect and more accurate semantics than the traditional machine writing system.

Keywords:automatic generation;deep learning;training model

0? 引? 言

古詩作為中國古代文學藝術的結晶,是中華民族文化藝術寶庫中非常重要的部分。那些歷久彌新的古詩展示了古代文人墨客的多彩生活,更包含了中國國民精神的全部符碼。歌詞作為音樂的核心,美妙的音樂必然少不了高品質的歌詞,所以歌詞和古詩自動生成技術的研究是非常有意義的。筆者在教授計算機課程過程中,發現班上一些學生對歌詞和古詩也很感興趣,在業余時間,就帶領這些學生利用所學的深度學習知識設計開發了歌詞和古詩自動生成系統,該系統已經進入測試階段,目前能夠較好地完成歌詞和古詩自動生成。該系統的開發,不但將所學知識應用于實踐,讓學生體會到所學知識的用武之地,還陶冶學生了情操,積極響應國家提出的課程思政教育,積極推進素質教育。

1? 系統功能概述

基于深度學習的歌詞和古詩自動生成系統是通過神經網絡對數據集進行學習和語義分析后訓練出模型,再利用模型和GUI圖形界面為用戶提供古詩和歌詞生成服務的系統。對于歌詞生成來說,用戶需要先輸入10個字作為歌詞的前奏,系統會根據前10個字預測下一個字,以此類推,當然系統會自動分析一句歌詞什么時候結束,用戶可以根據自己的喜好生成大量的歌詞文本,再加以修飾,效果就會非常好。對于古詩生成來說,可以利用關鍵字生成古詩或者藏頭詩,用戶可以自己輸入關鍵字,非常的方便,生成的古詩格式是保證正確的。系統流程圖如圖1所示。

本系統的核心功能:

(1)生成歌詞:通過用戶輸入的歌詞前奏,利用系統的模型生成歌詞文本。

(2)生成古詩:通過用戶輸入關鍵字,利用模型生成意境相似的古詩。

(3)生成藏頭詩:通過用戶輸入4個關鍵字,利用模型生成藏頭詩。

基于深度學習的歌詞和古詩自動生成系統由多個模塊構成,總體可以分為服務于LSTM神經網絡的數據預處理模塊、LSTM神經網絡模塊和GUI服務模塊。數據預處理模塊主要是對3.4萬首中文歌詞和10.6萬首傳統古詩進行預處理,轉換成One-Hot編碼,神經網絡才能進行矩陣計算、學習。LSTM神經網絡模塊是最核心的模塊,該模塊是歌詞和古詩生成最關鍵的部分,訓練參數的選擇十分重要,需要通過不斷進行對比、調參,記錄損失值和準確率來最終確定模型參數,通過用戶交互界面,方便用戶使用該系統。

在LSTM神經網絡模塊中分為訓練模塊和生成模塊,首先必須有足夠的數據用于訓練模塊,該模塊是最重要的模塊,訓練之后要保存模型,用于重構模型以生成歌詞和古詩。可以說訓練模塊的獨立的,最終只有生成模塊會有數據交互,同時與GUI界面關聯起來。本系統的神經網絡結構使用的是RNN循環神經網絡以及LSTM長短期記憶模型用于訓練。深度學習框架使用TensorFlow和Keras,激活函數使用softmax,損失函數使用交叉熵損失函數和sequence_loss函數,優化器使用Adam。

本文使用中華詩詞庫和3.4萬首中文歌兩個數據集進行訓練和效果測試,建立兩個文本生成模型并進行訓練,學習得到較優的文本生成模型。能夠實現端到端隨機生成一首古詩或給出關鍵字的藏頭詩以及具有語義的歌詞。

數據預處理模塊是準備工作,在深度學習領域當中,準備數據是非常煩瑣的工作,本系統研究的中文歌詞沒有開源的數據集可供使用,需要爬蟲獲取,古詩數據集是開源的中華詩詞庫,JSON格式。數據操作流程為:

(1)去除指定無用的符號。

(2)文本只保留漢字。

(3)將文本轉為向量并輸入算法中。

最后則是GUI服務模塊,使用Tkinter實現,是Python自帶的標準圖形庫,設計人機交互界面,便于用戶進行相關操作。

系統整體結構圖如圖2所示。

2? 系統核心功能

2.1? 數據預處理

數據預處理主要包括了爬取歌詞、收集古詩、文本篩選、文本向量化和功能性處理。爬蟲主要運用于歌詞的獲取,本系統采用Python的爬蟲框架Pyspider爬取了非常多歌詞,但是不能直接用于訓練,要先手動刪除不需要的標點符號,留下中文歌詞,對于有些用網絡詞語改編的歌詞也不作為訓練集。古詩使用開源的中華詩詞庫。數據中可能存在部分符號的問題,例如中英文符號混用、每行存在多個冒號、數據中存在其他符號等問題,因此需要對數據進行清洗。通過文本篩選得到了比較干凈的歌詞和古詩文本,但是這樣的文本對于神經網絡來說是不能直接訓練的。需要對歌詞和詩句進行分詞,為了最后生成的歌詞和古詩的長度的整齊性及便利性,需要先按單個字符進行拆分,對所有文本分詞處理之后應對單個字符進行向量化,每個不同的字符對應唯一的向量,便于之后計算出值后轉換為對應的詞。最后,需要統計詞頻,刪除掉出現次數較低的詞。本文歌詞數據集采用的是中文歌詞,所有歌詞存放在一個txt文檔中,每一行存儲一首歌詞;古詩數據集數據采用的是全唐詩,一共包含105 336首唐詩,數據格式為詩歌內容,存放在JSON文檔中。

2.2? 歌詞和古詩生成模型

建立歌詞和古詩生成模型,需要三個步驟:搭建、訓練和保存。

2.2.1? 搭建模型

核心結構是兩層LSTM神經網絡,需要注意的是每次都定義一個新的BasicCell,而不是定義一個BasicCell之后多次調用。LSTM神經網絡在處理序列數據方面非常有效,雖然RNN與CNN都能進行序列建模,但本質上有不同。在搭建模型過程中還使用了Embedding層,稱為嵌入層,相當于一個網絡層,在模型第一層中使用,其目的是將有索引的標簽映射到高密度低維向量,達到降維的作用,可以防止One-Hot向量維度過大導致的運算速度過慢的問題,該層通常用于文本數據建模。使用LSTM神經網絡模型還有一個必不可少的全連接層(Dense層),它能夠根據特征的組合進行分類,大大減少特征位置對分類帶來的影響。

2.2.2? 訓練模型

創建session會話進行訓練,由于訓練集比較大,所以歌詞生成模型訓練30個周期,古詩生成模型訓練100個周期。輸入每一輪的損失值,通過每輪訓練后損失值的變化判斷LSTM神經網絡模型性能是否發生欠擬合,再比較LSTM神經網絡模型在訓練集和測試集的正確率判斷LSTM神經網絡模型是否發生過擬合。若發生欠擬合則應該增加LSTM神經網絡模型的深度或者增加訓練的時間,若發生過擬合則應該采取正則化的方法或者Dropout抑制過擬合。

2.2.3? 保存模型

歌詞生成模型保存為H5文件,古詩生成模型保存為DATA-00000-OF-00001文件。Keras框架使用model.save()方法保存模型,TensorFlow框架使用tf.train.Saver類來保存模型。

2.3? 生成歌詞和古詩

2.3.1? 歌詞生成

生成歌詞需要用戶先輸入10個字,定義“抽樣函數”,作用是從模型中得出當前文本的下一個字符的概率分布,將分布重新調整,根據重新加權的分布隨機抽樣下一個字符,在當前文本的末尾添加新字符。定義生成歌詞函數,通過調用“抽樣函數”和model.predict()方法,用前10個字預測下一個字,直到for循環結束。

生成歌詞的核心代碼為:

def create_music(gen):

for i in range(300):

x_p = np.zeros((1, maxL))

for t, char in enum(sent):

x_p[0, t] = chartoid[char]

forecast= model.predict(x_p, verbose=0)[0]

nextIndex = sample(forecast, diversity)

nextChar = idtochar[nextIndex]

gen += nextChar

return gen[1:]

2.3.2? 古詩生成

生成古詩分為用戶輸入關鍵字生成古詩和輸入4個字藏頭詩,每次預測其實是根據一個序列預測一個新的詞,需要詞的多樣化,因此可以按預測結果的概率分布進行抽樣。藏頭詩就是固定每句詩的第一個字,按照藏頭來預測該行的詞。

生成古詩的核心代碼為:

def create_poetry():

st= sess.run(ini_s)

while :

x = np.zeros((b_size, 1))

x[:, 0] = char2id[c]

p, st = sess.run([probs, last_s], feed_dict={X: x, init_s: st})

p = np.squeeze(p)

pos = int(np.sorted(np.sum(p), np.random.rand() * np.sum(p)))

c = id2char[pos]

return gen[1:36]

系統主界面如圖3所示。

古詩生成界面如圖4所示。

歌詞生成界面如圖5所示。

3? 結? 論

本文在闡述完開發基于深度學習的歌詞和古詩自動生成系統的背景和意義,完成系統設計后,使用Python語言對系統進行實現,主要使用了RNN以及LSTM神經網絡模型進行歌詞和古詩的自動生成。生成過程設置兩個階段,每個階段包括一個RNN檢測模型,使用中華詩詞庫數據集訓練得到生成古詩的模型,使用中文歌詞數據集訓練得到生成歌詞的模型,通過訓練好的RNN進行古詩和歌詞的生成,得到具有語義的古詩和歌詞。

參考文獻:

[1] 池云仙,趙書良,羅燕,等.基于詞頻統計規律的文本數據預處理方法 [J].計算機科學,2017,44(10):276-282+288.

[2] 肖燁晗.基于自然語言生成技術的人工智能應用 [J].科技傳播,2019,11(7):155-156.

[3] 馬然.基于深度學習的自然場景文本識別系統的設計與實現 [D].長春:吉林大學,2015.

[4] 段軍紅,李曉宇,慕德俊.一種非完全標注的文本分類訓練方法 [J].微處理機,2019,40(1):20-24.

[5] 張克君,史泰猛,李偉男,等.基于統計語言模型改進的Word2Vec優化策略研究 [J].中文信息學報,2019,33(7):11-19.

作者簡介:彭濤(1974—),女,漢族,江西龍南人,講師,碩士,主要研究方向:計算機應用。

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 久久久久无码国产精品不卡| 久久国产亚洲偷自| 欧洲日本亚洲中文字幕| 99视频只有精品| 亚洲美女久久| 国产乱人激情H在线观看| 亚洲首页在线观看| 国产精品亚洲综合久久小说| 亚洲国产精品日韩欧美一区| 久久成人免费| a欧美在线| 欧洲av毛片| 三级毛片在线播放| 亚洲va欧美va国产综合下载| 亚洲天堂成人| 国产呦精品一区二区三区下载| 免费网站成人亚洲| 亚洲天堂免费观看| 中文字幕亚洲另类天堂| 久无码久无码av无码| 久久午夜夜伦鲁鲁片无码免费| 91精品国产丝袜| 无码视频国产精品一区二区| 免费观看精品视频999| 美女被躁出白浆视频播放| 九九热精品视频在线| 国产欧美亚洲精品第3页在线| 久久免费精品琪琪| 精品少妇人妻av无码久久| 一本无码在线观看| 日韩av在线直播| 青青草91视频| 九色91在线视频| 熟妇人妻无乱码中文字幕真矢织江 | 亚洲无码精品在线播放| 天天爽免费视频| 国产男女免费完整版视频| 亚洲精品动漫| 久久这里只有精品8| 国产精品一区二区在线播放| 狠狠色噜噜狠狠狠狠奇米777| 中文字幕乱码中文乱码51精品| 婷婷亚洲天堂| 欧美亚洲香蕉| 国产精品免费福利久久播放| 中文字幕不卡免费高清视频| 91外围女在线观看| 91系列在线观看| 欧美性天天| 成人小视频网| 又粗又硬又大又爽免费视频播放| 91精品久久久久久无码人妻| 最新加勒比隔壁人妻| 欧美日韩中文国产va另类| 国产精品福利尤物youwu| 国产精品无码翘臀在线看纯欲| 国产尤物jk自慰制服喷水| 国产高清精品在线91| 无码一区中文字幕| 欧美一级高清片欧美国产欧美| 91丨九色丨首页在线播放| 国产在线拍偷自揄拍精品| 国语少妇高潮| a天堂视频| 国产一区二区免费播放| 久久久久亚洲av成人网人人软件| 一本大道无码日韩精品影视| 成人年鲁鲁在线观看视频| 久久国产精品国产自线拍| 亚洲欧美极品| 免费一级成人毛片| 国产黄视频网站| 国产精品手机视频一区二区| 天天综合网亚洲网站| 国产女人18毛片水真多1| 中国国产A一级毛片| 538精品在线观看| 思思热在线视频精品| 国产精品夜夜嗨视频免费视频| 亚洲国产中文欧美在线人成大黄瓜| 久久这里只有精品2| 久久久久人妻一区精品色奶水 |