劉林+李藝
[摘 要]文章描述一種搜索競價廣告關鍵詞的優化方式,該方式可以精準地提取推廣信息中的關鍵詞,進而為廣告主創造更大的經濟成效。文章細致剖析這部分經濟要素并且選取當中對于競價關鍵詞作用最顯著的要素當作優化特點,用作成果的改善,主要憑借對關鍵詞的抽取進行改善。對于此類關鍵詞計算方式的改善目的在于為使用者確立的競價廣告推送眾多有關的關鍵詞,幫助企業獲取更高的點擊率。
[關鍵詞]搜索引擎優化;關鍵詞廣告;SEO
[DOI]10.13939/j.cnki.zgsc.2016.32.159
1 引 言
互聯網的迅速發展,帶動了互聯網信息的膨脹,其商業價值也被人們所發掘。更多的行業將信息投放到網絡當中,希望通過搜索引擎廣告或其他類型廣告被發現,以低成本帶來可觀的收益。這其中的搜索引擎優化則是目前來看最為主流和有效的廣告推廣形式,大部分企業都青睞這一方式。
我國搜索引擎行業已經比較成熟。搜索引擎關鍵詞搜索成為企業主要關注的領域。為了能夠給企業帶來更好的推廣效益,需要及時更新搜索引擎營銷,來適應當前的網絡環境,滿足客戶的需求。這就需要時刻對行業情況以及搜索引擎的抓取方式進行分析,為商家帶來更多的商機。
2 關鍵詞提取相關文獻述評
2.1 關鍵詞提取方法
目前,市場上主流的關鍵詞提取方法主要包括:啟發式原則提取文本當中的關鍵詞,借助于無監管學習方式來提取關鍵詞,以自動標示文獻主題為基礎的提取方式,以詞語網絡為基礎的關鍵詞提取方式等。
2.2 存在的問題
雖然關鍵詞提取方式眾多,不過都存在著或大或小的缺陷,比如: 一般的提取方式是為文本產生可以表示其主旨的關鍵詞,但是搜索競價廣告關鍵詞優化的目標卻沒有這么簡單,任何可能會引導用戶進入企業網址的詞匯都應納入候選目標當中。還有,關鍵詞產生范疇存在差別。一般的提取方式均提取特定文本當中的關鍵詞,但是搜索競價廣告關鍵詞優化方式產生的關鍵詞僅有極少數顯現在推廣信息當中,剩余的均依據計算方式的設置在別的材料當中體現。
為了能夠解決方法存在的一些問題,本文以搜索廣告的特征為基礎推出一種提取方式來產生種子關鍵詞。
3 種子關鍵詞生成
3.1 問題分析
搜索廣告種子關鍵詞提取要獲取的結果是一批和主旨存在關聯的關鍵詞,這類詞語當中輸入方,參加到之后的環節當中。
3.2 模型簡介
這種方式是以序列模式發掘為基礎的。序列模式發掘屬于速度較快的一類方式。文章選用的是以這一方式為基礎的迭代法來發掘語言模式及提取關鍵詞。這一以模式發掘為基礎的關鍵詞提取模型的操作流程簡單地介紹如下:其一是選出一批備選的關鍵詞當作種子并且運用序列模式發掘的計算方式以選出的關鍵詞為基礎來選擇關鍵詞的模式,其二為運用語言模式提取關鍵詞。此次迭代獲得的關鍵詞將會當作下一輪迭代首個步驟的輸入來發掘接下來的語言模式。這一迭代流程重復操作直至不再產生全新的語言模式。
文章將廣告文本處置成數個語句的集合,關鍵詞是可以表現語句主旨的單詞。語言模式是和關鍵詞緊密相聯的詞序。比如:在例句“店鋪出售鮮花”當中,“鮮花”便是關鍵詞,詞序“店鋪出售”便是語言模式。
3.3 語言模式挖掘
3.3.1 初始關鍵詞選擇
這種算法第一步便是要選取一批最初的關鍵詞用作發掘最初的語言模式。文章指出,ODP 的目錄名能夠被選定成最初的關鍵詞集合。可是這種目錄名無法涉及全部的關鍵詞,因而這一算法必須持續地迭代,從而發掘出全新的關鍵詞。
3.3.2 語料預處理
在展開語言模式發掘以前,最初的語料庫必須展開預先處置,文章將預先處置的全部程序表述為:
(1)運用文本預先處置的方式對其展開預先處置,這類的活動包含中文分詞處置、詞句分離、量詞消除等。
(2)利用
3.3.3 序列模式挖掘算法
文章將語句視為詞語的集合,因為采用序列模式發掘的方式來提取語言模式。
文章把全部的序列按照元組來劃分并且存進數據庫,元組呈現成< sid,s>,在這當中 sid 是序列的標記,s 是屬于該元組內的某個詞語集序列。若序列α屬于s的子集,那么便說s 包含α。文章把序列α的支撐度界定成數據庫S當中包含α的元組的數量,其具體可闡釋為:
Support(α)=|{
若Support(α)超過了設置的閾值,便將α當作模式。
序列模式發掘方式的目的是尋找相應數據庫當中全部的模式。在文章的語言發掘方式當中序列屬于文本預先處置流程當中的分段,序列中的要素便是分段中的詞語。
3.3.4 模式匹配
語言模式發掘方式產生的語言模式將用作配置語料庫從而產生全新的關鍵詞。若某個詞語或是短句在發掘的語言模式當中有所表現而且處在
4 結 論
搜索競價廣告關鍵詞優化力爭為在搜索引擎中投送推廣信息的人群供應最佳的關鍵詞選取規劃,從而幫助其獲取更高限度的經濟利益,并且促使其脫離繁雜的人工操作階段,有力地給予他們科學引導。因而,對其的探究具有極大的運用價值。
本文給出了一種廣告關鍵詞抽取算法用于抽取廣告中的關鍵詞。該算法首先利用序列模式挖掘算法抽取語料庫中的語言模式,然后利用抽取得到的語言模式庫對廣告進行關鍵詞抽取。這種算法克服了傳統的基于統計信息的關鍵詞抽取算法在廣告關鍵詞抽取領域中的不足,其抽取結果的準確率和查全率都有很大提升。
參考文獻:
[1]丁銀芳.基于Web日志挖掘的個性化推薦原型系統研究與實現[D].南京:南京農業大學,2009.
[2]張建娥.基于TFIDF和詞語關聯度的中文關鍵詞提取方法[J].業務研究,2012(10).
[3]馮佳佳.基于序列模式挖掘的關鍵詞抽取問題研究[D].合肥:合肥工業大學,2012.
[4]劉建毅,王箐華,王樅.基于語言網絡的關鍵詞抽取[C].北京:第三屆全國信息檢索與內容安全學術會議論文集,2007:161-168.