999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡游記中地方熱度特產信息的抽取方法研究

2017-11-02 02:27:03李艷商洛學院經濟與管理學院商洛726000
微型電腦應用 2017年10期
關鍵詞:旅游信息

李艷(商洛學院 經濟與管理學院,商洛 726000)

網絡游記中地方熱度特產信息的抽取方法研究

李艷
(商洛學院 經濟與管理學院,商洛 726000)

通過調查問卷的形式對旅游愛好者進行調查,發現網絡游記中特產這一信息可以直接或間接影響到出游者的購物導向。結合斯坦福大學開發的Protégé軟件對特產信息進行本體庫的構建,并在此基礎上對游記文本進行預處理、解析,最終借助GATE平臺對網絡游記中特產信息進行抽取,并對抽取結果進行統計分析,從而為旅游地打造特色特產提供決策上的依據和幫助。

網絡游記; 信息抽取; 本體; Protégé

0 引言

網絡游記是旅游者根據自身的旅游體驗自發主動地在網絡中發表的一種文體形式,由于游記本身具有主觀自發的特點,相比傳統方式的問卷調查、座談等方式更能體現出游客的真實態度,游記中關于景點、住宿、交通、特產信息等的記錄往往會給眾多的旅游愛好者提供一個更加真實可靠的信息。到目前為止,國內外根據網絡游記所提供的信息對旅游地的研究越來越多,例如:通過網絡文本方法對旅游感知進行形象分析[1-3]進而對旅游發展和管理提供依據[4-5];深入分析網絡游記中熱度地名信息的提取[6],通過鏈接分析方法對網頁文本中核心地名的提取[7],為進一步研究旅游地認知行為提供重要依據。總體上看,目前研究的重點主要集中在網絡游記目的地形象構建的作用分析以及有關旅游景點地名信息的抽取研究,對于游記本身所帶來的出游決策、行為影響等方面還有待深入和細化。

本文通過對網絡游記中的關鍵信息進行分析統計,進而對關注度較高的特產信息進行概念關聯分析,借助本體庫的建立,為網絡游記中的特產抽取提供依據,進而為出游者提供一個購物的指導性建議,更能對旅游景點或是旅游區域建設中品牌特產的精準營銷提供決策上的支持。

1 商洛地區特產發展狀況與問題分析

商洛地處陜西省東南部,素有“秦嶺最美是商洛”之稱,近年來,商洛旅游已經成為商洛經濟發展的支柱產業之一,先后建成了陜西省唯一5A級生態類旅游景區——“商南金絲峽”、柞水牛背梁、山陽天竺山三個5A級景區以及老君山、月亮洞、棣花旅游區、塔云山和丹江漂流5個4A級景區[8]。商洛旅游的快速發展,吸引了越來越多的旅游愛好者來到商洛、了解商洛、感受商洛。隨著商洛旅游業的快速發展,旅游項目所在地熱度特產信息的挖掘已經成為制約商洛旅游進一步發展的短板,自2013年起,商洛市旅游局連續三年在年終工作總結中均提出遴選“商洛旅游必購特產”評比活動,由于商洛地區特產發展多有重合之處,例如:商洛的地理標志產品中僅核桃這一特產就有:商洛核桃、洛南核桃、山陽核桃、丹鳳核桃和柞水核桃五個品牌,加之此項評比采用問卷調查的形式,被調查者均帶有個人感情因素,因此評比工作效果不佳。

商洛六縣一區紛紛想借助旅游這一產業的發展從而帶動當地特產的銷售,然而由于各地特產特點不突出,種類繁多,沒有代表地方特點的主打產品,對于旅游愛好者的購物偏向把握不準確,資源調配精準度不夠,因此,特產的銷售一直處在一個停滯的狀態,相對于發展迅速的旅游業而言,特產銷售的滯后性已經引起了有關政府部門和行業的高度重視。

2 網絡游記中重點信息的統計

由于網絡游記這種形式的真實性較高,旅游者在出游前會以網絡游記中的相關記載作為一種參考,這種參考往往會為出游者的旅游決策提供參考性意見[9-10],那么網絡游記中的哪些信息更容易引起出游者的關注,本文通過問卷調查的形式以QQ、微信等途徑對商洛市旅游協會的旅游愛好者以及愛好旅游的家庭共計300人進行調查,問卷內容主要包括:網絡游記對出行計劃帶來的影響以及最想通過網絡游記獲取什么信息作為重點內容,最終收到有效網絡問卷267份,排除與所調查內容信息不符的35份,最終有效問卷232份,對于問卷中,以旅游者最想獲取的信息作為關鍵詞進行統計,被調查者可以有多種選擇,最終詞條結果排名前八的是“美食、特產、住宿、交通、花費、景點行程、圖片、時間安排”,如圖1所示。

圖1 網絡游記重點信息統計圖

3 網絡游記中特產信息的抽取方法

近年來,隨著信息抽取在各領域的廣泛應用,已經出現了相關領域的信息抽取系統,例如:基于自然語言處理方式的信息抽取系統:RAPIER 、WHISK等[11],基于機器學習方法的信息抽取系統:STALKER 、SoftMealy等[12]以及基于本體(ontology)的信息抽取系統:KEUOA、Artequakt等[13]。其中基于本體的信息抽取由于其對文檔的結構依賴程度少,只要領域本體足夠完善,就可以取得很高的準確率和召回率而受到廣泛應用。本文對于網絡游記中的特產信息主要采用的是基于本體的信息抽取方法,抽取流程,見圖2所示。

3.1 特產信息本體庫的構建

在網絡游記中,記載特產信息的同時會突出景點的介紹,因此在建立本體庫的過程中,景點名和特產是兩個核心概念,而對于任何一個景點而言,它都隸屬于某個縣或區,這些地名信息在網絡游記中有時會被游記書寫者所忽略,因此在提取核心概念的時候需要補充地名這一重要信息,提取出的核心概念為:

圖2 信息抽取流程圖

地名:本文以縣名作為最小單位,商洛地區包括了商州區、洛南縣、丹鳳縣、山陽縣、鎮安縣、柞水縣、商南縣;

景點名:包括各縣的景點,例如商南縣的金絲峽,柞水縣的柞水溶洞等;

特產:主要是特產名,例如核桃、板栗、花生等。

通過斯坦福大學開發的protégé作為本體構建工具對提出的核心概念進行建模,分別對旅游景點和特產信息進行本體構建,如圖3、圖4所示。

3.2 文本預處理

本文所處理的網絡游記信息主要來自于攜程網(www.ctrip.com)、途牛旅游網(www.tuniu.com)、螞蜂窩(www.mafengwo.cn)以及商洛旅游資訊網(www.sllyj.com)四個網站近三年有關商洛旅游的4 756篇網絡游記作為研究樣本,為了提高游記本身信息質量,需要對這些Web信息進行預處理:對于同一人發布的同一旅游地的游記進行合并,并刪除信息涵蓋量不足、篇幅較短的游記,最終保留有效樣本集1 020篇,并通過ICTCLAS2016分詞工具的JNI接口編寫JAVA程序對樣本文檔進行批量分詞標注[14]。

3.3 本體解析

本體解析的目的主要是為了把直接使用OWL語言編寫的本體庫中的信息進行解析,并把解析出來的概念、關系等結構存儲到數據庫中,解析的工具主要采用英國布里斯托市惠普實驗室推出的Jena,它是Java的一個API,解析流程,如圖5所示。

部分偽代碼如下:

OWLRead ()

{

OntModel m;//定義一個本體模型

m=ModelFactory.createOntologyModel();//建立這個模型

m.read(特產本體.owl); //讀取本體文件

for(對owl文件遍歷)

{

getSubClass();//返回所有的子類

getSuperClass();//返回所有的父類

返回屬性值及實例;

}

}

圖3 旅游景點地名本體建立模型

圖4 旅游地特產信息本體建立模型

圖5 本體解析流程圖

3.4 信息抽取

在抽取過程中,MUC定義的信息抽取任務中對于命名實體的抽取是做的最好的,其中利用GATE平臺進行的抽取準確率可以達到92%以上,為了達到很好的抽取準確率,對GATE中的NE Transducer組件進行抽取模板的制定[15],信息如下:

……

4 結果分析

4.1 特產信息的抽取結果

為了驗證前文提出方法的可用性以及實際效果,使用GATE[16]平臺對樣本文檔進行抽取(以山陽縣為例),樣本數量為258份,最終抽取結果,如表1所示。

表1 山陽縣景點特產信息抽取結果

通過對網絡游記中的特產信息抽取的結果發現:掛面、九眼蓮、核桃、鮮核桃等8種特產在游記中出現,現對抽取出來的這些結果進行出現頻率統計結果,見表2所示。

表2 山陽縣特產信息抽取結果頻率統計

4.2 現實效應

通過對這些特產出現的頻率進行統計發現,核桃、鮮核桃、天麻排在前三位,其中鮮核桃是一個特產信息中經常被忽略的內容,因為在山陽縣的旅游產品銷售中,核桃的影響力度遠遠超過鮮核桃,甚至很多產品都是依附于核桃這一特產而存在,例如:核桃油、核桃糖、核桃露等。通過對特產信息的抽取、統計得出鮮核桃這一特產在網絡游記中受到廣泛的關注,因此,在2016年8月,山陽縣政府通過網紅直播+手機淘寶的方式進行鮮核桃的網上推介,短短十小時,網上售賣上萬斤,讓全國人民吃上新鮮的核桃,并且對當地的經濟起到了不可估量的價值和現實意義。

5 總結

對于商洛地區而言,旅游業已經成為商洛經濟的支柱產業之一,近五年來,旅游業所帶來的綜合收入以每年超過10%的速度在增長,僅2015年全市共接待游客3 362.95萬人次,綜合收入174.87億元[17],而旅游產品中特產的銷售長期處在一個低速的發展水平,所帶來的經濟效益也微乎甚微,挖掘能夠代表地方特點的品牌特產已經迫在眉睫。

網絡游記由于它能夠真實有效的反映出游者的出游過程和體會,而影響到出游者的旅游計劃,對于游記中所反映出來的信息往往比問卷調查、座談、采訪更加真實,因此本文通過對網絡游記文本中的特產信息進行抽取,進而對抽取出來的內容進行統計,從而為重點建設旅游地特色特產提供指導性幫助。目前本文的研究僅局限于網絡游記中有關特產信息的抽取,相信在后續的研究過程中,會將此方法應用到旅游業的其他方面,從而為地方經濟的發展提供一個可參考的數據支持。

[1] 徐小波,趙磊,劉濱誼,等.中國旅游城市形象感知特征與分異[J].地理研究,2015,34(7):1367-1379.

[2] Jovanovic J, Gasevic D, Devedzic V. Tangram for Personalized Learning Using the Semantic Web Technologies[J].Journal of Emerging Technologies in Web Intelligence,2009,1(1):6-21.

[3] Olga C. Santos, Jesus G. Boticario. Users’ experience with a recommender system in an open source standard-based learning management system[A]//Santos, O.C. and Boticario, J.G. HCI and Usability for Education and Work[C].Graz:Springer-Verlag,2008.185-204.

[4] 張珍珍,李君軼.旅游形象研究中問卷調查和網絡文本數據的對比——以西安旅游形象感知研究為例[J]. 旅游科學, 2014, 28(6):73-81.

[5] 樂倩倩,曾超.南京市旅游形象供需關系研究——基于旅游官網和網絡游記中的感知形象[J]. 市場周刊, 2016(7):49-51.

[6] 沈曉婉.從網絡游記看鳳凰古城的元素性符號[D].沈陽:東北財經大學, 2013.

[7] Xu Li,Youcheng Wang. China in the Eyes of Western Travelers as Represented in Travel Blogs[J]. Journal of Travel & Tourism Marketing .2011, Vol.28(7), 689-719.

[8] 王永明,王美霞,李瑞,等.基于網絡文本內容分析的鳳凰古城旅游地意象感知研究[J].地理與地理信息科學, 2015, 31(1):64-67.

[9] 靜恩明,郭風華,李仁杰,等.基于新浪旅游博客的河北省A級景區網絡關注度研究[J].地理與地理信息科學, 2015, 31(3):118-122.

[10] Saman Shishehchi, Seyed Yashar Banihashem. Ontological Approach in Knowledge Based Recommender System to Develop the Quality of e-Learning System[J].Australian Journal of Basic and Applied Sciences,2012,6(2):115-123.

[11] 李照航,郭風華,李仁杰,等.大量網絡游記文本中熱度地名提取方法與實證研究[J]. 地理與地理信息科學, 2015, 31(1):68-73.

[12] Woerndl W,Huebner J,Bader R,et al.A Model for Proactivity in Mobile,Context-aware Recommender Systems[C].Proceedings of the 5th ACM Conference on Recommender Systems (RecSys’11).New York:ACM,2011:236-241.

[13] Kang J, Choi J. An Ontology-based Recommendation System Using Long-term and Short-term Preferences [C]. Proceedings of 2011 International Conference on Information Science and Applications (ICISA), Jeju Island, South Korea. IEEE, 2011: 1-8.

[14] 鐘翔,高勇,鄔倫.基于鏈接分析的網頁文本核心地名提取方法[J].地球信息科學學報, 2016,18(4):435-442.

[15] Hahn J. Location-based Recommendation Services in Library Book Stacks [J]. Reference Services Review, 2011, 39(4): 654-674.

[16] 程顯毅,朱倩,王進.中文信息抽取原理與應用[M].北京:科學出版社,2010.

[17] 楊敏,馬耀峰,李天順,等.基于屏幕跟蹤的大學生在線旅游信息搜索行為研究[J].旅游科學, 2012, 26(3):67-77.

ResearchontheExtractionMethodofLocalHotProductInformationintheNetworkTravel

Li Yan
(School of Economics and Management, Shangluo University, Shangluo 726000)

Investigation on travel enthusiasts through the form of questionnaire, found that the specialty of network travel information can directly or indirectly affect the tourists shopping willing. Combining Protégé software developed by Stanford University, ontology of specialty information was constructed, and based on this, journey text was processed anel analyzed. Finally, using GATE platform information was extracted for specialty in network travels, and the extracting results were statistically analyzed. It can provide basis for decision-making and help the tourism to focus on creating specialty products.

Network travels; Information extraction; Ontology; Protégé

P208

A

2016.11.28)

商洛學院項目(14SKY014);商洛市科技局項目(SK-2013-9)

李艷(1983-),女,講師,碩士研究生,研究方向:信息抽取、數據挖掘.

1007-757X(2017)10-0033-04

猜你喜歡
旅游信息
我們一起“云旅游”
少兒科技(2022年4期)2022-04-14 23:48:10
小A去旅游
好孩子畫報(2018年7期)2018-10-11 11:28:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
旅游
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
旅游的最后一天
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
健康信息(九則)
祝您健康(1987年2期)1987-12-30 09:52:28
主站蜘蛛池模板: 无码有码中文字幕| 久久人人爽人人爽人人片aV东京热 | 奇米影视狠狠精品7777| 激情影院内射美女| 成年av福利永久免费观看| 中文精品久久久久国产网址| 色窝窝免费一区二区三区| 亚洲中文字幕无码爆乳| 日韩精品欧美国产在线| 亚卅精品无码久久毛片乌克兰| 国产精品30p| 亚洲人成影院午夜网站| 国产资源免费观看| 波多野结衣无码中文字幕在线观看一区二区 | a天堂视频| 欧美精品综合视频一区二区| 中文字幕伦视频| 国产成人免费手机在线观看视频 | 色久综合在线| 欧美日韩国产精品综合| 成人精品亚洲| 国产尤物在线播放| 色婷婷成人| 国产永久免费视频m3u8| 国产v欧美v日韩v综合精品| 99视频在线免费观看| 日韩精品高清自在线| 亚洲小视频网站| 久久婷婷六月| 国产精品视频久| 欧美日本在线观看| av一区二区无码在线| 好吊妞欧美视频免费| 欧美成人影院亚洲综合图| 香蕉综合在线视频91| 午夜福利视频一区| 成年人午夜免费视频| 日韩天堂网| 天天综合网站| 五月综合色婷婷| 国产福利免费在线观看| 在线亚洲精品自拍| 亚洲一区第一页| 国产一区在线观看无码| m男亚洲一区中文字幕| 好吊日免费视频| 亚洲精品免费网站| 国产真实乱子伦视频播放| 综合久久五月天| 亚洲精品午夜无码电影网| 亚洲嫩模喷白浆| 亚洲欧洲日韩久久狠狠爱| 日韩在线永久免费播放| 99久久精彩视频| 午夜国产在线观看| 亚洲色大成网站www国产| 国产色婷婷视频在线观看| 亚洲成人免费看| 精品国产网| 亚洲天堂首页| 午夜成人在线视频| 五月天天天色| 亚洲综合色婷婷| 在线观看免费国产| 国产一区二区网站| 国产综合精品一区二区| 九九热精品视频在线| 99成人在线观看| 日日噜噜夜夜狠狠视频| 国产又爽又黄无遮挡免费观看| 国产欧美精品专区一区二区| 日韩专区欧美| 在线国产资源| 91精品国产福利| 国产熟睡乱子伦视频网站| 亚洲日本中文综合在线| 激情影院内射美女| 久久久久夜色精品波多野结衣| 91美女视频在线| yy6080理论大片一级久久| 亚洲AV无码久久天堂| 欧美日韩在线亚洲国产人|