首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
市场/贸易
成渝经济圈5A级旅游景区网络关注度研究
第684期 作者:□文/冯 潇 范乐瑶 时间:2022/7/1 10:05:07 浏览:335次

[提要] 通过爬虫程序获取百度指数平台上20122021年成渝经济圈5A级旅游景区月搜索指数数据,分析各景区网络关注度的年度和月度趋势特征;利用Python320122019年月度数据构建SARIMA模型,并运用网格搜索法对模型进行参数寻优;利用最优模型SARIMA011)(0111220202021年月网络关注度进行预测,并将预测结果与ARIMA模型的预测结果进行对比分析。研究表明:(1)成渝经济圈各5A级旅游景区的网络关注度存在较大差异,其中成都市和乐山市的5A级旅游景区网络关注度较高;(2)成渝经济圈5A级旅游景区网络关注度时间分布具有显著的季节性和假期性特征;(3SARIMA模型比ARIMA模型预测精度更高,更能反映成渝经济圈5A级旅游景区网络关注度的趋势特征。

关键词:成渝经济圈;5A级旅游景区;百度指数;网络关注度;SARIMA模型;趋势特征

中图分类号:F59 文献标识码:A

收录日期:2022112

游客在进行旅游活动之前,通常会通过互联网对旅游景区进行搜索,而这种网络关注情况被认为是旅游目的地客流量的前兆。因此,研究旅游景区网络关注度变化趋势,对把握游客旅游意向、分析未来潜在客流量、促进旅游持续发展等具有重要意义。

基于百度指数的旅游景区网络关注度研究主要分为以下四类:第一,探究景区网络关注度的时空特征,该类研究侧重于使用季节性集中指数、地理集中指数等,或通过GIS空间分析法分析网络关注度的时空特征。如,杜梦珽等(2020)利用洪崖洞百度指数搜索数据,研究洪崖洞网络关注度时空分布及变化特征;朱豆豆等(2021)分析新疆8个热门景区网络关注度的时空差异特征,并运用回归和相关性分析法探究其影响因素。第二,利用景区网络关注度的时空特征提出相应的营销策略。如,周晓丽(2019)基于五台山日网络搜索数据构建五台山客源市场的“重要性-发展潜力”矩阵,并提出相应的营销策略。第三,探究景区网络关注度和实际客流量的相关关系。如,马莉等(2018)研究发现长三角地区40个城市的每日实际游客量与网络关注度之间存在因果关系,即网络关注度是游客量变动的前兆。第四,利用景区网络关注度对未来游客量趋势进行预测。如,康俊锋等(2020)基于上海市的百度搜索数据和旅游人数数据构建ARIMA旅游趋势预测模型。

本文以成渝经济圈5A旅游景区的月百度搜索指数为研究对象,分析20121月~2021125A级旅游景区网络关注度的时间变化特征,建立SARIMA模型对各景区网络关注度进行预测,以把握未来旅游网络关注度变化情况,为成渝经济圈5A旅游景区及旅游管理相关部门提供决策依据。

一、研究方法

(一)季节性集中指数。季节性集中指数(R)用于反映一年内旅游网络关注度的季节性变化:

Ri=

其中,xi为第i月的网络关注度。R值越大,表明年内每月网络关注度差异越大,即关注度受季节性影响较大,淡旺季较明显;R值越接近于0,表明年内每月网络关注度分布较均匀,即关注度受季节性影响较小,淡旺季不明显。

(二)ARIMA模型。ARIMA模型,即差分自回归滑动平均模型,是由BoxJenkins1970)提出的时间序列预测方法,该方法通过差分处理将时间序列转化为平稳时间序列,利用其过去值预测未来值,并将误差项累加以消除预测中的随机波动。ARIMA模型构建的基础为ARMApq)模型:

yt=c+φ1yt-1+φ2yt-2++φpyp+εt+θ1εt-1+θ2εt-2++θqεq

其中,pq分别为自回归阶数和移动平均阶数。若原序列在d次差分之后得到平稳时间序列wt,并对wt建立ARMApq)模型,即得到ARIMApdq)模型。

(三)SARIMA模型。SARIMA模型,即季节性差分自回归滑动平均模型,是在ARIMA模型的基础上进行了季节性调节,对具有季节性波动的时间序列有较高的预测精度。该模型可以表示为ARIMApdq)×(PDQS,其中,(pdq)为模型非季节性部分,与ARIMApdq)模型参数的含义相同,(PDQS为模型季节性部分,P为季节性自回归阶数,D为季节性差分阶数,Q为季节性移动平均阶数,S为季节性周期长度。

二、实证分析

(一)数据来源。百度指数是以网民海量搜索数据形成的数据分享平台,提供了2011年至今各关键词的每日搜索量数据。基于百度指数平台,本文将景区关键词检索到的移动端搜索指数和PC端搜索指数之和称作“网络关注度”,反映游客在互联网上对成渝经济圈5A级旅游景区的关注程度。将成渝经济圈中所有5A级景区的代表性关键词进行搜索,发现重庆市黔江区濯水景区没有被百度指数收录,故本文以成渝经济圈的115A级景区为研究对象,其中四川省7个、重庆市4个,如表1所示。本文通过Python爬虫程序搜索景区关键词,获取了20121月~20211211个景区每月百度移动端和PC端搜索指数数据。(表1

(二)成渝经济圈5A级旅游景区网络关注度时间分布特征

1、景区网络关注度年度分布特征。分类汇总求出115A级旅游景区的年度网络关注度,并绘制图1。从整体来看,20122017年游客对成渝经济圈内5A级旅游景区的网络关注度呈逐年上升趋势,而20182021年的关注度均较2017年有不同程度的下降,其中20202021年受新冠肺炎疫情的影响,游客出行受到一定限制,故11个景区整体关注度下降较明显。从各旅游景区网络关注度数量上看,11个景区的网络关注度存在明显差异,受网络关注最高的5A级旅游景区是成都市青城山-都江堰旅游景区,其次是乐山市乐山大佛景区和峨眉山景区。201220213个景区的网络关注度远高于其他8个景区,表明3个景区的知名度较高,游客出游意愿更强。而受网络关注最低的两个景区是邓小平故里旅游区和朱德故里景区。与其他9个景区不同,邓小平故里旅游区和朱德故里景区属于红色文化型旅游景区,而游客对两个景区网络关注度较低,表明这两个景区的红色文化影响力和知名度有待进一步的提升。(图1

2、景区网络关注度月度分布特征。图2显示了每年成渝经济圈5A级旅游景区网络关注度月度分布情况。从平均值变化趋势上看,平均值曲线表现为倒“V”型,其中78月是成渝经济圈旅游备受关注的高峰时期,说明成渝地区能够吸引更多的学生和家长,暑假期间该地区亲子游、毕业游等市场火爆。此外,4月和10月也是受关注较高的时间段,说明清明节、“五一”节和国庆节成渝地区气候较为适宜,同样是旅游、登山的热点时段。而11月~次年1月成渝经济圈5A级旅游景区关注度为全年最低,说明成渝地区冬季气温较寒冷,游客出游意愿不强。对比每年网络关注度月度变化趋势,发现20122019年的成渝经济圈5A级旅游景区网络关注度月度变化趋势近似,而受疫情因素影响,20202月和20218月的关注度走势与其他年份差异较大。计算20122021年成渝经济圈5A级旅游景区的季节性强度指数,结果见表2。表2显示,每年的季节性集中指数均大于1,表明成渝经济圈5A级旅游景区网络关注度的季节性差异显著,存在明显的淡季和旺季。(图2、表2

(三)实证分析。选取20122019年成渝经济圈5A级旅游景区的月网络关注度数据为训练集,基于Python3建立SARIMA模型,对20202021年月网络关注度进行预测,同时建立ARIMA模型进行对比分析。

1、平稳性检验。图3显示,20122019年成渝经济圈5A级旅游景区的网络关注度变化情况与趋势,从图中可识别出该序列为非平稳时间序列,且具有周期性,故需要对原始序列数据进行差分处理,使其变为平稳时间序列。根据单位根(ADF)检验结果,1阶差分后的检验统计量的值为-3.0657,小于显著性水平5%的临界值,即1阶差分后的序列是平稳的,无需进行2阶差分,因此确定非季节性差分阶数d=1。(图3、表3

2SARIMA模型与ARIMA模型构建。对1阶差分后的序列数据绘制自相关函数(ACF)与偏自相关函数(PACF)图。图4显示ACFPACF12阶、24阶位置出现尖峰,表明序列有周期为12个月的波动,故SARIMA模型中季节性周期长度S12。为更准确地确定SARIMAp1q)(PDQ12模型的其余参数,本文通过网格搜索法进行遍历寻参,选择贝叶斯信息准则BIC作为模型的评估指标,并绘制热力图5所示。图5显示,当非季节性自回归阶数p和移动平均阶数q分别取01,且季节性自回归阶数P、差分阶数D和移动平均阶数Q分别取011时,SARIMA模型的BIC有最小值485.0,此时模型最优。(图4、图5

绘制图6,对SARIMA011)(01112模型的残差序列进行诊断,可知该模型残差序列基本稳定,无趋势或季节项,且残差服从正态分布,不存在自相关,故可判定该模型残差序列为白噪声序列,说明SARIMA011)(01112模型提取序列信息较充分,拟合效果较好。同理,基于网格搜索法对ARIMAp1q)模型进行遍历寻参,如图7所示,此时最优模型为ARIMA111)。(图6、图7

3、模型预测与对比分析。运用建立的SARIMA011)(01112模型和ARIMA111)模型对20201月~202112月成渝经济圈5A级旅游景区网络关注度进行预测,并采用均方根误差(RMSE)作为模型的评估指标:

RMSE=■

其中,■i为预测值;yi为真实值。模型的拟合结果和预测结果如图8所示,可看出SARIMA011)(01112模型的拟合效果优于ARIMA111)模型,且SARIMA011)(01112模型更能够预测后疫情时代游客对成渝经济圈5A级旅游景区网络关注度的趋势变化。根据表4中的RMSE计算结果可以得知,SARIMA011)(01112模型在训练集和测试集上的误差均小于ARIMA111)模型,表明利用SARIMA011)(01112预测成渝经济圈5A级旅游景区网络关注度的准确度更高,实用性更强。(图8、表4

三、结论

本文基于20121月~202112月百度指数平台的月搜索数据,对成渝经济圈5A级旅游景区网络关注度的年度、月度变化趋势进行统计分析,利用SARIMA模型对景区网络关注度月度变化趋势进行预测,并与ARIMA模型进行对比分析。

总地来看:(一)受疫情因素影响,20202021年游客对成渝经济圈5A级旅游景区整体关注度呈下降趋势。20122021115A级旅游景区的网络关注度之间存在较大差异,游客对青城山-都江堰、峨眉山和乐山大佛关注度较高,出游意愿更强。(二)成渝经济圈5A级旅游景区网络关注度的季节性差异显著,存在旺季和淡季之分,即78月暑假期间通常是成渝经济圈地区旅游备受关注的旺季时期,而寒冷的冬季则是旅游网络关注度的淡季时期。(三)SARIMA模型比ARIMA模型更能够拟合并预测成渝经济圈5A旅游景区的趋势特征,具有较好的实用性。但该模型完全依赖于数据本身,没有考虑疫情等其他影响因素,因此研究过程具有一定的局限性,未来可引入网络关注度的影响因素,并组合其他时间序列模型对网络关注度进行预测研究。

(作者单位:电子科技大学成都学院)

 

主要参考文献:

1]马莉,刘培学,张建新,等.景区旅游流与网络关注度的区域时空分异研究[J.地理与地理信息科学,2018.3402.

2]王玉霞,王静.客流量与网络关注度的关系分析——以首都博物馆为例[J.北京联合大学学报(自然科学版),201601.

3]杜梦珽,杨晓霞,陈鹏.基于百度指数的网红景区网络关注度时空特征研究——以重庆洪崖洞为例[J.西南师范大学学报(自然科学版),2020.4506.

4]朱豆豆,李玲,李晓东,等.新疆热门景区网络关注度时空差异及影响因素[J.西北师范大学学报(自然科学版),202106.

5]周晓丽,张碧星.基于“重要性-发展潜力”矩阵的客源市场营销策略研究——以五台山省域客源市场为例[J.忻州师范学院学报,201902.

6]孙烨,张宏磊,刘培学,张捷.基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J.人文地理,2017.3203.

7]康俊锋,方雷.基于百度指数时空分布的旅游趋势预测研究[J.西南师范大学学报(自然科学版),2020.4510.

8Box G E PJenkins G M.Time Series Analysis Forecasting And ControlJ.Journal of Time Series Analysis1970.033228.

9]李晓磊,肖进丽,刘明俊.基于SARIMA模型的船舶交通流量预测研究[J.武汉理工大学学报(交通科学与工程版),2017.4102.

10]郭静利,董渤.基于SARIMA模型的国际稻米价格预测[J.价格理论与实践,201901.

11]代桂芳,段佩利.基于百度指数的山东省5A级旅游景区网络关注度研究[J.绿色科技,202117.

 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 2995272 位访客