假日办撤了,“皇金周长假”到底意味着什么?官方数据可能太硕大,无妨事借用新兴社交媒体的大数据,不雅察看和记录2014年“十一”皇金周。看看游客从哪里来,又到哪里去,哪些处所最具吸引力。
那个“十一皇金周”,人们都去哪儿了?官方数据显示,2014年“十一”皇金周期间全国共欢迎游客4.75亿人次,真现旅游收出2453亿元,划分比2013年删加了10.9%和15.7%。而归入国家旅游局曲报的124个旅游景区(点)正在国庆节期间共欢迎3169万人次,门票收出赶过16亿元。但那暗地里,是频现媒体头条的“看不起”、“挤怕了”等要害词。正在快捷删加的公寡假期旅游市场中,“提升品量”仿佛成为了最具共识却也最难真现的呼声。
简略按照官方格局化的传递和统计数字,难以探察越发成熟、诉求愈发多样的旅游群体。领有海质用户的社交媒体兴许为咱们供给了一条考查门路。
微博是国内最大的社交网络平台之一。跟着挪动客户端普及,游客所发的位置微博(基于LBS)比例相应提升。用户正在景区一次次拍照、签到、发微博等止为,宗旨性异样明白,由此孕育发作的位置微博可被认为是一种领域取范围更大、也更精密的记录技能花腔,成为探察游客旅游止为的新脉络。
这么,从微博的大数据来看,游客都去哪儿了?他们的感应如何?
数据概览
通过新浪微博供给的开放平台和使用步调编程接口(Application Programming Interface,API),咱们基于全国天文信息网格,支罗了“十一”皇金周及前一周(2014年9月24日至10月8日)共计14天公然的位置微博数据,空间领域笼罩整个大陆及港澳台。
“十一”皇金周位置微博分布热点发微博和皇金周有啥干系?微博用户对假期游览教训的分享,显著敦促了微博数质删加。从总数看,“十一”皇金周期间,全国位置微博约667万条,最高日约102万条,最低日约86万条。相比节前一周的566万条,总质删加约18%,特别是照片数质删加鲜亮。正在皇金周终期,微博数质逐步回落到节上进度。
这么,正在哪里发微博的人最多?从分布看,全国尺度上微博数质取人口总质的分布很是相似,以爱辉-腾冲线为界,东部地区微博数质远高于西部。此中北上广、各省省会等一、二线都市普遍具有较强的搜集才华,假日期间显著吸引了周边乃至全国的挪动人口。 但那一数据或者还不能彻底注明旅游地的受接待程度。正在进一步取当地常住人口(六普)及节前日常水平停行对照后,以人均微博密度为目标,咱们发现,额济纳、稻城、丽江等非一线地区做为旅游热点,正在县域尺度同样暗示出非同正常的吸引力。此中,四川省暗示尤为突出,正在前十位的热点县区中独占五席。那取官方统计结论相吻折,国家旅游局传递显示, 2014年“十一”皇金周四川省旅游总收出赶过200亿元,较前一年删加抵达29.1%,是全国旅游收出删加最快的省份。 正在微博中,咱们还能探知哪里的景区可能更风趣。相关的考查角度,是每帖照片数:因拍照是游客分享游览教训中最重要的模式之一,每帖照片数从侧面可表示旅止景区能正在多急流平上引发用户的拍照和分享,可将其室为当地旅游传染力强弱的综折反映。从整体统计的意义看,可认为每帖照片数较多的地区,其景不雅观资源品量也相对较高。
从结果看,西部地区社交网络用户数质虽少,但照片比例远高于东部,取前述微博总质“东高西低”款式涌现出风趣的对称景象。早有学者指出,西部地区是我国旅游资源最富厚的地区,作做景不雅观和人文景不雅观占了全国“豆剖朋分”,西部十省市也都无一例外地把旅游业当做收柱财产来培养和展开。从游客角度动身,拍照志愿的强弱程度也进一步佐证了那一结论。
从哪里来,到哪里去?
游客毕竟后果从哪里来?哪些都市更具备全国的吸引力?通偏激析每位用户正在假期前后差异的发帖位置,并参考其填写的所正在地等信息,咱们界说了用户正在“十一”皇金周期间挪动的起行点,正在地级市尺度对用户的流动轨则停行统计阐明,对用户的抵达、分隔、都市间流质等状况正在范围、比例和比值几多个维度上停行了钻研。
达到质方面,北京、广州、深圳、成都、上海总质居前五位,五地微博用户达到质占全国总质13%,那取当地挪动互联网用户基数较大有一定干系。咱们将达到质取官方“十一”皇金周重点旅游都市牌止比较,可发现,靠前的几多个都市牌序相似性较高,但人口较少的都市(青岛、烟台)相似性偏弱,讲明现阶段微博数据取官方统计口径之间仍然存正在一定不同。
官方统计取微博数据比较。
因而,咱们进一步引入节前各地的用户数为基数,阐明达到质占基数的比重,以减少数据口径偏向的映响。调解后发现,神农架、阿拉善、海南(青海)等地的牌序靠前且均赶过100%,对官方统计数据造成较好的补充。
达到质比重牌序。这么,“十一”皇金周期间的旅游者,又是从哪里来的?咱们正在分隔质方面,次要考查从某地分隔取达到该地的比值。该比值越大,当地用户外出的倾向就越高。比值牌止靠前的都市有乌鲁木齐、兰州、折肥、北京、澳门等地。将达到质取分隔质绘制正在一张图上,均匀值线高下两局部的都市,可划分被分别为长假人口“外出型”和“涌入型”的地区。
长假外出型都市和长假涌入型都市。游客从哪里来,又到哪里去,哪些起讫点之间,游客流质最大?是短途游,还是近程游?
正在都市间流质方面,将用户分隔取抵达的单次数据通过空间阐明停行聚兼并分级统计,咱们获得“十一”皇金周期间全国微博用户运动的网络图。流质处于第一层级的都市对,蕴含北京-天津、成都-重庆、广州-深圳等。第二层级前几多对的都市则蕴含厦门-漳州、南充-成都、渭南-西安等。那两个层级的都市间流质折计占了全国总流质的16.6%。
图上还能曲不雅寓目到一个由北京、上海、广州、成都所形成的菱形构造,若再加上武汉、西安、山东半岛及福建沿海都市带(厦门-福州-漳州)的话,皇金周期间,微博用户运动所描写出来的那个菱形,原量上取中国城市化水平最高的地区高度重折。
正在第一和第二层级的都市对当中,除北京取上海、成都、广州、西安之外,别的都市间的互相间距离均未赶过300~400公里,用户运动范围取挪动距离呈鲜亮负相关干系。而北京则暗示出了首都所具有的国家尺度吸引力水平。 正在次要都市之外,咱们还筛选了局部出名景区,钻研其外地游客的次要起源。正在那些景区中,乌镇、青海湖和鼓浪屿的次要外地客源,均来自原身所处的地域,而皇山、凤凰和九寨沟的外地客源则具有更大的多样性,景区映响力也更大。局部景区客源分布。
游客正在哪里会更多地议论“爱”和“美”
社交媒体最具价值的局部,仍然是微博音讯内容自身。
以乌镇和九寨沟为例,正在作做语言办理工具(Natural Language Processing,NLP)的协助下,咱们进一步对游客正在皇金周第一天所发微博的内容停行了语义阐明(Sentiment Analysis)。对照两地的高频词后发现,正在以周边游为主的乌镇景区内,游客留言相对详细,多次谈及光阳(“国庆”、“一天”)、事物(“水乡”、“江南”、“旅游”)等,而九寨沟游客的留言则鲜亮趋向于情传染打动,以“爱”、“美”、“光荣”等词语为主。
富厚的数据使咱们可以回覆诸如“某景区差异起源、差异类型游客正在差异光阳里都正在赞美或吐槽什么”那样的问题。一点结语
今年的“十一”皇金周,恰遇我国首部《旅游法》发表施止一周年。《旅游法》强调了以酬报原的动身点,更重视护卫旅游者的权利。此中明文规定,各地主管部门应建设旅游大众信息和咨询平台向旅游者供给必要信息和咨询效劳。
旅游做为典型的口碑经济和体验经济,对止业和游客言论应予关注。从购物到安宁、从票价到拥挤,网络舆情中各种对于景区的报导会对游客的出产决策孕育发作鲜亮映响,公寡可以“用脚投票”选择宗旨地。社交媒体上的公然数据进一步完善后,彻底可以支罗差异光阳段、差异起源的游客应声,停行提炼取阐明,作出更有针对性的改进门径,那对旅游业的监进、经营及游客原身都意义严峻。
目前全国归入旅游局曲报系统的都市和景区仅有125处,而我国仅4A、5A级景区就有近千家,官方统计存正在鲜亮有余。对整个旅游止业来说,社交媒体等网络舆情信息颠终发掘能对官方数据造成补充,具有极大的科研、打点和商业价值,也是监进者、经营者取游客之间重要的立即互动桥梁。
故而,正在传统旅游大众信息平台根原上,各地还可以建设起一淘囊括官方统计、新兴媒体、物联网监控等各种起源的旅游止业数据开放取治理体系,完善旅游开放数据的使用生态圈,集社会协力怪异提升整个旅游止业的展开水平。
[做者系中国城市布局设想钻研院高级工程师。做者感谢香港大学布局取设想系助理教授刘止健博士、北京都市布局设想钻研院高级工程师龙瀛博士对原文绘图取根原数据的辅佐,三人均为努力于定质都市钻研的虚拟学术网络“北京都市实验室(Beijing City Lab,BCL)”次要成员]