第一云南网

大数据、个性化?这一次,携程CTO甘泉跟你好好聊聊

发表于:2025-01-09 作者:第一云南网编辑
编辑最后更新 2025年01月09日,在消费升级的当下,时间是新的战场,也是新的货币。在这个处境里,商业玩家们有两个获得用户的思路,一个是让用户上瘾,拖住他的时间,一个是提供更为个性化的服务,优化用户的时间。旅游并不是一个高频的事情,所以

  在消费升级的当下,时间是新的战场,也是新的货币。在这个处境里,商业玩家们有两个获得用户的思路,一个是让用户上瘾,拖住他的时间,一个是提供更为个性化的服务,优化用户的时间。旅游并不是一个高频的事情,所以很显然,携程以后者为目标。

  早在2015年,时任携程高级技术副总裁、首席架构师的叶亚明曾在环球旅讯开放日活动中表示,通过跨屏数据处理和实时数据API的使用,结合一些数据模型训练平台,携程可以预测用户行为,于用户出行前,在网页和EDM上做出个性化推荐,提高打开率和转化率。

  经过两年的发展,携程的个性化服务已经远不止于行前推荐、灵感激发,用户对于携程个性化的发展应该也有了更直观的感受。例如用户在携程进行任意目的地的搜索行为,携程马上会在各个终端页面,围绕该目的地推送相应广告和产品;用户在选择酒店却并未完成预订时,携程马上会通过站内提示或站外短信等方式,将该酒店周边同类型酒店组合推送给用户等等。

  "我们优先展示的,就是用户感兴趣的。"携程CTO甘泉认为,携程个性化推荐为用户带来最直观的感受应该是智能和便捷。即用户用更少的搜索、点击等操作流程和时间,即可找到自身需要的产品,预订流程更加直接。

携程旅行网首席技术官(CTO)甘泉

  那么,透过那些神乎其神的大数据概念,携程在这所谓智能和便捷的个性化推荐背后,具体做了哪些努力?

  一个亿的小目标 个性化推荐来完成

  甘泉介绍称,2015年至今,携程一边完善自身的大数据平台,一边在不断扩展用户场景,验证和落地不断丰富的个性化推荐模型。

  在完善大数据平台方面,携程内部整合了内部几乎所有业务线的数据,同时也融合了许多站外第三方的数据,不断构建和扩充携程的旅游知识库,目前也已形成了一个数据较为丰富的旅游数据中心。

  在算法机制上,携程两年来不断扩大深度学习算法的选择和使用,在测试中根据用户和数据效果来进行选择和迭代更新。在应用场景上,携程对接了60多个业务线和相关产品,同时也在外部旅游类广告投放渠道中有所应用。

  甘泉表示,携程也不断通过数据中心架构的演进,来实现和完善OTA全业务个性化推荐引擎。这让携程可以实现不同业务线跨领域交叉的个性化推荐。举例来说,用户在机票频道进行搜索或预订等行为后,携程会围绕这个行为,结合多种维度的数据,进行配套酒店、用车、游玩、购物等全业务线产品的相关推荐。

  就展示方式来说,其实携程APP中大部分频道,包括各业务线首屏推荐栏位、搜索功能、特价机票等低价聚合频道等等,都在应用携程的个性化推荐平台。在这些业务场景的使用中,携程不断通过AB测试的方式,寻找不同用户与产品推荐之间更为匹配的模式,探寻更为用户所接受的个性化推荐的算法机制。

  "通过线上AB测试的结果分析,无论是应用了个性化推荐的栏目还是携程全站的用户黏性,都有了显著的提升。"在个性化推荐带来的营收提升上,甘泉介绍了一个具体案例。

  携程有一个不到20人的基础数据团队,负责数据采集、清洗、存储、建模等基础流程。在此之上,该团队还组建了携程个性化的推荐平台。其实携程各个业务线自身原有的一些排序推荐算法,经过2016年接入个性化推荐平台后,各项测试结果均验证了该个性化推荐平台的优势性,最终携程60多个业务场景都与之对接。

  甘泉介绍称,经携程业务数据的确认,该团队通过个性化推荐平台,在2016年完成了1.2亿元的营收增量(佣金收入),投资回报率(ROI)非常高,也是携程内部实现技术驱动业务增长的典范团队。

  再举个例子,携程某个细分业务场景,最初的推荐排序架构十分粗放,也完全依附于其他大流量业务的引流。后期对接了个性化推荐平台后,只付出了1~2个工程师的人力,2016年自身业务的营收增长了6%,这也说明了个性化推荐应用到业务场景后,直接带来的显著效果。

  "总得来说,旅游OTA平台的个性化推荐一直是个难点。"甘泉认为,尤其像携程这种需要跨多业务推荐技术的OTA来说,难点会更加多。而且行业内目前也没有太多的成功经验可以让携程有所借鉴,那么携程只能自己不断去尝试和摸索。

  个性化推荐闭环 讲究一个"快"字

  大数据是个性化推荐的基础,那么携程如何打造数据收集到个性化推荐应用的闭环?

  "携程获取用户数据的渠道仍然是携程的各个终端。"甘泉表示,手机APP、H5、web站、微信小程序等等,携程在这些主要的用户流量来源上,都会主动获收集户搜索、浏览、订单、客服售后等维度的数据。同样的,用户在任意终端进行的操作行为,都会被同步跨屏聚合,针对该用户的个性化推荐也会在各个终端中实时进行。

  在数据收集方面,按照传统方式,携程需要对数据节点进行前期假设,随后在不同的来源渠道"埋点"来收集预设的数据维度。如果出现了新型的用户需求,或者新增数据维度,那么携程需要重新"埋点",发布新版客户端,升级渠道版本,引导用户更新升级。

  "这个过程非常漫长。"甘泉表示,携程目前已采用自主研发的,不需要提前"埋点"的无嵌入式用户行为跟踪系统(UBT)。用户在携程中所有行为数据都会实时进入该系统,后续携程再根据个性化推荐需要,从中挑选出对应数据即可,这也让携程的数据采集变得十分高效。

  其实影响用户旅游出行决策的核心因素会非常多,除携程自身能获取的站内用户数据外,还有例如目的地的天气、水温、风力等等因素。携程就需要和第三方机构进行合作来获取相应的数据,来辅助和优化个性化推荐的结果。

  那么,数据来源有了,后续是思考如何通过有效的系统架构,做好数据的个性化应用。当然,这其中的难点除了内部多业务线数据的整合,还要解决站外异构数据的归一化问题。

  也就是说,通过第三方获取的外部数据,自身结构可能千差万别,携程需要对这些异构数据进行归一化的数据处理,使其成为适合携程系统的标准化结构数据。

  值得一提的是,站内站外的数据集合,不仅会应用于用户个人的个性化推荐,还会实时影响其他用户。也就是说一个用户的行为数据能实时反映到算法系统,对后续的其他用户行为产生推荐的结果。对此,目前携程的个性化推荐平台能够做到秒级的数据闭环,整个数据流转在非常短的时间内即可完成。

  举例来说,在春季时,用户或许会搜索踏青、赏花等主题景点。一旦用户在携程中搜索了相关主题的关键词,这些用户行为的数据将直接进入个性化推荐平台。对于携程系统来说,便会观察到某个内容或某个景点得到了爆发式的用户需求增长。

  当这个用户需求增长到一定量级后,携程的个性化推荐系统便会根据后续其他用户的历史行为、所处地理位置、目的地环境等数据,判断筛选出可能同样对这类主题内容感兴趣的用户。通过主动展示、搜索关键词的推荐等环节,将此前获得大量用户关注的热门内容,主动推送给后续用户。

  "携程通过这样的方式,告诉用户这或许就是你想要的。"甘泉表示,这样的数据流转每时每刻都在实时高速地进行着。他也总结称,数据收集、清洗、存储、建模计算、最终应用于用户端个性化推荐,便形成了支持携程个性化推荐和营销的数据流程闭环。

  单一到完善 个性化推荐比的是数据

  "旅游其实跟传统电商差异性非常大。"甘泉表示,用户在其他方面,会寻求相似性,例如对同一个品牌,同一款生活产品产生依赖性。但在旅游方面,用户寻求的是差异性,大家很少会重复选择某个目的地,更多的是希望能探索新的地方,新的玩法和体验。

  那么在这种差异性下,出行的灵感个性化推荐就会变得非常重要。所谓灵感,就是说携程个性化推荐给用户的目的地、综合旅游解决方案,是否真正符合用户需求,能否促使用户产生交易,这都是十分复杂的综合性问题。

  甘泉介绍称,携程在两年前便开始了简单场景的尝试。例如根据用户数据,对热门酒店提前包房,热门航线提前包机,以及预测引导用户到某个热门目的地等等应用场景,携程的团队其实都已经有所覆盖。更多深层的精细化场景才是未来值得挖掘的空间。

  在甘泉看来,用户出行时间长短、个人偏好、对目的地的认知、旅行成本、目的地自身旅游资源、天气状况、治安状况等等纷繁复杂的因素,都可能成为影响用户决策的关键性因素。

  他介绍称,以携程的数据来看,对于没有明确目的地的用户来说,国内旅游平均决策周期达到20天,出境游方面即便是东南亚等短途游,也需要超过40天的决策周期。

  而携程希望通过个性化推荐的尝试,尽可能缩短用户决策周期,提升用户体验。于是便推出了"发现"频道,目前正在进行AB测试。

  这是一个个性化智能目的地的推荐系统,它会抽取用户兴趣维度的关键信息点(POI),结合用户自身的过往数据以及相同层级其他用户的历史数据,再根据价格、季节、天气、购物、美食、家庭、情侣等等各式各样的数据,来为用户个性化匹配全球目的地。

  与此同时,发现频道还会相应推荐综合的出行方案。例如酒店类型、区位,机票直飞还是转机,每个目的地需要停留的时间,热门美食、购物点等等,都会根据不同的用户,做相应的个性化整合推荐。

  甘泉也解释称,发现频道其实与传统的旅行攻略有很大的区别。具体来看,用户会耗费时间阅读大量的旅行攻略,决策过程会变得非常复杂和漫长。例如一篇攻略称A目的地不安全,那么用户就会产生非常大的顾虑,查阅更多攻略和点评来验证这一信息点的真实性。

  这会让用户出行决策的过程变得十分痛苦,而发现频道要做的就是免去这样的痛苦,既贴合用户需求推荐产品,又让其决策过程变得更为轻量便捷。

  "这是携程会在2017年着重尝试的一个创新频道。"甘泉表示,目前开放显示了10%的用户群体,以此来测试该频道的运营效果。从现在的AB测试效果来看,发现频道整合各项用户决策因素后,确实比单纯的简单个性化推荐效果要好。

  他也透露称,未来发现频道或许会结合用户点评等更多的数据维度,甚至应用到攻略社区的个性化推荐中。

  最后说说技术与业务部门的团队协作

  无论是数据多么丰富,应用场景多么广阔,个性化推荐最终还是要回到技术部门和业务部门的共同协作上。甘泉总结称,携程对此的处理机制关键在于激发情怀和业务指标共享。

  在携程中,技术团队和业务团队往往会共享业务指标,以目标一致性来推动共同协作的效果。甘泉也表示,由于在2016年中,携程个性化推荐在各个业务线中产生的业务增量验证了其存在价值,业务团队也逐渐积极接受与数据团队的协作。

  另一方面则是激发工程师的情怀。甘泉表示,其实每个工程师都希望自己的劳动成果能够在业务场景中应用,通过用户和市场的肯定来验证其正确性。携程也会利用相应的机制来激发工程师在这方面的成就感。

  不过,双方的协作仍然会存在有争议的地方,携程在2016年底开始通过委员会的机制来逐步解决。具体来说,携程成立了大数据委员会,协作中存在的争议均可通过委员会来讨论和协商,观点一致后便可投入执行。

  甘泉总结称,携程对于大数据、AI以及个性化推荐,有着很长远的布局。但无论数据还是运营层面,只有聚焦具体问题和数字指标,依赖于快速迭代和微调才能进步。具体来说,就是通过具体问题的拆解,通过修正、微调和验证,一个一个攻克解决,才有可能实现整体的长远目标。

  后记:

  甘泉认为,对于个性化推荐而言,大数据的积累,适用于不同场景的系统架构和算法的能力,有落地应用的业务场景,来验证个性化推荐的结果是否被用户所接受,这三个关键要素缺一不可。

  而携程在这三个关键要素中,携程都有着自己的独特优势。例如用户流量、数据丰富度、庞大的业务线充当应用场景。其实更关键的在于携程能否在系统架构和算法层面提高效率,获得更好的个性化推荐效果。

  "携程愿意投入更多的精力来解决个性化推荐中各个环节的痛点。"甘泉坦言,在线旅游跑马圈地的时代已经过去了,接下来比拼的是精细化运营,精准匹配用户需求,以个性化推荐来提升用户体验,如何以技术、数据驱动运营增量。

  有业内人士评价说,携程正从传统的依靠人力、经验驱动业务,转向依靠大数据、个性化推荐来优化业务。他介绍称,携程对于个性化推荐的探索,应该是目前做得最好的旅游企业之一,近两年来携程一直以较为开放的态度,努力吸收外部的技术经验,可见未来携程确实会更加注重技术的发展。

  其实总得来说,这让我想到罗振宇所提及过的"母爱算法"和"父爱算法"这两个消费升级概念。

  携程的个性化推荐系统更像是"母爱算法",就是用户需要什么,你就推荐什么,甚至用户还没说出来你就猜到了。相比之下,"父爱算法"则更像携程的攻略社区,就是给用户他还不知道的好东西。这样看来,携程的方向十分符合用户消费升级的趋势。

  其实不止携程,个性化推荐系统在各个业务场景中的应用,各个玩家所运用的算法越来越像,真正最重要的战场其实已转换到大数据上了。谁的数据更多,更精准,谁的"技术怪兽"就会被喂养得更强。

  虽然确实如甘泉所说,在线旅游跑马圈地的时代已经过去,但携程在大数据、人工智能以及个性化推荐方面,别忘了还有新美大,还有背靠整个阿里生态系的飞猪,以及许许多多以携程为目标的未知对手。

  该内容由环球旅讯原创,版权归环球旅讯所有。以商业目的使用该内容,请联系环球旅讯获得授权许可;非商业目的使用,请注明出处。

0