1.1 推荐系统的定义与商业价值

本节将从不同的角度出发,为读者建立一个丰满立体的推荐系统形象,进而帮助读者理解推荐系统能做什么、不能做什么,以及推荐系统的商业价值。

1.1.1 推荐系统的基本概念与业务驱动思想

20世纪90年代,推荐系统作为一种新兴的计算机技术进入了大众的视野。传统的推荐系统基于协同过滤的思想构建,具体来说,就是通过大规模用户群体针对大规模内容集合的交互反馈数据,为这个群体中的用户个体实现个性化、定制化、自动化的内容筛选能力,解决用户面对海量信息时选择困难的问题。

在纯粹的技术视角下,推荐系统仅仅囊括“人货的最优匹配”所需要的技术、工具和系统。然而,天下没有免费的午餐,寄托于各类电子商务平台上的推荐系统,也需要为平台本身的业务提供价值。随着平台业务在追求商业利益的征程上不断自我丰富,推荐系统的边界、推荐算法工程师的职能范围,也在相应地不断拓展和细化。推荐系统的设计方式正在从简单的问题驱动向业务驱动不断进化。

接下来,我将从用户视角、技术视角、公司视角、供给侧视角4个方面,分别介绍业务驱动下的推荐系统的设计思想与问题驱动的传统方式有何异同。

1.用户视角

从用户视角来看,传统的推荐系统仅考虑为用户提供兴趣相关的内容,而业务驱动的推荐系统考虑的是在特定场景下对用户的模糊需求进行满足。这里包含了场景和模糊两个关键概念。

满足用户的诉求不是把内容塞给用户就可以了,还要考虑用户消费内容时的相关体验。场景不仅是用户提供消费内容的一个位置或场所,还要与用户产生超越物理层面的稳定连接。在业务语境下,这一概念称作场景心智。

为了满足场景心智的需要,针对某种诉求的场景设计和迭代会把需求满足时的消费体验推向极致,而推荐服务也要做出有针对性的配合。

横版播放器加弹幕的场景,更适合时长偏长且单一内容的沉浸式消费,满足用户对垂直、深度内容的消费诉求,便于社区氛围的构建与引导(如哔哩哔哩、爱奇艺)。而手机竖版播放器加无限下刷的交互方式,更适合时长较短的多品类内容的持续式消费,满足用户在碎片时间内对强感官刺激内容的即时消费诉求(如抖音、快手)。

推荐和搜索的主要区别在于用户意图的明确程度。在搜索场景下,用户会用明确的查询词限定意图范围,并对内容或货品的筛选有心理预期。而在推荐场景,用户心智更偏向于“逛”。就好比美食街上,有的人边走边吃,而有的人直奔预约好的火锅店。

有线上线下零售相关经验的读者可能已经发现,这里和零售业内的“人货场”思维模型十分相似。没错,对于推荐系统来说,“人货”之外,“场”也是不可忽视的一环。

2.技术视角

从技术视角来看,业务驱动的思想也极大地丰富了推荐系统的内涵,拓宽了边界,具体体现在两个方面。

首先是个性化的破圈。传统的推荐系统技术把问题限定在纯粹的推荐语境里,即在用户兴趣未知的情况下,进行人货匹配。实际上,个性化这一技术思想很快就被推广至搜索和广告场景。个性化其实是基于海量数据的分发效能提升工具,不仅可以应用在推荐系统中,也可以应用在搜索和广告场景中。很多个性化搜索、个性化广告投放场景,本质上都是推荐引擎。

如图1-1、图1-2所示,在不同App的搜索功能中,潜藏着各类推荐服务。在搜索前,App会给用户推荐热搜词;在搜索结果内,结果页进行个性化排序,这也是融合了推荐技术;在搜索结果中,通过相似搜索词、相似内容的推荐,帮助用户明确需求,或者弥补内容池深度的不足,在一定程度上实现用户跳出拦截。

图1-1 搜索场景中搜索前和搜索中的搜索词推荐服务

其次,各式各样的业务需求催生了推荐系统越来越多的技术领域。例如,对用户兴趣感知的即时性业务诉求,让推荐算法与流式学习结合得越来越深;大众对隐私保护的重视,使得推荐系统开始拥抱联邦学习和端智能。

图1-2 搜索后隐藏在搜索结果中的推荐技术

3.公司视角

从公司视角来看,传统推荐系统并没有把公司利益考虑在内。公司经营活动的目的就是可持续地获得越来越多的利润。我们将这个目的进一步拆解,就会发现提供推荐系统服务的公司,不仅希望推荐系统做好人货匹配的服务,还希望它可以实现风险控制、用户规模增长以及利润的最大化。

首先,对公司来讲,利润最大化是最重要的,推荐算法工程师需要让推荐系统通过完成最擅长的事情来获取更多的利润。绝大多数的业务都满足帕累托法则(二八定律),即80%的用户诉求可以被20%的内容满足。原因很简单,针对一个特定的互联网产品,用户对它的品牌认知相对稳定且明晰。

在用户心智明确的前提下,用户到访大多因其主要需求而来。通过简单的数据分析和运营策略,运营从业者就可以比较好地完成对头部用户主要需求的满足。推荐技术在头部流量上,对比人工运营(也可以理解为专家推荐)能取得的相对效率的提升,大多仅仅是锦上添花。这也说明,在前推荐时代,各大平台虽然“千人一面”,但是也可以通过对自身核心用户价值的极致挖掘实现高速增长。

就海量数据的吞吐能力、长尾分布的模式识别而言,以统计学习技术为内核的当代人工智能技术,相对于人工有绝对优势。进而,在满足长尾需求、服务长尾用户方面,相对于人工就有了绝对优势。不断拓展服务用户的边界、不断挖掘用户次要需求、重新丰富平台价值并逐步引导用户心智变迁,是当下互联网市场在由增量竞争逐步转向存量竞争的环境下,各大平台业务发展的主题。在这样的需求下,个性化推荐技术成为必不可少的利器。基于人工智能方法的推荐系统和技术,可以通过提升腰尾部匹配效率以及积分效应,来获得更多的商业利益。

其次,利益与可持续发展之间往往存在矛盾性。例如,在同样满足用户需求的前提下,把一个利润100元的商品而不是利润10元的同类商品推荐给用户,可能在短期内带来更大收益,但从长期来看,与用户追求性价比的主要意图存在矛盾。过度透支用户购买力会为平台带来负面影响,甚至造成用户流失,在竞争环境中失利。因此,推荐系统应当在业务主目标和用户体验之间做出平衡。

再次,电商平台需要规避作弊、诈骗等风险,内容平台需要规避舆论、非法内容等风险。风险控制技术,简称风控技术,其主要目的在于帮助公司从海量数据中识别存在风险的内容提供者或内容本身,往往由独立于推荐技术团队的风控团队负责。虽然团队相互独立,但二者在业务层面的配合十分紧密,为企业合法合规运营、保持用户信任保驾护航。

4.供给侧视角

从供给侧视角来看,传统的推荐系统并未把供给侧需求纳入考虑范围。推荐系统的内容不是凭空出现的,也不是一成不变的。电商平台的供给侧是千万大中小商家,内容平台的供给侧是千万内容创作者。业务驱动的推荐系统在为C端用户提供服务的同时,也成为供给侧生态循环的驱动引擎。目前绝大多数的平台型互联网产品还没有将主营业务拓展至内容生产,内容生产仍在发挥着桥梁的作用。很多时候,从业人员会狭隘地认为在产品中进行消费的C端用户才是用户,而忽略了供给侧的B端用户。

为了平台的可持续发展,B端用户的体验也至关重要。对B端用户来讲,选择平台的主要诉求是希望借助平台触达更广大的用户群体,从而实现自身商业价值。受二八定律的影响,B端生态结构基本上也呈现金字塔形态。如果这个金字塔形态是流动的,上升通道持续打开并且规则较为透明、公平、合理,那么B端用户就会收获比较好的用户体验,进而形成良性竞争。反之,如果在这个生态中,上升规则完全不可预测,努力付出和收获基本不成正比,头部流量劣币驱逐良币,那么平台也不可能可持续地发展。这就为推荐系统的公平性、可解释性提出了严格的要求。

总的来说,业务驱动思想大大拓宽了推荐系统的边界,也提出了更高的要求。它要求推荐系统不仅能够完成人货匹配的基本功能,还要能够以平台存续和盈利为出发点,从多个角度为其主营业务提供商业价值。以业务驱动的方式设计推荐系统,才更符合绝大多数企业的价值观。

1.1.2 浅谈个性化推荐带来的商业价值

对于互联网公司来说,用户是公司的核心资产。有了稳定的用户群体,才有模式创新和流量变现的可能,拉新和留存往往是企业最关心的话题。

1.助力主要商业目标增长

一般情况下,推荐系统往往在拉新上无法提供太多帮助,主要任务是从用户留存或商业目标的角度发力,辅助平台实现商业价值。大多数时候,从算法角度来看,留存是不可以直接优化的。比如电商平台的复购率和货品质量、价格、售后以及整体购物体验等因素有关,视频平台的留存则与内容质量、内容知名度、内容丰富度、观看体验甚至社区氛围有关。有很多环节其实不可能包含在推荐系统的支持范围内。

由于推荐系统的核心技术是面向可量化数据指标的算法,因此寄托于各大平台的推荐系统往往针对一些可量化的任务进行优化,比如电商平台的GMV(Gross Merchandise Volume,商品交易总额)往往和留存、复购有正相关性,视频内容平台的观看时长往往和用户留存、DAU(Daily Active User,日活跃用户数量)有正相关性。

2.重塑生态

虽然二八定律可以描述大部分流量分布问题,但这种分布并不会自然形成,或者说,良好的基尼系数是每个平台希望达到的状态,鼓励良性竞争的同时可以实现平台利益最大化。

人工运营塑造的生态一定是头重尾轻的生态,这是因为人工运营只能在有限的数据、有限的维度下满足用户有限的需求。然而,推荐系统的优势在于全量数据分析和长尾服务能力。通过个性化实现的“千人千面”可以将内容的曝光覆盖量前所未有地拓展,一定程度上削减头部内容的曝光比例,提升腰尾部内容的曝光占比,从而实现多品类多维度的精细化运营,在长尾部分实现积分效应。

3.理解用户

推荐系统不是一个静态的系统,它是一个不停与用户交互,并以数据为养分不断自我成长的系统,其成长过程中的一个重要沉淀就是用户的结构化画像。通过对用户进行实时、多维度的数据探查,能够帮助公司快速捕捉市场供给、需求的变化,从而辅助商业决策。