探究快手技术、产品与业务之间的合作模
发布时间: 2023-07-11

嘉宾 | 白晓航、晁杨、谢淼

编辑 | 薛梁

伴随短视频行业的飞速发展和快手商业化的加速繁荣,2022 年快手联盟增长迅猛,作为移动开发者短视频商业生态联盟,快手联盟正在成为各行业撬动短视频商业红利的新杠杆。InfoQ 技术大会旗下《大会早班车》直播栏目邀请到了快手联盟运营负责人白晓航,产品负责人晁杨和高级算法专家谢淼博士,来从业务,产品和算法技术角度聊聊快手联盟近年来在产研合作上的探索与创新。

InfoQ:随着短视频和直播近年来已成为我们日常生活中必不可少的部分,互联网的这种新形态下,快手在广告业务上,有什么新的探索,对于联盟的业务,有什么特殊的期待吗?

白晓航: 广告联盟本质上是一个撮合平台,一端是广大的开发者(背后是各种各样的 App),另一端是广大的广告主;联盟平台居中连接两端,提供统一的投放能力和变现能力。

快手做联盟的初衷,是期望将快手在短视频和直播上积累的产品算法能力释放出来,在快手系 App 之外获得联盟流量的增量,给广告主提供更大的投放空间。

具体说来,快手联盟可以给广告主这些独特的价值:一是流量和可触达用户数量巨大,快手联盟 DAU 超过 8.5 亿,这个量级远超大多数互联网 App;二是流量类型丰富、用户群体多样,涵盖游戏、工具、阅读、生活、运动健康、视频、资讯等等各种类型 App。

晁杨: 从产品角度,简单来说联盟广告有激励视频、信息流、开屏、插屏及视频流几大类,整体来说我们要根据媒体 App 的特点及用户的特性设计不同的广告形态。

逻辑上广告也是一种信息,广告的呈现跟大家日常看到的新闻、视频没什么两样,只不过广告是为用户提供了感兴趣的商品、游戏等有别于传统内容的信息,我们在广告设计上用户体验是第一位的,希望给用户带来更有价值的信息。

在短视频和直播的赋能下,广告形态在广告呈现、用户交互上有了更大的空间,比如直播给广告带来了跟用户互动的全新方式,用户可以在快手联盟覆盖的 App 上实时观看丰富多样的直播,可以无缝衔接到快手 App 上,给用户带来全新体验的同时也给广告主提供了触达用户的新途径。短视频和直播给广告注入全新的想象空间,联盟会持续探索用户体验和新的广告形态如何更好结合。

谢淼:优化联盟广告投放,我们较其他头部广告联盟起步较晚,只有广告产品形态设计完成并打通投放链路后,我们算法才能发挥出价值,持续的优化 AB 和大盘使得广告的匹配效率更高。

可以说前期靠运营和销售获客,后期靠算法迭代拓客。从算法难度上,与在站内投放快手原生广告相对比,对我们提出了更高的要求和更多的挑战。

首先,联盟的环境更不稳定,外部 App 从流量和质量上变化程度都非常大,今天有 100w 的请求,可能明天就 10w 了。

第二点,是对用户行为理解的难度,相比主站,主站的用户粘性高,原生广告的转化率自然就高,而且随着时间的推移,我们还能积累大量丰富的用户行为数据,对用户偏好有非常强的挖掘能力。相比较而言,联盟上的流量是由众多互联网 App 所组成的异构型动态流量池,即使是快手用户,他们在这些外部 App 上的行为与对快手广告的兴趣,与站内浏览时也存在巨大差异,而且把用户吸引到快手 App 中达成转化所需的链路更长。

展开全文

第三点,优化的元素增多了,从站内的用户到广告的二元构成,变成了外部 App,用户再到广告的三元匹配,因此对算法的要求更高。所以从算法角度,我们期待能够找到针对联盟复杂环境的算法建模方式,沉淀有深度的解决方案。

InfoQ:那么为了达成联盟广告的业务目标,从业务运营角度觉得有什么挑战吗?

白晓航:介绍联盟的核心痛点,内外循环可以一起说,然后突出给出冷启问题和业务上疼的程度。比如可以拆成预算侧和流量侧冷启两个问题来讲,深度转化类型的广告在量和质上的要求,流量侧冷启问题等。

1. 流量大且杂,如何挑准适配流量;

2. 冷启:流量大、异构、变动多;

3. 直播广告时间短、要求快速起量。

InfoQ:冷启这个问题是行业内联盟的共性业务难点吗,还是快手广告的特殊业务问题?

白晓航:存在一定共性,但是快手原生广告的特殊性是短视频和直播,广告主对广告的深度目标达成有非常高的期待,但是这种新业态的广告,本身在联盟的动态性较高的媒体流量中和广告做深度匹配时就存在很大的挑战。另外,快手原生的内循环广告在联盟是 2021 年才逐渐开始做的,我们对他有更高的要求,就是起量过程不能严重影响已起量广告的预算匹配效率。

InfoQ:那针对这个冷启的业务痛点,从运营和产品角度,如何解决呢,有没有什么现有的工具和手段?

晁杨:针对冷启这个业务核心痛点,我是这么看的:

(1)需要从这个产品的设计角度看这个事情,是系统性冷启问题还是少数个例,产研系统在冷启设计上是全局的,很多时候冷启问题可能是比较小的点造成的,比如是否因为素材原因导致于流量不匹配,因此量出不去;

(2)不管是全局问题还是个例问题,我们都需要从链路角度看看在线系统各个阶段的转化情况,定向地发现潜在问题,各个击破,这个链路就是我们常说的投放漏斗,也是产研给运营同学提供的工具之一;

(3)冷启是从无到有的过程,除了系统冷启的机制外,我们也会从人群适配等角度挖掘符合行业特性的人群,帮助算法快速收敛;

(4)多数的情况下从上面几个方面可以快速定位和解决冷启问题,但在系统有新能力上线或系统性出现冷启动问题时,我们要逼着算法专家们一起定位问题,共同去挖掘能解决这个问题的解决方案,哈哈。

谢淼:是,在你们的强压下,我们其实也成长了很多;

(1)在广告系统中,我理解的 冷启问题的本质,其实是由于每次请求下模型对候选广告的预估偏差导致的有效投放量少的问题,当然模型的偏差是来自训练数据稀疏这个情况,这里的训练数据的稀疏并不是单纯指样本量少,也就是说并不意味着量大了,一定没有冷启问题。

通常而言对于广告系统来说他是一直伴随着业务成长的,比如一个新行业刚开始投放时,肯定是数据量少导致训练数据少,模型偏差较大,但是如果后面仅局限在某个人群上,或者某类广告上扩量,那么即使他的投放量每天达到亿级别,那么它仍然是稀疏的,因为其他人群或其他类广告的样本几乎没有,也会导致模型预估偏差。

为何模型的偏差会导致量起不来呢?因为广告系统中绝大多数都是 ecpm 竞价(千次曝光下的预期收益),而这里的 ecpm 计算是离不开模型预估的,当然还有广告主出价的影响,模型预估不准,可以拆解为两种情况,模型预估偏低,那么直接导致竞价能力变差,广告自然很难去拿到量,没有量,也就不可能有太多的正样本,那么模型会持续偏低;

另一种情况,模型预估值偏高,竞争力偏大,量是会有一些,但是会出现超成本,即投放了,但是没有实际转化,这种情况下,系统的调价机制就会被触发,会导致大力压价,竞争力就会回归正常甚至变成偏低,量就变小了,后面当模型重训时,就会导致量持续变小。

(2) 内循环行业的外投晚于外循环,因此在内循环开搞的时候,已有很多行业在联盟上有稳定的投放,而且量不小,所以针对内循环的业务问题的建模,天然就带了个约束,即尽可能不影响已起量行业的前提条件下,让内循环广告在联盟起量。可见,这个 带约束的冷启问题比单纯的冷启还要难。

要解决这个带约束的冷启问题,我们首先需要一类算法能够帮助模型破圈,即防止持续偏低或偏高的情况,MAB 就是这类算法。直接用 MAB 来解决实际业务问题,必不可少地需要将实际业务问题建模为算法可解的形态,如果建模存在较大偏差,则再优秀的 MAB 算法也很难取得收益。

这种面向实际业务问题,构建算法策略的建模,通常在实际落地时,需要的可能不止一种建模形态,而是一个问题建模的组合,而且他们之间是有关联的。

我们围绕着内循环冷启的这个事来分析下,首先当链路打通后,系统其实是个双侧冷启状态,对于媒体侧而言,联盟之前很少投放过具有快手特色的短视频和直播类型广告,相似行业很少,而从广告侧看,所有的候选广告也没有投放过类似的联盟媒体流量,因此它是双侧冷启问题。

当我们针对这个问题进行合理地建模后,量起来了一些,这时,我们看到了一些媒体位的量从 0 到 1 进行突破了,随之我们希望在这些媒体上的量能进一步扩大,那这个时候,冷启问题就从双侧冷启问题转化为了单侧冷启问题,因为从媒体上看已经“热”了,这时他的核心问题就变成了帮助某一给定的媒体位,来优化候选广告的位序,使得业务指标最大化,例如预期花费最大化,于是算法的建模形态就变成了单侧冷启的优化问题。

然后我们来想一下量进一步变大,会如何呢?我们期待模型越来越好,因为样本量增大了不少,慢慢地能够学到背后的规律,逐渐演化为成熟状态,模型的预估值越来越准,且让人满意。这样不就慢慢形成了一套整体解决方案了嘛,在我们的实际优化过程中也看到了这些阶段所用的策略,相互继承和演化的关系和数据。

也泼个冷水,在联盟中,其实我们期待模型绝对的准确,是非常不切实际的,即使当有些行业投放量大了,也不可避免的

微信