广告效果
日期:2023-11-12
分享:
作者:[美]杰勒德·J.特勒斯(Gerard J.Tellis)
杰勒德·J.特勒斯是南加州大学马歇尔商学院的市场营销和管理学教授、美国企业 Neely 主席、全球创新中心主任,密歇根大学博士。特勒斯博士是创新、新产品增长、新兴市场、广告和全球市场进入方面的专家,他的《有效广告》一书整合了50多年来对广告的研究。
特勒斯博士是鹿特丹伊拉斯姆斯大学市场营销研究的杰出教授,剑桥大学贾奇商学院的研究教授,英国剑桥大学西德尼苏塞克斯学院研究员。他是《营销科学》和《营销研究》的副主编。他曾担任强生公司销售发展经理。
前言
广告可以说与销售和营销一样历史悠久。一直追溯到个人或组织想方设法向他人出售服务或商品的年代,他们不止采用一种广告形式以告知买家他们所出售的商品。在美国成功地从英国独立之后,广告得以快速地发展。伴随美国的独立,在所有商品和服务上脱离英国的羁绊,美国的商业活动得到蓬勃壮大。生产者需要广告帮助他们告知买方他们提供的商品和服务。
内战之后,美国政局稳定下来,并向西方市场开放,广告出现了第二次高速发展。在美国的大规模市场化形势下,大规模化生产迅速发生,这一现象在西欧市场上前所未有。在美国,最先实现大规模化生产的商品之一即为宝洁肥皂。1875年,宝洁成功制造出与当时的进口品牌Castile一样纯净的肥皂,宝洁期望通过广告告诉大众这一事实,以提升宝洁肥皂在快速扩张市场中的需求量。宝洁给肥皂命名为“Ivory”(意为“象牙”)而且以“99.44%的纯洁”为主题开启了广告运动。这一运动或许是美国甚至可能是全世界现代广告诞生的标志。自此,广告业逐渐发展壮大,在美国其规模超过 3000亿美金,全球约为 1.3 万亿美金。
自从现代广告诞生,研究者们就在探讨其效果问题。研究者们想要告诉广告商,他们应该在广告上投入多少资金,在什么样的媒体上发布广告,采用什么样的内容,在什么样的时间段播放广告。这些广告研究的基础性问题一直延续至今。这些问题产生了大量的学术研究,学者们将研究成果发表在广告学、消费者行为学、商业研究、经济学、营销学、管理学和心理学期刊上。正因如此,才大量积累了关于广告各方面的知识。因此,整理这些研究并提炼出我们学习到了什么才会如此让人兴奋不已。但将这项工作浓缩到一个章节中相当的艰巨。因此,我仅将研究聚焦在如下三个方面:(1)广告效果评估;(2)销售业绩或市场份额;(3)真实市场评估。多数而非所有研究局限于一般概念分类的“营销科学”,“消费者行为”或是“实验研究”。这单纯是因为营销科学的研究倾向于探索真实市场,以更好地描述和预测真实市场现象,并能够更好地控制优化广告费用。消费者行为研究倾向于严谨的实验研究,以得出精确的理论来解释广告为什么以及如何发挥作用。
由于学者们使用了复杂的经济学和统计学方法评估广告效果,所以真实市场中广告效果的知识在最近 50年间得到迅速发展。早在20世纪 60 年代及之后的二十几年间,有关广告的研究主要发表在经济学期刊中。20世纪 60年代起,出现了不同的研究路径。关于广告经济效果的研究作为一种很有竞争力的研究领域发表在经济学期刊中。个体如何获取并在头脑中处理广告信息的研究主要出现在广告学和消费者行为学期刊中。现实市场中广告效果的研究则多发表在营销学期刊后面这类研究将是本章的焦点。
在市场行为研究中对广告强度的评估检验使得建模方法得到验证。品牌的广告费用、毛评点(GRP)、广告频次或广告的市场曝光度,这些都可以用来测量广告强度。品牌的单位销售额、收益、选择行为或市场份额(以销售额为单位或以收益为单位),这些可用来测量市场行为。分析方法有计量模型和田野实验。因为计量模型主要采用的是真实市场数据,该数据特点是不容易控制,因此这种方法在确定相关性时很有效,但在证实因果关系上会比较弱。为了强化广告如何影响销售额的估计,这些研究采用了更加复杂的计量模型。因为田野实验控制了某些市场条件以及广告时间,所以在验证因果关系时很有效,但缺乏真实性。这种方法也会通过简单分析描述研究结果。
无论是实验研究方法还是计量研究方法,其自身都不具备绝对的优势。但市场实验研究采用了很棒的混合体模式,如果设计合理,它可以集计量模型和实验研究的优势于一体,同时不会受这两种方法局限性影响。一个混合研究同时具备判断广告对心理过程影响(有助于复制设计)和对销售额影响(有助于预算)的能力。本章总结回顾了学术研究中使用了计量模型和市场实验的研究发现,这些研究发现均在真实市场中得到应用。可将其划分为五个研究分支:(1)广告弹性模型;(2)广告延滞和动态性模型;(3)广告频率模型;(4)广告内容模型;(5)广告效果田野实验。这五类研究分支的共同之处是:
•将广告设置为自变量
•销售额或市场份额为因变量
•聚焦在广告的效果
•采用真实市场数据
每个分支的不同之处是:
•现阶段,广告效果的测量主要采用费用(分支 1)
•广告效果的测量看的是一段时间内的持续效果或动态性(分支 2)
•广告效果的测量采用的是曝光率或频率(分支 3)
•广告内容的效果(分支4)
•在田野实验中测量广告效果(分支 5)
接下来的五个小节将讨论这些研究分支。
分支1:广告弹性模型
这一领城的研究主要聚焦在相同时间区间内对广告效果的估计。这类研究主要采用如总费用或总GRP这样的总指标进行测量,使用销售额或货币意义的利润或市场份额为测量单位,其中广告弹性是测量这一效应最为普遍和有意义的指标。
广告弹性是指广告的每一百分点的变化带来的销售额(或市场份额)变化的百分比。因为分子和分母用百分数表示,所以弹性的单位是任意的(例如自变量可以是销售量或广告为单位)。从技术层面看,更恰当的名字应该是销售量对广告的弹性,但研究人员更愿意简化为广告弹性。可以通过分析销售额或市场份额的差异性估计广告弹性的原因是在一个时间框内,不同时间段的广告预算存在差异。
广告弹性的研究决定了广告反应函数的形态和强度。基本上,研究人员用特定的数学函数表达形态,用弹性表达强度。为达成这一效果,研究人员采用广告对错售额或市场份额影响的计量模型。本小节涵盖了这一研究领城的重要研究成果及相关结论。
重要硏究回顾
Christian Palda(1964)是广告效果研究的先驱者,其研究基于1963年的获奖论文。Palda描述了计量经济学的哲学性和理论性,并指出如何应用广告影响销售额。他采用广告弹性评估了广告对销售额的影响,另外他还强调学者不仅要考虑当下效果,也要考虑之后时间段发生的动态或延滞效果。他使用了真实市场历史数据建立了Logic模型,这些数据来自Lydia Pinkham,数据包括了从1908—1935年间企业的蔬菜广告和销售数据,在法院要求之下,这些数据被公诸于世。之后他联系了公司并获取了1936—1960年的额外数据。
由于数据集合的问题,Palda对广告弹性的真实评价还差得较多,稍后我们会在本章第3小节中讨论。Palda贡献了4个经典原理,他所提出的原理一直延续至今,包括使用计量经济模型、专注于模型中广告系数、聚合动态效应和估算真实市场数据。随后的学者从几个不同方向进行了分析,包括测量广告反应函数变形、弹性测量的其他方法、细化动态性估计、不同层面(包括不同商品品类、品牌、生命周期各阶段、时间轴和国家)的数据集。
在追求这些变化的过程中,可能贡献最大的是 Jean Jacques Lambin(1976)。他的研究独特之处是他寻求解决问题的范围。他的研究中所采用的数据涵盖了产品生命周期的4个阶段、16个产品品类、107个品牌、8个西欧国家(尽管大部分数据来自比利时)。除去广告,他还使用了至少2个营销变量、3种估计方法、至少2种广告延滞的详细过程。在如此丰富的数据背景下,他获取了 176个弹性估计值。Lambin从结果中提炼出 24个发现或初步结论,再度审视这些结论会发现仍有20个结果直至今日也依旧成立。
在Lambin之后,学者们通过使用更为复杂的模型和估计方法继续探索广告弹性估计更为精确的方法。如此丰富的估计结果很自然地让一些学者试图解決广告弹性的普遍性问题,其中最复杂深奥的方法即为元分析。元分析是一种极为科学的方法,该方法将原始研究中提取出的广告弹性作为因变量,之后将这些原始研究的变量放在一起分析。相反,传统的文献回顾则是简单地描述每个原始研究,并对研究结论进行总结。
小结
关于广告对销售的研究至少有两篇主要文献综述和两篇主要元分析文献。因为两篇元分析文献从视角到广度已具备足够的综合性,所以出于这一原因仅回顾这两篇文章。
第一篇广告弹性的元分析论文是Assmus,Farley和Lehmann(1984)发表的。他们对128个计量经济学模型进行了元分析,这些模型来自分析广告对销售额或市场份额影响的初步研究。主要研究结论如下(Tellis,2004):
•广告弹性的总平均值是 0.2;
•广告延滞的总平均值是 0.5;
•考虑了延滞系数(滞后因变量)的模型中比没有延滞系数的模型中的短期弹性更低;
•带有外生变量的模型比没有外生变量的短期弹性更小;
•线性加法模型中的弹性比乘积模型的更大;
•包括了橫截面观测值另外加上时间序列观測值的数据集,会产生较高的弹性;
•食品类的弹性值比其他类别产品的弹性值要高出0.1;
•相比于美国,欧洲的弹性值显著地更高;
•不同产品、不同品牌、不同估计方法所产生的因变量不同(销售额或市场份),并不会造成弹性的差异
最近,由Sethuraman,Tellis和Briesch(2010)发表的一个新元分析文章,尝试对Assmus,Farley和Lehmann(1984)的研究升级,试图确认在广告弹性研究发现中,在最近的20年间发生了哪些变化,哪些研究发现保持了一致性而且是真正稳定的。Sethuraman,Tellis和Briesch(2010)从发表在 1960—2008年间的56个研究中找到751个短期和402个长期广告弹性估计,该研究发现几个新的广告实证结果:
•短期广告弹性平均值是0.1,也是此前元分析均值0.2的一半(Assmus,Farley and Lehmann,1984);
•广告弹性随时间而下降;
•广告弹性在如下情境中更高:
(1)耐用品比非耐用品;
(2)产品生命周期早期阶段比成熟阶段;
(3)年数据比季度数据;
(4)当广告是用GRP测量而不是货币单位测量。
•长期广告弹性的平均值是0.24,该值比之前的元分析中的均值0.41更低(Assmus, Farley and Lehmann,1984);
•短期弹性的一些结果用在长期弹性中会有一些出其不意的效果。
这一跨越半个多世纪的研究潮流强大之处在于,它产生了许多关于广告如何运作的具体知识。这些知识在不同的研究情境中均得到了检验。同时,上述研究的局限性是依赖于暂时性集合数据,一般使用销售额或市场份额数据,而不是消费者选择数据作为因变量;主要集中于广告费用或GRP,而不是广告曝光率;采用自然发生数据估计而不是实验数据。接下来的4节中介绍的4个研究分支解决了以上更多的局限。
分支2:广告延滞模型和动态模型
这一分支的研究聚焦在广告影响的规模和持续时间,这些影响发生在广告影响的同一时期之后。正如之前的研究分支,这一分支采用总指标测量广告,例如总花费或总GRP。他们将销售额或货币利润或市场份额当作一个整体进行测量。广告效果的测量依旧是弹性,效果持续性的度量是收集数据的时间段的计量。众所周知,广告效果不是瞬间即时发生的,而是一个从做广告到之后一段时间的一个持续过程。广告延滞分析非常重要(Tellis,2004),因为:第一,广告总效应取决于即时效果加上部分延滞效果,如果延滞效果较大,那么忽视这一要素会导致严重低估广告的真实影响;第二,如果一波广告产生了一些延滞效果,很可能意味着下一波广告不急于出现直到第一波的效果完全消逝;第三,广告效果的持续性对企业会有所启示,即将广告看作是纯粹的费用还是投资,以及是否从政策角度允许广告费用可以减免税收;第四,广告效果的持续性会决定广告准入范围或者什么广告创造了长期习惯(如吸烟)。本节涵盖了延滞模型、数据集问题及其解决办法,其他关于广告动态性研究和普遍性问题。
数据集及其解决办法的回顾
如何估计如广告效果这样的延滞问题?尤其是如果采用的是计量模型。最明显的解决方法是包括各种角度测量广告的滞后变量作为附加的自变量。然而,这样做会有两个问题:(1)广告滞后值往往高度相关,从而导致广告滞后系数的估计毫无意义;(2)研究人员并不清楚要用多少期滞后。
就这一问题,Koyck(1954)给出了一个最早的解决办法。Koyck给出一个关键自变量的无限滞后模型简化为只有一个滞后因变量的模型,其假设是广告效果是在时间上连续但单调地呈几何形状平滑下降。Koyck(1954)采用的是 Koyck变换,该方法是将无穷序列平滑平均模型降维为自回归平滑平均模型。提取出的模型简单又漂亮并且能够解决计量模型的主要问题。
Palda(1964)在估计广告延滞过程中应用了Koyck模型。在广告情境中,Koyck模型的两个假设看似具备合理性,因为一个假设是假定了广告效果自身在时间变化中不会发生改变,但是广告效果会平滑单调递减,因为记忆一定伴随一定比率消逝。然而,在回顾中发现,Palda 估计的广告延滞过高,导致广告效果持续时间的评估毫无意义。起初,没有人注意到这一问题,随后,大量的计量研究采用了Kayck模型试图估计广告效果延滞大小和持续时间长短。
Clarke(1976)为这一分支研究带来了至关重要的贡献,他调查了28个分析广告对消费额或市场份额影响的研究结果,从这此研究中,他提取了69个不同的广告延滞估计。他发现这些估计对于大部分(约90%)广告效果持续或消逝会保持多长时间的估计存在较大差异。这些研究结论有小到0.8个月到高达1368个月不等,甚至或还有 113 年!进一步分析,他发现了一个关键因素,这一因素影响了广告延滞的持续时间估计,即为数据集水平。该水平是指销售和广告数据是在什么样的水平(或层面)上收集和分析的。Clarke(1976)调研的原创研究样本中,这一时间层面上有周、月、季或年,他发现数据集级别越高,广告延滞持续时间估计越长(但事实可能不一定如此)。
Clarke(1976)假定恰当的数据间隔是购买频率,即所研究产品消费者平均购买频率。以此为基础,他估计他所调查的样本产品广告效果持续时间为 3—15个月。Clarke(1976)主要假设——适当的数据间隔是购买频率——或许无法得到保证。
大量的后续研究都在试图确定为什么会存在数据集偏差,以及如果确实存在数据间隔,又应如何纠正这一偏差(例如 Weinberg and Weiss,1982;Vanhonacker,1983)。然而,没有研究尝试确认正确的数据间隔应该是什么,那么哪个数据间隔才是正确的呢?
Leone(1995a)计算了以往研究的延滞效果持续时间。特别是他采用Assmus等人(如上所述)所收集的114个广告延滞效果估计,Leone(1995)使用了Clarke(1976)建立的理论,计算了延滞效果持续时间,他发现延滞效果平均值为0.69,以此为基础,他认为90%的广告效果持续时间为6个月。这一时间虽然比Clarke(1976)的研究略短,但也是以正确数据间隔这一错误假设为基础的。
Tellis,Chandy和Thaivanich(2000)建立了一个采用一天中广告时间非常分散的广告反应模型,以试图回答这一问题。他们使用了分布滞后模型,该模型可以看作是Koyck 模型的分解。这一模型的关键特征是计算了单个广告、渠道和一天中不同时间段的效果。用来实证检验的数据来自美国的5个市场。与以往研究相比,作者发现广告滞后效果其实相当短,通过对5个市场的分析,平均延滞效果是8小时。批评者认为这一数字完全不合理,而且 Tellis,Chandy和 Thaivanich 存在集合偏误。然而,考虑到消费者每天要接收到成百上千的信息,新信息能够擦除掉旧信息的影响。虽则如此,不要忘记,什么是真正的数据间隔?
Tellis和Franses(2006)解决了这一问题,恰当地使用了滞后操作,他们证实前面所提到的适当的数据间隔并不是购买间隔频率,而是单位曝光时间。这一间隔是广告发生在一个时间点,然后发生在每个相同时间点的最大时间间隔周期。这一间隔可以以日、小时或分钟计算,因为广告播放频率非常的分散。因此,广告效果持续时间可能比Clarke(1976)所估计的时间短很多,很有可能更接近 Chandy,Tellis和Thaivanich(2001)的估计。
广告动态性的其他研究
有三个关于广告动态性的研究值得提及(Tellis,2004)。
Lodish等(1995a)认为,一般来说,在一波广告活动之后广告效果不会即刻消逝。当广告产生了作用,76%的初始增长会在广告活动结束之后持续一年,另外有28%能持续到第三年。所以总延滞效果等于当期效果(第一年内)。假若如此,在类别指标中也存在小量(约 6%)的延滞效应。与成熟产品相比,广告效果对于新产品持续的时间更长。值得注意的是,这一研究中的发现与 Clarke(1976)以及 Tellis ,Chandy和Thaivanich(2000)的研究存在较大矛盾,Clarke(1976)认为广告延滞时长是3—9个月,Tellis,Chandy和Thaivanich(2000)认为只有8小时。解决这一矛盾的方法是考虑时间框架。Lodish 等(1995a)对广告延滞的发现结果与本章所提及的所有研究均存在较大差异。以往研究试图在分散的时同段或在一波广告活动进行中分散的广告播放中估计广告平均延滞效果。相反,Lodish 和他的助手(1995)是在整个广告活动结束之后估计延滞效应。因此,即使有的学者试图比较两种研究结果并且提取其普遍性,但单纯的比较没有什么效果。两种研究发现必须当成是广告延滞效果评估的互补关系。
Dekimpe和Hanssens(1995)采用向量自回归模型测量了广告的长期或持续性影响。他们采集了 1980—1986年间一家家装连锁店的月销售数据,并用这一数据验证了他们的模型。他们发观销售额和广告总花费有长期或进化成分,因为有两个原因:(a)重复性购买来自广告影响;(b)A购买商品是因为 B,而B看过了广告。他们认为这些高销售回报是因为高广告投入,因为管理者是以销售数据为基础制定预算。因而,他们假定他们所发现的进化模式是因为这样的连锁反应。作者最为重要而且最大的观点是当一些广告效果在短期内消逝,但有一些会持续下去,即便广告投放已经停止。他们认为广告的更多投入使长期销售额预期额外增加1.09 美元,长期广告预测增加0.49 美元。另外,作者发现即使广告产生了积极持续效应,但并不会产生积极持续的收益效应。
Mela,Gupta和Lehmann(1997)验证了促销和广告对消费者品牌选择的“长期”效应。这一研究或许是所有研究的基准时间最长的——达到 8.25年。正因如此,标题中的“长期”还真是名符其实。作者分析了一种商品品类的单源数据——一种经常购买非食品包装的产品。在研究期间,作者发现广告效果伴随促销的增加而下降。本研究最为重要的发现是当促销增加了价格和促销敏感度时,广告降低了消费者价格敏感度。他们发现广告对于价格敏感度高的群体影响要高过忠诚的群体。之后对相同的数据集的分析发现广告比促销或价格折扣带来的利润更高(Jedidi,Mela and Gupta,1999)。
Dekimpe和Hanssens 采用了正交自回归模型(VAR)。所以,这一模型与Koyck 模型一样存在集合偏误同题,然而,并没有人估计 VAR 模型中偏误程度。Mela,Gupta和Lehmann(1997)、Lodish(1995)给出了在标准 Koyck 模型之外估计广告动态性的其他方法。
小结
广告动态性研究给出了如下一些尝试性普遍结论:
•广告存在延滞效应,与当期效应同样大。因此,总广告效果是当期效应的二倍;
•研究人员使用 Koyck 或 VAR模型估计广告延滞效果时要小心,因为这两个模型存在集合偏误;
•估计广告延滞效应时,广告日程安排频率(而非购买频率)的数据非常必要。准确地说,最优的数据间隔是广告在某一时点发生到相同时点发生中间的间隔;
•广告效果的持续时间可能相当的短。但是,对此没有一个准确的估计,因为到此为止的前期研究均没有将适当的数据间隔作为计算广告效果持续时间的一条准则来遵守。
分支3:广告频次模型
这一分支的研究主要探索的是单个广告曝光效果。与前两个分支研究相反,这类研究主攻的是分散的广告效果测量。之前的两类研究使用的是广告聚合效果测量,例如总花费或总GRP。广告通常来说是对个体消费者产生影响,因此在一个时间段内,广告预算最终转化为一系列的面向一个或更多目标消费者的曝光率。相似的,销售额可以看作是消费者对单个品牌选择的聚合效应。“暴露频次”是指在某一特定时间段内,个人暴露于广告信息的平均次数。“有效频次”是指广告商设计的使产出最大化的最优频次,例如销售、利润或价格水平。
记录销售额的数据集,如消费者在不同地点所购买的品牌或数量,特别地一同记录了广告暴露的形式。消费者选择分析带来了独特的问题,同时也给理解广告效果带来了机会。主要的问题是:由于每位消费者都会产生大规模的购买,数据集的规模和复杂性会伴随样本量的增加而快速增长。然而,聚焦于选择也有大量好处,关键优势是更深人洞察广告如何作用,以及如果是在消费者层面或广告曝光层面收集数据,则在偏误上更加自由。
正如广告弹性研究,频次研究也要用反应函数表示广告效果。但是,广告弹性研究的反应函数是集合销售对销售广告费用函数。相反,广告频次研究的反应函数是非集合消费者选择对非集合广告费用函数。因此,这些研究的细节更详细,探讨得更深入。同时,它们不是即刻见效的,即使管理者知道有效频次,他也需要知道要传递给适当的消费者的广告预算和计划是什么。所以这一分支的研究本身并不完全知道如何最优化地运用广告。
重要硏究回顾
一个广告频次的早期研究是McDonald(1971)的成果。他分析了 13 周里9种商品品类的 266个样本的日常记录。他在数据分析时非常小心地避免了虚假因果关系。尤其是他确认他没有解释作为众多广告目标的品牌忠诚消费者对单一广告反应模式。首先,McDonald(1971)发现样本中的5%,如果在两个购买间隔中间观看了两个或更多的广告时,则非常容易发生品牌转移。第二,如果在购买前观看广告的时间少于4 天,上述效应比长于4 天的作用更强。第三,样本对于3次以上的曝光比2次的曝光并没有表现出更强的效果。
Tellis(1988)在单源数据中对卫生纸样本购买做了一个选择模型。他受到非常有名的Guadagni 和Little(1983)的选择模型启发,建构了消费者对促销反应的选择模型。后面的作者没有再采用广告数据。Tellis(1988)认为不管这一品类商品状态如何,这一品类的广告效果达到1 亿美元。Tellis 得到如下结论:第一,广告效果很小而且非常难以识别,相反销售促进的效果很强、即时而且很难忽略不计;第二,品牌对广告曝光效果有调节作用。消费者对于他们所忠诚的品牌反应更强;第三,广告曝光的反应模型是非线性的。消费者所忠诚的品牌反应模型在2次曝光时快速增长,在3次曝光时达到峰值。但是,消费者不熟悉的品牌,需要更多次的曝光,但能达到更高的峰值;第四,在赢得新购买者方面广告的作用很小,但是在增强偏好方面有少量的作用。
Pedrick和Zufryden(1991)使用单源数据酸奶的广告效果进行了分析,Pedrick和Zufryden(1991)所得到的三个研究结果与Tellis(1988)相似:广告的效果相对来说比较小,促销的效果与广告相比更强,对广告曝光的反应函数是非线性的。他们得到的最为重要的结论是市场份额伴随达到率增加的增长比频次增加而增长的幅度更大。
Deighton,Henderson和Neslin(1994)使用计量模型做了本节前两个研究相似的单源数据分析。作者分析了广告品牌的品牌选择中曝光频次影响效果。如前两个研究,作者发现其他促销变量的效应比广告的效应要大得多。广告对两到三个品类商品存在显著影响。作者最重要的结论是随着曝光次数增加,消费者购买品牌的概率会随之增加,甚至超过曝光水平的20倍。然而,这一效应呈递减速度增长。同时,最大增幅发生在从0到1的曝光水平时。
Jones(1995)分析了 1991年12个品类中 142个品牌的单源数据。所有品类均来自包装食品,而且包括竞争力大和广告过度的市场。他专注于广告短期效应,即发生在购买前7天以内。Jones(1995)发现广告对广告品牌的家用购买具备短期效应。但是,效应的方向不太寻常。大约有50%品牌的广告效应是中等强度,大约30%品牌的广告效应没有明显区别,大约20%品牌的广告效应呈负效应。小部分品牌的销售额既有短期效应也有长期效应。但是长期效应远低于短期效应。Jones(1995)最重要的研究发现是关于广告重复性问题。他发现就在购买前的7天,第一次展示获得最多的反应,更多展示不会增加太多。因此,本研究的结论是“一次展示足矣”。
一位市场营销咨询师 Gibson(1996)在分析 TRI-NET市场中,通用磨坊的60个商业活动中得到相似的结论。他认为一次广告就可以充分取得态度上的改变和使用品牌优惠券,多次展示并无必要性。
后面的结论引起了一些争议,而且让一些学者对Jones(1995)的分折和解释产生了质疑。有两条最受争议,一是基准样本的形式;二是7天这一时间的可识别性。首先,只有在广告商的目标顾客不是重度广告接收家庭时,上述研究结论才有用。如果是这样,仅仅因为目标顾客的因素,Jones(1995)才能发现广告效果。McDonald(1971)花费了大量努力证实他的分析不受这一虚假相关的影响。其次,Jones(1955)的研究将7天之后接收到广告的家庭排除在外。因此,来自未测量曝光引起的响应增长依旧未能得以测量。
总之,Jones(1995)取得了一些重要结论,但是其有效性和普遍性还需要在解决上述两个问题之后得以复制。
小结
这一分支的研究使用了不同的模型和设计对广告曝光效应进行了分析,但是并没有产生主要的共性结论。不过也有一些非正式的共识性结论:
•与促销相比,广告频次对消费者选择的影响较小;
•如果产生了效应,那么广告对利润的影响是正向的,促销则是负向的;
•最优的广告曝光次数随市场、商品品类、品牌和消费者状态变化。
分支 4:广告内容模型
这一分支的研究主要专注在如何改变影响销售额或市场份额的广告内容。有意思的是,这可能是市场营销人员可以改变的最为重要的内容。但是,多数前期研究只采用广告费用、频次或 GRP 测量。相反,大量消费者行为文献指出让广告更有效,应如何设计广告内容。但是,多数这类研究发生在高度人工设计环境下的实验室研究(Vakratsas and Ambler,1999;Tellis,2004)。在市场研究中一个新趋势即是通过探讨在真实市场中广告内容效应而将这两类研究分析进行整合。
重要研究回顾
Chandy等(2001)尝试分析在真实市场环境下不同广告的效应,他们将上述研究延展到推荐服务领域。这一服务开始于一个城市(市场),经过 20年,逐渐扩张到23个市场。因此,市场的年龄从几个月到 10 多年不等。在此期间,该服务开发了72个系列广告,并以不同频次和不同强度在不同城市播放。
一个重要发现是广告对销售额和利润的影响因不同市场、不同电视渠道和不同创意而有较大的差异。很大一部分创意执行对增长销售额方面并没有作用,甚至多数没有盈利。这一部分最有价值的分析是对创意执行、媒体和播放时段的特殊发现。这一研究准确地指出广告商应执行和放弃什么样的创意执行,应使用和放弃什么渠道,以及购买哪个播放时段能够获取最大产出。
广告本身使用了很多诉求,作者用丰富的行为变量数据集测量这些诉求。特别地,他们探索了广告使用讨论、情感或推荐的范围,信息应当如何编辑,以及关键信息应该持续多长时间等。有了这些研究,作者可以通过对比新旧市场的使用情况估算不同广告形式的效果。一个研究发现是广告响应在比较新的市场更为强烈;在新市场中,讨论性质的展示、专家信息展示和负面信息展示均有显著地影响。情感诉求和积极信息展示的广告在旧市场中更为有效。
MacInnis, Rao和Weiss(2002)报告了一项在20 世纪90 年代进行的一系列多阶段实验研究。作者开发了一个电视商业活动的数据集,该数据集对频繁购买的商品已经做了广告权重测试。数据集包括了47个广告,每一个均在不同的市场实验中得到检验。其中25个广告对销售增长在统计上有显著影响,另外22个则没有。作者招募并训练了22 位评判人员用量表从情感到理性诉求对这些广告进行评价。结果发现情感诉求的广告更有可能使销售额增长;相反,采用启发式或理性诉求的广告不大可能使销售额增长。在进一步的实验研究中,作者探寻在实验室环境下是否这些广告影响到实验主体,他们发现促使产生积极情感和有限消极情感的广告,更有可能使销售增长。
这些实验研究所提供的信息告诉我们,在频繁购买的成熟商品品类、产生积极情感和有限消极情感诉求广告能够从增长的广告中获得利益。
这一分支的研究太过小众,从而未能得到一些普遍性的结论。
分支 5:广告效应的田野实验研究
这一分支的研究专注于在田野实验研究中,在两个可对比地区或时期,对销售或市场的集合广告费用效应的研究。田野实验研究也称为权重研究,因为有些研究将在特定时期特定地区的广告强度当作广告使用“权重”来测量。这些研究的因变量一般是销售额或市场份额。权重测量的目的是看广告投入的增加或减少是否对销售有效果。如果广告投入的增加令销售和利润的增长足以补偿广告的额外成本,那么为了建构品牌也需要这个投入。相似地,如果广告投入的减少没有令销售或利润的减少超出减少的额度,那么品牌需要保持在较低水平的广告投入水平上。这些研究已经探索了不同广告强度或权重水平条件下,测试组与控制组之间对比时的不同结果。一般来说,控制组采用的是企业当下的广告投入水平。在设计较好的实验中,所有的要素在条件内均保持了相似性。关于权重问题,研究人员也测试了广告的其他要素,包括拷贝、媒体、受众和日程。
这一分支的研究没有对广告弹性进行估计。然而,他们测量了伴随广告强度(权重)的增加或减少,销售和市场份额的增加或减少。因此,这一分支的研究对市场营销和广告运营商很有启示性。这些启示可以立即投入使用以决定广告预算。
重要研究回顾
研究人员已经进行了超过450次测量广告效果的市场实验(Tellis, 2004)。关于广告对销售的影响研究有6组实验尤其有启发性。这些实验与安海斯-布希公司、葛瑞和达美高广告公司,AdTel电话有限公司,金汤宝集团和信息咨询服务公司有关。另外,两位广告研究人员(Aaker and Carman,1982)回顾了前三个研究以及几个较小的实验。这里,我主要介绍这几个研究的关键内容并总结主要研究结论。
Aaker和Carman(1982)收集了20 世纪60年代到70年代120个AdTel在3个城市的实验,AdTel 在每个城市控制了广告投入水平和广告内容。在120个测试中,48个为权重测试,36个为重复测试。48个权重测试中的6个使用了更低的广告投入水平。然而,6个实验没有一个出现销售下降的情况。其他 42个测试(使用了增长的广告投入水平),30%显示出与控制组不一样的销售变动。多数后期的测试测量的是新产品。相反,47%的重复测试、测试组和控制组的销售变量存在显著地不同。Aaker和Carman(1982)报告了由葛瑞广告公司和达美高广告公司实施的11个实验。总之,这一组实验显示,广告投入的增长在大约一半的实验中有效果。但是广告投入的下降没有负面作用。Aaker 和 Carman(1982)也总结分析了 69个其他实验。其中11个实验是广告投入在2年或更长时间内是减少的。几乎所有的(11个中的 10个)的实验显示广告投入的减少对销售没有负面的影响。余下的 58个实验研究,只有少数研究显示广告对销售增长有相当的影响作用,证明了广告预算增加的正当性。
Ackoff和Emshoff(1975)描述了一个在20世纪60年代中期一系列非常有趣的广告,这个系列广告是 Anheuser-Busch 公司的百威啤酒。实验设置了不同的广告投入水平、脉冲模式、媒体和其他促销活动。这一系列的实验最为精到的是依据当期经费水平设置了-100%,-50%,-25%,0%,+50%,+100%,+200%等不同的广告权重。为验证结果的可信性,每个权重水平都在6个地区得到测试。实验结果表明,在短期内广告费用的减少并没有导致销售的负面影响。作者总结了以往的品牌广告过渡饱和的响应模式。他们发现广告暂停播出超过一年能导致销售额的恶化。这种情况下,只要广告投入恢复到之前的水平,销售水平和销售增长水平便可以恢复。一段时间所有广告都暂停播出,之后采用正常水平广告投入的投放计划(也称为间隙式广告)应如何安排,这些结果给了企业启示,暂停广告可以降低成本,但只要销售出现颓势就应当将广告投入恢复原有水平。
关于不同媒体的有效性,他们发现广播、杂志和报纸并没有显著地差异。但是他们发现电视明显优越于其他媒体,广告牌略逊一筹。他们也发现促销费用接近最优化。仔细实施他们的建议导致广告支出从1.89美元/桶减少到0.8美元/桶,相应的销售额从750万桶增加到1450万桶。
Eastlack和Rao(1989)报告了20世纪70 年代中期,来自金汤宝公司6个品牌的19个广告实验。实验中的维度有广告权重(从-50%到+50%)、播放计划、媒体、拷贝和目标市场。实验表明广告权重对于销售没有或仅有一点点的影响。但是,在某些情境下,拷贝、媒体和目标市场对销售增长有影响作用。只要销售显著增加,增加均发生在早期,而不是之后长时间的重复期。
Abraham和Lodish(1989)、Lodish 等(1995a,1995b),总结了在信息咨询服务公司(IRI)广告行为扫描测试在过去十年间超过389次广告测试。49%的权重测试显示广告投入的增加可以在 80%的显著水平上显著地增加销售。测试的显著性水平与95%相比有些低,但是作者并没有报告这一显著水平下的数值。即使当广告在这一显著水平上是有效的,但是也只是在20%的案例中有盈利(年中时)。一个很重要的发现也重复了之前的研究,与中等程度投入相比,大量增加广告投入并没有使销售产生更好的效果。与成熟的或完善的产品相比,广告对新产品更有效。更重要的是,如果广告在早期没有产生效果,那么之后也不会有什么效果,即使不停地重复。
小结
因为其研究范围,所以对以往实验研究进行总结很有必要。该类研究涵盖了超过450个实验,并含有大量的受访者,使用了大量的品牌、情境和时间序列。这类研究如下:
•对于一些成熟品牌、广告权重或是电视广告水平对于销售的影响并不起到关键性作用。超过半数时间,权重的增加并不能让销售增长。但是,权重的下降也不会让销售下滑,至少在短期到中期是如此。另外,后面这些因素发生改变的话(媒体、拷贝、产品、细分市场或播放计划)会影响广告的有效性。一般来说,这些因素的创新能导致销售增长。
•广告投放的减少,不会明显地令销售立刻下滑。这即意味着过去的广告存在延滞效果使其没有立刻衰退。或者说,企业过度投放广告,而且近期的广告没有发挥作用。在有些测试中,长时间停止广告投入产生了恶劣的影响,但在其他测试中并没有。是否由长时间停止广告投入而产生的恶劣影响能够被新的广告投放所拯救这一问题并没有得到验证。因此,企业应当非常谨慎对较长时间暂停所有广告投放的决策。
•因此,从这些研究中得到的整体信息是广告商很可能过度投放广告,至少是在相同的细分市场采用相同的复制品、媒体、播放计划和产品。如果广告商寻求更多的广告投入,这种情况便会加剧。
•如果广告发挥了作用,那么这种效果在早期可以看到。如果早期没有效果,那么接下来的重复也不会有什么作用。相反,当广告发挥了作用而且保持了超过一年的时间,该效果能持续至少超过两年时间。这种情况下,在后两年的效果等于第一年的效果。
总结
在过去60年中,关于广告的研究非常的丰富、多样和高产。我们必须了解五位在这一研究领城为后人奠定基石的先驱:Koyck(1955)、Palda (1964)、McDonald(1971)、 Clarke(1976)、Larnbin(1976)、Aaker 和 Carman(1982)。
•Koyck(1955)解决了简单而方便地评估广告延滞效应的问题。
•McDonald(1971)解决了如何估计单个广告对单个消费者的微观影响。
•Palda(1964)奠定了用计量经济学模型估计广告效果的基础。
•Clarke(1976)指出了在估计广告动态效果的数据集合关键性问题。
•Lambin(1976)指出如何在不同的情境下估计广告效果,建立了其普遍性。他得出了许多普遍性的结论,时至今日多数结论被证实也是成立的。
•Aaker 和 Carman(1982)确认了在评估广告效果中田野实验的重要性和价值。
其他学者在这一领城也有建树。一些主要问题需要进一步研究:
•如电于邮件、搜索引擎、横幅广告和移动电话广告等新型广告类型的效果是什么?
•例如互联网、移动电话和社交媒体等新媒体的规则是什么?
•不同媒体之间的广告是如何彼此互补或竞争的?
•广告效果真正的持续时间是多久?
•如果广告效果在传统媒体上是下滑的,其渐近值是多少?
许多训练有素、积极进取的学者活跃并丰富了这一研究领城。我相信这些以及其他问题将在未来几年得到解决。