广告术语"黑话"大全 (CPC, CPM, CPA, oCPC, oCPM, RTB 等)
约 4811 字大约 16 分钟
2025-11-05
🧭 背景:推荐系统之后,广告系统登场
在第三章里,我们已经搭建起一套从 召回 → 排序 → 注意力建模 的推荐系统“内功心法”:
- 召回阶段:用双塔、YouTubeDNN 等模型快速找出候选集合,预测粗粒度的相关性(如 pclick)。
- 排序阶段:用 Wide&Deep、DeepFM、DIN/DIEN 等模型精细估计 点击率 (pCTR)、转化率 (pCVR) 等概率。
而在本章里,推荐系统不再只是“给谁看什么”,还要回答一个更现实的问题:
在有限的广告位上,怎样用算法把流量变现?
这就进入了 计算广告 (Computational Advertising) 的世界:
- 一端连接着 推荐模型 —— 提供 pCTR、pCVR 等预测;
- 另一端连接着 计费与结算 —— 按曝光、点击或转化收钱;
- 中间依赖一整套 竞价、排序、预算控制与归因 的数学机制,把“模型输出”翻译成“真实收入与广告主效果”。
本篇就是计算广告的 术语 + 数学 + 工程实战速成课:不止记住 CPM/CPC/CPA 这些“黑话”,还要搞清楚它们背后的公式、优化目标与相互关系。
为了方便后文推导,我们先约定一些记号:
NimpNclkNconvp^CTRp^CVR:=曝光(Impression) 数:=点击(Click) 数:=转化(Conversion) 数,例如下单/付费:=NimpNclk:=NclkNconv
其中 p^CTR、p^CVR 是基于历史样本的 频率估计,而第三章里的排序模型给出的 pCTR、pCVR 则是 模型预测的概率。在广告系统中,这两者会一起用于评估与优化。
💰 计费模式:CPC / CPM / CPA / CPT
计费模式回答的是:
广告主究竟在为“什么事件”付钱?
常见的四类:
- CPM (Cost Per Mille):按曝光千次计费;
- CPC (Cost Per Click):按点击计费;
- CPA (Cost Per Action):按转化/行为计费;
- CPT (Cost Per Time):按时间段计费(例如包一天的频道首屏)。
CPM:按曝光千次计费
从财务角度,CPM 的定义非常直接:
CPM=Nimp总花费×1000.
- 单位通常是“元/千次曝光”。
- 对广告主而言,更像是“品牌曝光采购价”;
- 对平台而言,是衡量“每千次展示能赚多少钱”的核心指标。
数值例子:
某品牌广告投放共展示 Nimp=200,000 次,总花费为 400 元,则
CPM=200,000400×1000=2元/千次曝光.
CPC:按点击计费
在效果广告中,更常用的是 CPC:
CPC=Nclk总花费.
如果广告主给出的是“最高愿意为一次点击支付的价格” bclick(Click Bid),则:
单次点击成本≈实际CPC≤bclick.
数值例子:
某广告活动共获得 Nclk=8,000 次点击,总花费 6{,}400 元,则
CPC=8,0006,400=0.8元/次点击.
CPA:按转化计费
当广告主更关心“下单/注册/激活”等最终行为时,会使用 CPA:
CPA=Nconv总花费.
此时广告主通常给出“每次转化的期望成本” bconv(Conversion Bid),平台需通过控制流量质量与出价,将实际 CPA 控制在可接受范围内。
数值例子:
电商广告共获得 Nconv=500 笔下单,总花费 5{,}000 元:
CPA=5005,000=10元/单.
CPT:按时间计费
对首页 Banner、开屏广告等资源,常按时间段售卖:
CPT=时间长度该时间段总花费.
典型的是“一天固定几万元”,对应的是 明确的展示档期与品牌曝光,与点击/转化不直接挂钩。
📊 效果指标:CTR / CVR / eCPM / ROI / ROAS
有了计费模式,还需要衡量广告效果。本节引入五个最关键的指标。
CTR:点击率 (Click-Through Rate)
直觉上,CTR 衡量的是“看到广告的人,有多大概率点了它?”。
统计定义是:
p^CTR=NimpNclk.
在第三章中,排序模型给出的 pCTR 是单次展示上的 点击概率预测,在线上通常写作 pCTR;而 p^CTR 则是离线统计出来的“真实 CTR”。二者配合用于 校准与评估。
典型范围(粗略经验):
- 电商信息流:1%∼5%;
- 搜索广告:2%∼10%,强意图时更高;
- 品牌展示广告:0.1%∼1%。
CVR:转化率 (Conversion Rate)
CVR 衡量的是“点了广告的人,有多大概率完成了我们希望的动作?(下单/注册/激活等)”。
统计定义:
p^CVR=NclkNconv.
在模型侧,我们同样会训练一个 pCVR 模型,预测单次点击下发生转化的概率 pCVR。
eCPM:用一个公式统一不同计费模式
eCPM (effective CPM) 是平台和算法最常用的“通用货币”,定义为:
在当前策略下,期望每一千次曝光能带来多少收入。
数学上:
eCPM=E[每次曝光收入]×1000.
不同计费模式下,E[每次曝光收入] 的表达略有差异。
CPC 模式:广告主按点击出价 bclick,每次曝光以 pCTR 的概率带来一次点击,期望收入为
E[收入∣一次曝光]=bclick⋅pCTR;
因此
eCPMCPC=bclick⋅pCTR⋅1000.
CPA 模式:按转化出价 bconv,一次曝光以 pCTR 概率被点击,点击后以 pCVR 概率转化:
E[收入∣一次曝光]=bconv⋅pCTR⋅pCVR,
eCPMCPA=bconv⋅pCTR⋅pCVR⋅1000.
CPM 模式:单次曝光的收入就是 1000CPM,因此
eCPMCPM=CPM.
可以把 eCPM 总结成一个统一公式:
eCPM=b⋅P(付费事件∣曝光)⋅1000,
其中 b 是对应付费事件的出价(按点击、按转化或按曝光),P(⋅) 则是由 排序/转化模型 提供的概率预测。
这就是“推荐模型为广告系统服务”的数学枢纽:
- 第三章的模型给出 pCTR、pCVR;
- 本章的广告引擎用出价 b 与这些概率组合成 eCPM,完成广告排序与竞价结算。
数值例子:
若某广告 CPC 出价 bclick=1.5 元,pCTR 预测为 pCTR=2%,则
eCPM=1.5×0.02×1000=30元/千次曝光.
若改用 CPA 模式,bconv=30 元,pCVR 预测为 pCVR=10%,则
eCPM=30×0.02×0.1×1000=60元/千次曝光.
在相同流量下,后者理论上为平台带来更高收入。
ROI / ROAS:广告主视角的“值不值”
从广告主视角,最关心的是“花出去的钱,带来了多少回报”。常用两类指标:
- ROI (Return on Investment):
ROI=成本收入−成本.
- ROAS (Return on Ad Spend):
ROAS=广告花费收入.
若假设平均每次转化带来的客单价为 v,则在 CPA 模式下:
收入=v⋅Nconv,成本=CPA⋅Nconv.
因此
ROI=CPAv−CPA,ROAS=CPAv.
这组公式为后文的 出价策略与预算控制 提供了理论基础。
🏦 竞价与广告排序:从 pCTR/pCVR 到 eCPM
当同一个位置有多条广告竞争时,平台需解决两个问题:
- 排序谁靠前? —— 决定展示顺序;
- 谁付多少钱? —— 决定实际扣费。
排序公式:Score = bid × pCTR × 质量分
大多数主流广告系统(搜索广告、信息流广告等)都采用类似的排序公式:
Scorei=bi⋅pCTRi⋅qi,
其中:
- bi:广告主对第 i 个广告的出价(按点击或按转化);
- pCTRi:排序模型预测的点击率;
- qi:质量分 (Quality Score),反映广告素材质量、相关度、历史表现等。
如果是 CPA 模式,还会进一步考虑 pCVR:
Scorei=bi,conv⋅pCTRi⋅pCVRi⋅qi.
直觉理解:Score 实际上就是 eCPM 的一个变体:
Scorei∝eCPMi.
平台通过按 Score 降序排序,实现了对 期望收入/有效转化的近似最大化,而质量分 qi 则保证了用户体验和广告规范。
GSP:广义二价拍卖 (Generalized Second Price)
在 CPC 模式下,互联网上广泛采用 GSP 作为竞价与定价机制。其核心思想可以类比为:
拍卖会上,出价最高的人拿到最好的位置,但实际支付的价格接近“压在他下面的那个人的出价”。
形式化一点,假设:
- 按 Scorei=bi⋅qi 排序,得到名次 1,2,…;
- 第 i 名广告的质量分为 qi,第 i+1 名的 Score 为 Si+1=bi+1qi+1。
则第 i 名的 实际 CPC 大致为:
CPCi=qiSi+1=qibi+1qi+1.
直觉:为了保持自己在当前位置不被“挤下去”,他只需要略高于下一名的有效出价 qibi+1qi+1 即可。
VCG:更“公平”的定价机制
VCG (Vickrey–Clarke–Groves) 是一种具有良好博弈论性质(真实出价为优势策略)的拍卖机制。在搜索广告位场景下,可形式化为:
- 设第 i 个广告位的点击率衰减系数为 αi(位置越靠下,αi 越小);
- 设排序后第 k 位广告的出价和质量分分别为 bk,qk。
则位于第 i 位的广告主,其 每次点击价格 可写成:
CPCi=αiqi1k>i∑(αk−1−αk)bkqk.
直觉上,这个价格等于“因为你存在,所有后面广告主的总收益减少量”,即你对他人的外部性。VCG 保证了“说真话最优”,但在工程实现和业务解释上略复杂,因此工业界更多采用近似的 GSP 机制。
📈 出价策略:从 ROI 约束推导最优 bid
对广告主而言,一个常见目标是:
在期望 ROI 不低于某个阈值 R∗ 的前提下,尽可能获取更多流量。
考虑 CPC + 转化价值 的情形:
- 设每次转化带来的平均价值为 v;
- 模型预测的 pCVR 为 pCVR;
- 出价为每次点击成本 b。
对单次点击,期望收益与成本为:
E[收益∣一次点击]=v⋅pCVR,E[成本∣一次点击]=b.
则 ROI 为:
ROI=bvpCVR−b.
在希望 ROI≥R∗ 的前提下,有:
bvpCVR−b≥R∗⟺vpCVR≥b(1+R∗)⟺b≤1+R∗vpCVR.
这给出了一个简单但非常实用的出价上界:
b∗=1+R∗vpCVR.
给定目标 ROI 和模型 pCVR,就可以反推出“这次点击最多值多少钱”。
在实际系统中,oCPC/oCPA 等智能出价产品,往往都是在类似的理论基础上,再叠加更多业务约束与探索机制。
预算与 Pacing:如何“又快又稳”地花完钱
广告主通常会给出一个 周期预算(如日预算 B),平台需要在一天内 既不要过早烧完,也不要到晚上还剩一大半。这就是 Pacing(投放节奏控制) 的任务。
目标消耗曲线与误差
假设我们按时间把一天划分为 T 个时间段(如 24 个小时),则理想状态下,希望在第 t 段结束时的累计消耗为:
S∗(t)=B⋅Tt.
实际消耗 S(t) 与目标之间的差异:
e(t)=S∗(t)−S(t).
- e(t)>0:表示“花得太慢了”,可以适当提高出价/放宽流量;
- e(t)<0:表示“花得太快了”,需要降出价/收紧流量。
简单的比例调节 (P 控制)
一个最简化的 Pacing 策略是对出价乘以一个 动态因子 mt:
bt=mt⋅b0,
并迭代更新 mt:
mt+1=mt(1+k⋅Be(t)),
其中 k 是一个小的学习率(如 0.1)。
- 如果 e(t)>0(花得慢),mt+1>mt,出价略有提升,加速消耗;
- 如果 e(t)<0(花得快),mt+1<mt,出价略有下降,放慢节奏。
实际系统中会引入 指数平滑、PID 控制、流量预测等组件,但核心思想都离不开“对比目标曲线 vs 实际消耗,不断纠偏”。
🔗 归因模型:谁该为这次转化“背锅”?
在真实世界中,用户完成一次转化(如下单),往往经历多次触达:
搜索广告 → 信息流广告 → 推送通知 → 朋友圈种草 → 最终转化。
问题来了:
这一次转化的价值,应该如何在多个触达点上 分配“贡献度”?
这就是 归因 (Attribution)。我们可以用一个统一的加权公式来刻画:
V=i=1∑Lwi⋅v,i=1∑Lwi=1,wi≥0,
其中:
- 一条转化路径上共有 L 次触达;
- v 是此次转化的总价值(如客单价);
- wi 是第 i 次触达的归因权重。
不同归因策略,就是采用了不同的权重设计:
Last Click:最后一次说了算
wL=1,wi=0(i<L).
所有转化价值都记在最后一次触达头上,简单粗暴但易于落地,因此在工业界非常常见。
First Click:第一印象最重要
w1=1,wi=0(i>1).
适用于“品牌教育型”广告场景:谁先唤起了用户的兴趣,谁就拿全部功劳。
线性归因:雨露均沾
wi=L1,i=1,…,L.
每个触达平分转化价值,适合“难以区分边际贡献”的复杂路径。
时间衰减归因:离转化越近,权重越大
设第 i 次触达发生在时间 ti,转化发生在时间 T,则可令:
w~i=exp(−λ(T−ti)),wi=∑k=1Lw~kw~i,
其中 λ>0 控制“记忆衰减”速度。λ 越大,越偏向于给最近的触达更高权重。
🔬 A/B 测试与统计显著性:这次优化到底“真涨”了吗?
当我们在出价策略、排序模型、Pacing 等模块上做了改动,需要通过 A/B 测试 来验证是否真正提升了 CTR、CVR 或收入指标。
CTR 的估计与置信区间
可以把每一次曝光是否被点击视作一次伯努利试验,Yi∈{0,1},则:
p^CTR=Nimp1i=1∑NimpYi.
在样本量较大时,可用正态近似给出 95% 置信区间:
p^CTR±1.96Nimpp^CTR(1−p^CTR).
两个版本 CTR 差异的显著性
设 A、B 两个版本的 CTR 估计分别为 p^A,p^B,对应曝光数为 nA,nB。则差值
Δ=p^B−p^A
的标准误差约为:
SE(Δ)=nAp^A(1−p^A)+nBp^B(1−p^B).
于是可以构造 z 统计量:
z=SE(Δ)Δ.
若 ∣z∣>1.96,则在约 5% 的显著性水平下认为 B 与 A 的 CTR 有显著差异。
粗略估算最小样本量
若希望检测到“CTR 至少提升 Δ”,且基准 CTR 约为 p,在显著性水平 α 下,每组所需样本量可近似为:
n≈Δ22p(1−p)z1−α/22,
其中 z1−α/2 是标准正态分布上 1−α/2 分位数(如 α=0.05 时约为 1.96)。
🧷 全链路视图:术语之间的关系图
下面用一张简化的 Mermaid 图,总结前文术语在 整条广告链路 上的位置:
这张图里:
- 第三章的模型主要作用在 R / Rank 节点;
- 本章的术语(CPM/CPC/CPA、eCPM、GSP、归因、A/B 测试等)则集中在 Auction / Billing / Report 部分;
- 它们共同构成了一套“从概率到收益,从点击到现金流”的闭环。
📖 延伸阅读
- The Economics of Sponsored Search Advertising – 经典搜索广告经济学综述,系统介绍 GSP/VCG 等拍卖机制。
- Internet Advertising and Ad Auctions – 多校联合的在线广告公开课教材,对计算广告系统做了全面梳理。
- Statistical Methods in Online A/B Testing – 介绍 CTR/CVR 等比例指标的显著性检验与实验设计。
- 各大广告平台公开文档(如 Google Ads、Facebook Ads、阿里妈妈等)中对 CPM/CPC/CPA、eCPM、ROI 的业务解释与实践案例。
🧠 思考题
- 在 CPC 与 CPA 两种计费模式下,如果你的排序模型给出的 pCTR/pCVR 一样,你会如何比较它们在平台收入与广告主 ROI 上的差异?
- 在真实系统中,质量分 qi 往往会惩罚“标题党”和高投诉率广告。你会如何通过数学方式把这些因素融入 Score 公式?
- 对同一个广告系列,若你观测到 CTR 提升但 ROI 下降,可能的原因有哪些?你会从哪些指标入手排查?
- 在预算有限且强约束 ROI 的场景下,你会如何设计 oCPC/oCPA 的出价更新策略,以平衡“快速放量”和“效果稳定”?
- 对一个低日活 App,如果想通过 A/B 测试验证新出价策略是否有效,你会如何估算需要跑多久、积累多少样本量?
🎉 章节小结
本节用一整套“从点击概率到现金流”的数学语言,把计算广告中的常见术语串成了闭环:
- 从 CPM/CPC/CPA/CPT 出发,定义了广告主究竟在为“什么事件”付费;
- 通过 CTR/CVR、eCPM、ROI/ROAS 等指标,把第三章的 pCTR/pCVR 预测,与平台收入、广告主效果联系在一起;
- 借助 GSP/VCG、出价策略与 Pacing,解释了广告排序与预算控制背后的优化目标;
- 通过归因模型与 A/B 测试,完成从“单次展示”到“长期业务决策”的闭环验证。
掌握这些概念与公式,你就完成了从“推荐算法工程师”到“懂钱的推荐/广告工程师”的关键一步:不仅能算出用户会不会点、会不会买,还能回答——这样投放,值不值得?