跳到正文
概念 · 基础

GEO ROI 模型

速览要点

是什么
GEO Wiki 的一份工作框架,并非行业标准:把 AI 搜索可见度的投入产出折算为一个可复核的数字
是行业标准术语吗
不是。厂商 ROI 计算器(BrightEdge、Conductor、Semrush)确实存在,但本条目下文的三价值 × 三行业拆解为 GEO Wiki 原创
三种价值
引用价值(权威累积加少量引流)· 替代流量价值(以答案中的影响替代点击,在零点击场景里兑现)· 品牌权威价值(提及沉淀进模型的实体先验)
三套行业模型
B2B SaaS(销售管道影响型)· B2C 电商(购买影响型)· 媒体(广告加信任加授权)
最常见的 ROI 计算错误
仅统计 AI 引荐转化,会把真实影响低估 5–10 倍:多数价值发生在零会话处,旧的分析仪表盘根本看不到

1. 为什么传统 ROI 计算方法在生成式搜索下失灵

在生成式搜索下,点击不再是搜索的必然结果。仅这一条假设垮掉,建立在它之上的 ROI 计算方法也随之失灵。

零点击搜索 已经讲清楚了前提:Pew Research Center 的一次面板调研发现,页面顶部出现 AI 摘要时,用户点击任意搜索结果的比例约为 8%,没有摘要时约为 15%(接近一半),点击 AI 摘要内部链接的比例仅约 1%。Ahrefs 一份独立的相关性分析给出的数字是:被 AI Overviews 触发的查询中,原本排名第一的页面点击率平均下降约 34.5%。

点击端是这一组数据,宏观端的走向相同。Gartner 在2024 年 2 月发布的预测称传统搜索引擎的查询总量到 2026 年将下降 25%;BrightEdge 在 AI Overviews 上线一年的研究中给出的最新数字是 AI Overviews 现在出现在约一半的搜索结果里;Similarweb 的 2025 年生成式 AI 报告统计到生成式 AI 月度访问量同比增长 76%,2025 年 6 月一个月就贡献了 11 亿次以上的引荐访问(同比 +357%)。

在这样的条件下,标准 SEO 的 ROI 计算方法里有三条假设已经不再成立:

  1. 每一次答案被读取都对应一次可衡量的会话。 多数时候并非如此:答案本身就是那次会话。
  2. Referrer 标头能携带来源信息。 ChatGPT、Claude、Perplexity 的 referrer 行为按客户端、按模式、按月份持续分化;机制层面(UTM 失效模式、服务器日志兜底、末次触点对协助归因)参见 AI 搜索归因
  3. 买家的第一触点发生在站内。 越来越多的情况下,第一触点就是答案本身。分析后台第一次看到这位买家的会话,往往是他后来直接搜索品牌词时的那一次。

实情是:仅统计来自 AI 的引荐转化,会把真实 GEO 价值低估约 5–10 倍,因为多数影响发生在零会话、只有提及、根本不进仪表盘的地方。GEO 指标 给出了填补这条缺口所需的 KPI 词表;本条目要回答的是如何把这些 KPI 折算成可入账的金额。

关于 GEO ROI 模型这个名字的说明:这是 GEO Wiki 的一份工作框架,并非行业标准命名。厂商的 ROI 计算器(BrightEdge、Conductor、Semrush)确实存在,但都使用自有的单分数评分,公式也不对外公开。下文的三种价值 × 三套行业模型为本条目原创的拆解,目的是给 CFO 沟通提供一份可复核的算账依据,而非另立一套行业评分标准。

2. GEO 价值的三种形态

一次生成式答案给品牌带来的价值有三种,三者不可互换。每种价值都映射到不同的归因形式(见 引用 vs 提及 vs 链接)、不同的核心 KPI、不同的兑现周期。

  • 引用价值(Citation Value):内容被 AI 显式引用所带来的价值,一面是权威信号的逐步累积,一面是少量的直接引流通路。要靠 可引用性(Citability) 来获取。
  • 替代流量价值(Substituted Traffic Value):原本在标准 SEO 下会发生的点击,如今通过把你的答案(提及或引用)写进 AI 输出,在零点击的场景里兑现的价值。这一项要从两个方向同时算:一面是借由出现在答案中所获得的影响价值,一面是页面层面被减去的流量。
  • 品牌权威价值(Brand Authority Value):无链接的提及沉淀进模型实体先验所带来的价值。三种价值中最慢、最难度量,在 B2B 中又往往是规模最大的一项。要靠 品牌提及 来获取。

三种价值与三种归因形式的对应:

价值对应的归因形式核心指标(详见 GEO 指标兑现周期
引用价值引用(Citation)引用率(Citation Rate)· 首位引用率(First-Cite Rate)30–90 天
替代流量价值提及或引用答案纳入率(Answer Inclusion Rate)× 估计答案量60–180 天
品牌权威价值提及(含无链接提及)声量份额(Share of Voice)· 提及频次(Mention Frequency)180–540 天

三种价值不能互相替代。引用率高但实体识别度低的品牌处境脆弱:模型一旦迭代,其引流通路就可能随之改变。品牌权威高但从不被引用的品牌,则缺少直接转化的渠道。可辩护的 GEO 项目会同时投入这三项,按行业不同各有侧重,这正是 §4–§6 要逐一量化的内容。

3. 真正需要的五个代理变量

在任何模型之前,先把要采集的清单列清楚:五个变量,其中两个来自自有分析,两个来自第三方工具,一个是申报的假设。

1. 引用率          某一主题下,引用了你域名的答案占比
2. 答案纳入率      是否出现过的二值率
3. 估计答案量      年度搜索量 × AI 搜索采纳率
4. 估计候选影响    每一次提及或引用带来的考虑度提升;申报值
5. 基线转化率      对应 SEO 渠道的实际转化率

各变量的来源:

  • 第 1、2 项来自 GEO 监测厂商:Otterly、Ahrefs Brand Radar、Profound、BrightEdge、Similarweb。GEO 指标的厂商对照矩阵 列出了各家的公式以及对同一指标的不同命名。
  • 第 3 项是最容易估错的乘数。年度品类搜索量来自关键词工具;AI 搜索采纳率参考公开宏观数据:Similarweb 给出的引荐访问同比 +357%、BrightEdge 给出的约 48% AIO 触发率、Gartner 的 2026 年 −25% 预测。一个可辩护的 2026 年估计:品类查询中已有 25%–50% 经过了某种形式的 AI 中介答案。
  • 第 4 项是软变量。每次提及究竟能带来多少考虑度提升,没有公开的行业平均值。保守的 B2B SaaS 默认区间在 1.5%–2.5%,B2C 电商更低,在 0.5%–1%。无论选什么数字,都要明确写下来。
  • 第 5 项来自自有分析后台,是替代流量测算中的 SEO 真值基准。

任何无法直接取数的项,都按申报假设处理,并附上区间。§10 的 CFO 建议书模板会从结构上强制执行这条规则。

4. B2B / SaaS 的 ROI 模型:销售管道影响型

B2B 以提及为主。买家在调研阶段读到 AI 答案、并不点击,三到六个月后才以入站线索的形态浮现出来:往往是一次品牌词搜索、一次直访、或者来自同事的转介(而这位同事自己也曾被你推广过的内容触达过)。Forrester 在 2025 年的一项预测中指出:在使用生成式 AI 辅助过百万美元以上采购决策的 B2B 买家中,超过 90% 反馈结果是正面的;到 2025 年,89% 的 B2B 买家已经在使用生成式 AI。这些数字不会出现在分析后台里,要等到六个月之后,才会以销售管道中的线索形态浮现。

公式(代理变量版)

GEO 销售管道价值 = 年度品类搜索量 × AI 搜索采纳率
                × 答案纳入率
                × 每次提及的候选影响
                × 销售管道转化率
                × 平均合同金额

算例:一家 ACV $80K 的 SaaS 公司,所在品类有 20 万次年度调研阶段查询,其中 35% 出现在 AI 答面,答案纳入率 18%,候选影响按申报区间,端到端的销售管道到 Closed-Won 转化率 14%。

变量保守中位乐观
年度品类搜索量200,000200,000200,000
AI 搜索采纳率25%35%50%
答案纳入率12%18%25%
每次提及的候选影响1.5%2.1%3.0%
销售管道转化率(MQL→Closed-Won)10%14%18%
平均合同金额$80,000$80,000$80,000
年度 GEO 销售管道价值$72K$282K$1.08M

区间故意拉宽,这是可信度的来源,并不代表模型有弱点。仅给出一个 $282K 的点估计站不住脚;表述为最差 $72K、最好 $1.08M、中位 $282K,才站得住。软变量在于候选影响:先申报、再辩护,随后用一个季度的实际数据回过头来校准。

模型不适用的情形:单笔合同太小(ACV 太低,承受不了变量方差)、纯销售线索驱动型且没有任何入站渠道、强监管行业,AI 在这里给出的来源极不稳定,谈不上偏向权威。落地手册参见 GEO for SaaS / B2B

5. B2C / 电商 ROI 模型:购买影响型

B2C 的主导价值正好相反。产品对比、某类目最好的 X 之类的查询会触发清单与评测内容;只有被显式引用(而不仅仅是被提及),才会带来可测量的会话引荐,并且从搜索到转化的时间窗口也比 B2B 短得多。

公式(代理变量版)

GEO 购买价值 = 年度品类搜索量 × AI 搜索采纳率
            × 引用率
            × AI 引荐 CTR
            × 站内转化率
            × AOV × 复购倍数

算例:一家 AOV $85 的美妆品牌,所在品类有 400 万次年度查询,其中 28% 出现在 AI 答面,引用率 6%,AI 引荐 CTR 在 Pew(摘要内点击约 1%)和 Ahrefs(顶部页面被 AIO 压缩约 34.5%)这两条公开边界之间取值,站内转化率 2.4%,含复购的乘数 1.8(一名用户的预期毛收入)。

变量保守中位乐观
年度品类搜索量4,000,0004,000,0004,000,000
AI 搜索采纳率20%28%40%
引用率4%6%10%
AI 引荐 CTR4%9%15%
站内转化率1.8%2.4%3.2%
AOV × 复购倍数$153$153$153
年度 GEO 购买价值$35K$222K$1.18M

这里的软变量是 AI 引荐 CTR。Pew 给出了下界(摘要内点击约 1%),Ahrefs 给出了上界(AIO 压缩之前,SERP 排名第一的基线 CTR 约 15%),一次被引用商业类查询的真实 CTR 落在两者之间。把 AI 引荐 CTR 锚定在这两条已发表的边界之间,远比直接采用某家厂商的市场宣传数字稳妥。

模型不适用的情形:被电商平台主导的标品(最好的 USB-C 数据线之类查询,AI 会直接跳到 Amazon,而非 DTC 站点)、单价很高的考虑型购买(一张 $4000 的床垫、一份 $80K 的 SaaS 合同);后者的购买行为更接近 B2B,已不适用于本模型。落地手册参见 GEO for E-commerce

6. 媒体 / 出版商 ROI 模型:广告 + 信任 + 授权

对出版商而言,这种不对称的方向是反过来的,而且极为显眼。每一次被替代的点击都对应一次可测的亏损(少赚的一次 CPM 展示),而对冲收益(品牌权威、直访、授权)则到来得更慢。2023–2025 年间出版商一侧的诉讼与授权格局,正是这种不对称在法律层面的呈现:

年份事件来源
2023-07AP × OpenAI:第一笔有规模的美国新闻 / AI 授权Axios
2023-12NYT 诉 OpenAI:版权诉讼立案Washington Post
2023-12Axel Springer × OpenAI 合作OpenAI
2024-02Reddit × Google 数据授权Google
2024-05Reddit × OpenAI 合作OpenAI
2024-09Wiley 披露累计 $44M 的 AI 授权收入The Bookseller
2025-09Penske Media 诉 Google:AIO 反垄断诉讼TechCrunch

两份公式:损失侧与收益侧

损失 = 被替代流量 × (RPM × 每次会话页面数)
收益 = (引用频次 × 引用带来的直访权威加成)
     + (品牌词搜索增量 × 直访价值)
     + (可选:授权收入)

算例:一家中型垂类出版商,月度自然访问 1200 万次,漏斗顶部查询上 AIO 触发率约 22%,受影响查询的点击压缩率约 30%,RPM $42,每次会话 1.8 个页面。

月度损失(被替代)= 1200 万 × 22% × 30% × ($42/1000 × 1.8)
                ≈ 1200 万 × 0.066 × $0.0756
                ≈ $59,875 / 月  → ~$718K / 年

对绝大多数没有授权合同的出版商而言,这一损失会盖过收益一侧可能的对冲(直访增量、品牌词搜索增量),除非账面上确实多出一项授权收入。Penske 在诉讼中给出的数字是:AIO 出现在约 20% 与其内容相关的查询中;自 2024 年底起,PMC 的联盟收入跌幅已超过三分之一;这一诉讼正是上述财务信号的法律呈现。可辩护的判断是:多数没有授权合同的出版商,仅靠广告收入这一侧,无法让 AI 搜索成为净正贡献。落地手册参见 GEO for Media

7. 成本端:GEO 的实际投入构成

ROI 是分子与分母两侧共同决定的。成本一侧分三个类目:

类目例子典型形态
一次性审计、schema 实施、llms.txt 加爬虫访问规则、为可分块改写内容结构一个季度集中投入的工程加内容工作
持续监测工具订阅、内容产出节奏、引用追踪、schema 维护仅工具一项就在每月 $300–$3,000+,再加内容团队投入
隐性内部审阅周期、SSR 加 schema 的工程带宽、内容团队被抽调带来的机会成本通常最大,也几乎从不被单独列项

一次性成本一侧的范围划定,参见 GEO Audit;持续成本一侧的工作节奏,参见 AI Citation Tracking。GEO 监测厂商(Profound、Otterly、Ahrefs Brand Radar、Conductor、BrightEdge)的定价:单品牌 SMB 档大约 $300/月起,企业级多品牌加竞争集合可达 $5,000+/月;2026 年厂商定价正在快速变动,向管理层汇报数字前请回到厂商官网逐一核对。

最容易被低估的是隐性成本。原本估计两天就能完成的 schema 上线,往往会因为审查、安全检查、再部署而占掉一个工程师一周;一支被抽调去写权威页的内容团队,原本的博客节奏也会随之中断。

8. 见效周期:现实中的回本曲线

这是每位 CFO 一定会问的问题。实情是:GEO 投资由三个阶段构成,每个阶段的回本速度并不相同。

月份引用价值替代流量价值品牌权威价值
1爬虫重新抓取
3第一组可测引用率答案纳入率早期信号
6引用率开始稳定答案纳入率显著声量份额开始变化
12可与对手做对比显著持续累积
18成熟成熟信号最强

三个阶段必须按顺序推进,因为彼此相互依赖。爬虫访问必须先到位,否则后续环节无从启动。引用提升要等引擎重新采信你的内容。品牌权威则要靠站外信号长期累积,节奏以季度为单位。

GEO 投资一旦停止,已获得的回报也会逐步消退。Ahrefs 的一次新鲜度分析给出的结果是:被 AI 引用过的内容,平均比 Google 自然搜索结果新 25.7%。这道门槛要持续越过,才能持续被引用。Google 在 AI 功能官方文档中也明确把新鲜度列为重要信号之一。GEO 成熟度模型 按成熟度阶段(而非按月份)描述的是同一条曲线。

9. 什么时候 GEO 投资不会回本

以下五种情境中,GEO 投资难以带来实质回报(只有最便宜的技术地基层投入仍然值得做):

  1. 极低搜索量的细分领域。年度答案量过小,任何一类价值都积累不到可测的水平。一个年度查询不足 1 万次的 B2B 品类,连测量噪声都很难压下去。
  2. 被电商平台主导的标品。最好的 USB-C 数据线、最便宜的纸巾之类的查询,会被 AI 直接跳到 Amazon、Wayfair、Walmart;DTC 品牌在结构上很难被引用,被替代的流量也只会流向平台,与你无关。
  3. 纯付费或完全靠产品自驱动增长的模式。一家只靠付费投放或产品内裂变的公司,几乎没有调研阶段的入站漏斗可供 GEO 去拉升;模型里没有可乘的项。
  4. 关系销售已经饱和的 B2B。某些品类的销售管道已被长周期的大客户外呼和老客复购填满,瓶颈在产能而非可见度。
  5. PMF 阶段之前。这一阶段的最高边际回报来自产品本身;在尚无可供被看见之物之前就投资可见度基础设施,属于过早优化。

在 1、3、4、5 这四种情境下,先等一等的判断都是成立的:GEO Audit 中的技术地基层成本足够低,仍可以作为期权式投入先行落地,万一该品类后续加速也不至于错失机会;但完整的内容侧投入可以延后。

还有一点需要单独说明:监管行业(医疗、法律、金融)并不是一个干净的反例。直觉上人们会认为 AI 会服从权威,但实证数据正好相反:AI Overviews 在健康类查询中引用的来源高度杂乱,YouTube 和消费类站点的占比远高于可信的医疗机构。在这种情形下,GEO 的论证更偏向防御性(避免品牌被错误归因),更难建模,但并不能就此跳过。它应被视为另一套独立的模型,而不是可以略过的一类。

10. 把数字摆到 CFO 面前:一页纸投资建议书

一份在实务中真正会被使用的交付物:

GEO 投资建议书 — [公司名] — [季度]

1. 要回答的问题
2. 适用范围(主题 / 引擎 / 区域 / 竞争集合)
3. 三种价值的现状快照
   - 引用价值基线
   - 替代流量价值基线
   - 品牌权威价值基线
4. 销售管道 / 收入模型
   - 保守 / 中位 / 乐观 三档预测
5. 申请的投入金额 + 回本周期
6. 到 [里程碑日期] 之前不会知道的事项

建议书本身的五条规则:

  1. 每一条假设都用数字申报:不要写「我们认为会增长」而不附带一个百分比。
  2. 同时给出保守 / 中位 / 乐观:CFO 对点估计的怀疑,比对区间的怀疑还要更重。
  3. 明确划出现在能测量与半年后才能测量的分界:清晰划线比过度承诺更可信。
  4. 与替代投入做对比:付费广告、内容营销、增聘一位销售,各自都有自己的 ROI 区间;GEO 要与它们一起竞争预算,而不是被单独评估。
  5. 以最小可辩护的首笔承诺收尾:通常是「一个季度的技术地基加一次基线指标快照」,而不是一份多年总预算。靠第一季度的实测数据,再去争取后续更大的预算空间。

三种会立刻削弱可信度的反例:

  • 一个孤立的「AI 可见度评分 = 67/100」式标题数字,跨厂商之间无法解读(公式不公开问题参见 GEO 指标 §4)。
  • 把某一厂商 ROI 计算器的输出直接作为答案:公式不公开。
  • 仅用声量份额(Share of Voice)这一个百分比来代理 ROI:它的分母由人为定义,可被操纵。

把 AI 可见度作为一项严肃的投资命题来对待,学术依据是 Aggarwal et al. 2024arXiv:2311.09735):这篇论文最早提出 GEO 概念,并指出内容改写可将答案可见度提升最多 40%。本条目的 ROI 工作位于这一实证结果的下游:如果这条提升属实,下一个要回答的问题就是它值多少钱、又对谁值钱。

参考资料

宏观采纳数据:

点击压缩证据:

学术依据:

出版商 / 授权地形:

新鲜度与操作语境:

厂商公式参考:

常见问题

为什么标准 SEO 的 ROI 计算方法不能直接套到 GEO 上?
因为 SEO 的 ROI 计算方法默认每一次被读取的答案都对应一次可衡量的会话,也就是分析后台里的一次点击;这条假设在生成式搜索下不成立。Pew Research Center 的面板调研发现,AI 摘要出现时,用户点击任意搜索结果的比例约为 8%(没有摘要时约为 15%,几近减半),点击 AI 摘要内部链接的比例仅约 1%。答案送达了,会话却没有发生。把整条漏斗建立在会话之上,就无从给一个发生在零会话处的产出标价。
三种价值中,哪一种对我的公司最重要?
取决于行业。B2B SaaS 以提及为主:买家在调研阶段读到 AI 答案、不点击,三到六个月后才以入站线索的形态出现,因此品牌权威价值占主导。B2C 电商面向产品对比类查询时以引用为主:唯有被显式引用,才会带来可测量的会话引荐。媒体则相反:每一次被替代的点击都是直接损失的广告收入,主导价值在于你能争取到的那一类对冲收益(直访、品牌词搜索增量、授权)。§4–§6 的三套行业模型会逐一展开。
GEO 投资多长时间能回本?
分三阶段。爬虫访问与技术地基在 0–30 天内回本,因为爬虫会在变更后的几小时内重新抓取。引用提升在 30–120 天内可测,要等引擎对你的内容重新采信。品牌权威累积最慢、规模最大:在 180–540 天里,无链接的提及缓慢沉淀进实体先验。投入一旦停止,内容新鲜度会在几个月内被同行赶上,Ahrefs 对 AI 引用样本的分析显示:被 AI 引用过的内容平均比 Google 自然搜索结果新 25.7%,这道门槛要持续越过,才能持续被引用。
什么情况下 GEO 投资不会回本?
五种反例:年度答案量过小的细分领域(任何价值都无法在测量噪声之上累积起来)、被电商平台主导的标品(AI 会直接跳到 Amazon 等平台,与你无关)、纯付费投放或完全靠产品自驱动增长的模式(没有可被乘的入站漏斗)、关系销售已经饱和的 B2B(瓶颈在产能而非可见度)、PMF 阶段之前(最高边际回报应来自产品本身)。§9 给出了每一种情境的判断方式,并指出便宜的技术地基层在这些反例情境下仍然值得做。
向 CFO 申请预算时,第一步最稳妥的承诺规模是多少?
§10 给出了一页纸建议书的模板。五条规则:每一条假设都用数字申报;同时给出保守 / 中位 / 乐观三档(CFO 对点估计的怀疑比对区间还要更重);明确划出现在能测量与半年后才能测量的分界;与替代投入(付费广告、内容、增聘销售)逐项对比;以最小可辩护的首笔承诺收尾,通常是一个季度的技术地基加一次基线指标快照,而非一份多年总预算。[GEO 审计](/zh/playbooks/geo-audit) 中的技术地基层,正是这种最小首笔承诺的天然形态。
如何把 GEO 的 ROI 与一般 SEO 的 ROI 分开计算?
完全分开做不到,因为两者共用基础设施与内容。更清晰的问法是:哪些增量动作属于 GEO 专有(面向 AI 的 schema、llms.txt、可分块结构、为实体先验做的站外提及),哪些是共用基线(抓取访问、新鲜度、事实密度)。至于如何在归因层把 AI 引荐会话与自然搜索会话机械分离(UTM 失效模式、ChatGPT / Perplexity 的 referrer 差异、服务器日志兜底),参见 [AI 搜索归因](/zh/ai-search-attribution)。

延伸阅读

参考来源

一手来源

  1. Gartner Predicts Search Engine Volume Will Drop 25% by 2026 · Gartner · 2024-02-19
  2. One Year of AI Overviews — BrightEdge research · BrightEdge · 2025-05-14
  3. AI Discovery Surges — Similarweb 2025 Generative AI Report · Similarweb · 2025-12-02
  4. Predictions 2025: Younger Business Buyers And GenAI Will Upend The Status Quo · Forrester · 2024-10-24
  5. Google users are less likely to click on links when an AI summary appears · Pew Research Center · 2025-07-22
  6. GEO: Generative Engine Optimization (Aggarwal et al., KDD '24) · arXiv / KDD '24 · 2024-08-25
  7. GEO: Generative Engine Optimization (KDD '24 Proceedings) · ACM SIGKDD · 2024-08-25
  8. Brand Report KPI Definitions · Otterly.ai
  9. Ahrefs Brand Radar Methodology · Ahrefs
  10. The New York Times sues OpenAI and Microsoft · The Washington Post · 2023-12-27
  11. Axel Springer × OpenAI partnership · OpenAI · 2023-12-13
  12. Expanding our partnership with Reddit · Google · 2024-02-22
  13. OpenAI and Reddit Partnership · OpenAI · 2024-05-16
  14. AI features and your website · Google Search Central · 2025-12-10

二手来源

  1. AI Overviews Reduce Clicks by 34.5% · Ahrefs
  2. Fresh Content: Why Publish Dates Make or Break Rankings · Ahrefs
  3. AP, OpenAI strike news-sharing and technology deal · Axios
  4. Wiley set to earn $44m from AI rights deals · The Bookseller
  5. Rolling Stone owner Penske Media sues Google over AI summaries · TechCrunch
最近更新: 2026-05-27 作者: Ray Yang 主题: 基础