平台 · 引擎

ChatGPT Search

速览要点

运营方: OpenAI
创立时间: 2024
官方文档: https://help.openai.com/en/articles/9237897-chatgpt-search
引擎类别: 检索增强对话型：模型仅在判断需要时才实时检索网络，并非每轮都检索
检索默认值: 按需触发，与 Perplexity 的默认实时检索正好相反
爬虫: OAI-SearchBot（决定搜索可见度）· ChatGPT-User（由用户操作触发的访问）· GPTBot（仅用于训练，与搜索无关）
引用行为: 提供内联、可悬停、可点击的来源链接；但相比 Perplexity 更稀疏，也更不显眼
GEO 意义: 分发规模最大的 AI 搜索呈现面；GEO 上最关键的一步是放行 OAI-SearchBot，而不是屏蔽训练爬虫

爬虫 User-Agent

OAI-SearchBot
ChatGPT-User
GPTBot

1. ChatGPT Search 是什么

ChatGPT Search 是 ChatGPT 内的网络检索能力：被触发之后，ChatGPT 会实时检索网络，并在答案中附上可点击的内联来源链接，而不再只是依赖模型记忆作答（见 Introducing ChatGPT search）。

在生成式引擎的分类里，ChatGPT Search 属于检索增强对话型：检索是按需发生的（模型对每个查询自行判断要不要去搜），而不是每一轮对话都默认检索。也正因为如此，它与 Perplexity AI 恰好相对，后者是检索始终开启的原生答案引擎。

有三件容易混淆的事，需要分清：

名称	是什么
ChatGPT Search	ChatGPT 内的网络检索引擎能力（含旧称「SearchGPT 模式」）
OAI-SearchBot / ChatGPT-User / GPTBot	三个职责不同的 user-agent；细节见 AI 爬虫，训练爬虫单独见 GPTBot
OpenAI（公司）	公司主体、模型与 API 商业，见 OpenAI

SearchGPT 是 2024 年 7 月的原型，已在正式发布时并入 ChatGPT Search，不再是独立产品（见 §6）。公司主体、模型谱系与 API 商业条款的完整说明在 OpenAI。

在所有 AI 搜索引擎中，ChatGPT Search 的分发规模最大：依托 ChatGPT 的庞大用户体量，在这里被引用所触达的受众，也比同类引擎都要广。

2. 它如何工作

ChatGPT Search 是通用 Answer Loop 的一个具体实例：查询理解 → 是否检索的判断 → 实时检索网络 → 采信（grounding）选段 → LLM 合成 → 引用回填。其中真正区别于其他引擎的几个关键点如下。

平台特有的特性	它如何改变 GEO
检索按需触发，不是默认开启	模型逐个查询判断要不要去搜；内容仅仅「有资格被命中」还不够，查询本身还必须触发一次检索
检索结果进入对话上下文	来源会被带入多轮对话，覆盖随追问累积，而不是停留在某一条孤立的答案上
对话式合成	答案以叙述为主，引用属于辅助而非主体，整体上比 Perplexity 更少、也更不显眼
查询改写	用户的自然语言会先被改写后再去检索，因此要对齐的是改写后的意图，而非用户原话的字面措辞
「SearchGPT 模式」	强制优先检索的同一项能力，并非另一台独立的引擎

选段这一步明显偏向可被检索、结构清晰、能整段直接引述的段落。由于检索是按需的，查询覆盖本身就是一个关键抓手：对那些时效性强、问法具体、足以让模型决定去检索的问题，先成为强候选来源才有后续的引用可言。这也是为什么面向 AI 引用的写作在 ChatGPT Search 上格外关键：只有内容切题、又便于被模型取用的内容块（chunk），才有机会在按需检索中胜出。

3. 爬虫与 user-agent

OpenAI 维护着三个有官方文档说明的 user-agent，职责完全不同。把它们混为一谈，是 ChatGPT Search 上最常见的 GEO 失误。

User-agent	官方用途	robots.txt	触发场景
`OAI-SearchBot`	在 ChatGPT 搜索功能中收录并链接站点	遵守 robots.txt，禁止它就不会出现在搜索中	后台搜索抓取
`ChatGPT-User`	为 ChatGPT / Custom GPTs 中某次具体的用户操作访问页面	由用户发起，robots.txt 未必适用；与搜索收录的判定无关	真实用户的提问需要查阅该页面
`GPTBot`	抓取可能用于训练基础模型的内容	遵守 robots.txt，纯粹是训练退出开关，与搜索无关	后台训练抓取

这是 ChatGPT Search 上 GEO 最关键的一条。OpenAI 文档已经写明，三项设置彼此独立。屏蔽 GPTBot（也就是通常用来拒绝 AI 训练抓取的那条规则），并不会把站点从 ChatGPT Search 中移除；真正会导致这种后果的，是禁掉 OAI-SearchBot。不少站点退出训练之后，误以为搜索也一并退出，事实上并没有；反过来的失误同样常见：本意是屏蔽训练，却连带把 OAI-SearchBot 也封了，结果在搜索中悄然消失。

三者都各自发布 IP 段的 JSON 端点（searchbot.json、gptbot.json、chatgpt-user.json）供白名单核验（见 Overview of OpenAI Crawlers 与 Publishers and Developers FAQ）。如何放行、如何核验、如何审计，详见 AI 爬虫；训练爬虫相关的伦理与退出机制则见 GPTBot。

4. 引用偏好

检索按需触发，且引用本身就稀疏，这意味着：一旦真的发生检索，到底什么样的内容会被引用，就成了一件既关键又稀缺的事情。

高频被引	高频被跳过	背后的信号
结构清晰、标题层级分明的页面	抓取时无法渲染、强依赖 JavaScript 的内容	服务端渲染，保证内容可被检索，见 AI 爬虫
具体的事实、数字、日期	缺乏可直接取用断言的空泛营销文案	事实密度，见 GEO
自包含、可整段引述的段落	只有放在整页语境中才能成立的内容	内容块独立性，见面向 AI 引用的写作
针对时效性话题、内容新近且标注日期的材料	陈旧或没有日期的页面	时效性，也是成为「能触发检索的查询」强候选的前提
该话题下的权威域	登录墙或付费墙之后的正文	来源权威度与开放可读性

横向比较一下：相比原生答案引擎 Perplexity AI，ChatGPT Search 单条答案中的引用更少，也更不显眼；与 SERP 内嵌型的 Google AI Overviews 或 Bing Copilot 也不同。引用密度更低又按需触发，意味着每一个可被引用的位置都更稀缺；因此优化必须同时做两件事：让内容在结构上便于被模型取用，并尽量覆盖那些足以触发检索的查询。

5. API 与接入

ChatGPT Search 没有 Sonar 那样面向消费者的搜索 API。可用程序化调用、且与之最为接近的，是 OpenAI API 提供的网络检索工具（Responses API 中的 web_search / web_search_preview）：它让模型实时访问网络，并把答案所依据的来源一并返回。

返回字段	内容
message content	合成后的答案（默认带内联引用）
`url_citation` 注解	逐引用的对象：`url`、`title`、`start_index`、`end_index`、`type`
`sources`	模型查阅过的完整 URL 列表，通常比被引集合更长

OpenAI 要求，向终端用户展示结果时，「内联引用必须清晰可见且可点击」（见 Web search 指南）。从 GEO 的角度还有一点尤其需要留意：这个网络检索 API 工具，与消费端 ChatGPT Search 的排序并不严格对应，它只是一个最为接近、且能用于度量的替代，并非产品界面本身。它真正的价值在于：url_citation 与 sources 把「我的内容有没有被引用」转化成了一个可以自动化检测的问题，AI 引用追踪正是基于此构建的。

6. 历史与时间线

下表只收录与检索、引用或可见度机制直接相关的几个里程碑。完整的模型版本演进与公司商业脉络见 OpenAI；围绕训练爬虫的争论则见 GPTBot。

日期	里程碑	对 GEO 的意义
2024 年 7 月	SearchGPT 原型	OpenAI 首个公开的搜索呈现面，确立了「搜索 ≠ 训练」这一原则
2024 年 10 月	ChatGPT Search 正式发布	SearchGPT 并入 ChatGPT，可点击的内联引用成为标配
2024 年 12 月	向免费登录用户开放	分发范围扩大，搜索触达不再受 Plus 订阅限制
2025 年 2 月	免登录、无需注册	分发上限完全打开，chatgpt.com 上任何访客都可获得带引用的答案
2025 年 4 月	搜索内购物	商品与电商查询纳入被引范围，结构化商品数据自此变得重要
2025 年 10 月	ChatGPT Atlas 浏览器	ChatGPT 原生浏览器发布，传统点击开始让位于被引用

（日期取自 OpenAI 官方博客与 Search Engine Land、Cybernews 报道；SearchGPT 没有单独的下线公告，原型页面加上正式发布博文就是权威记录。）

7. 实测引用行为

先说清楚一个适用范围的问题。GEO 领域的奠基基准（Aggarwal 等，KDD ‘24）用的是一套内部测试系统，并以 Perplexity.ai 作为实测引擎的基线，而非 ChatGPT Search。目前也尚无任何学术基准把 ChatGPT Search 作为主要的实测对象。也正因如此，这里有意不去引用相关论文：从未在 ChatGPT Search 上做过测试的论文，并不适合作为本节的支撑。

由此能给出的结论只有以下几条：

跨引擎的证据，回到原始引擎的语境去看。 已有的基准测试数据见 Perplexity AI 条目；同一类内容换到 ChatGPT Search 上未必同样表现，结论不应在引擎之间生搬硬套。
把引用行为视为可变量，不要当成稳定值。 按需检索意味着触发率本身就是不确定的：一个查询会不会被检索都还说不准，至于哪些来源被引那是更后一层的事。
只能给出方向，给不出确切数字。 「ChatGPT Search 把可见度提升 X%」这类说法没有可靠依据，不要凭空给出。要做的是持续度量，而不是把可见度当作既成事实。

抽样查询、抽取被引集合、长期追踪自己的份额，这一整套度量办法对应的就是 AI 引用追踪；§5 中提到的 url_citation 作为可替代的度量信号，正是这套做法能在 ChatGPT Search 上自动化的关键所在。

8. 针对 ChatGPT Search 的优化

打法	为什么在 ChatGPT Search 上更关键	治理条目
不要误屏蔽 `OAI-SearchBot`（核查 robots.txt / WAF）	一条写错的反训练规则，足以让站点在搜索中无声地消失	AI 爬虫
服务端渲染、可抓取的 HTML	检索抓不到、渲染不出的内容，自然无从被引用	AI 爬虫
自包含、可整段引述的内容块	引用位置稀缺，只有最便于取用的段落才能胜出	面向 AI 引用的写作
高密度的事实 / 数字 / 日期	按需检索更偏好具体、可归属来源的断言	GEO
覆盖那些会触发检索的时效性、具体查询	查询若从不触发检索，可引用性也就无从谈起	GEO
借助 API 网络检索这一替代度量，追踪自己的被引份额	引用本身是可抽取的，应当度量而非凭感觉	AI 引用追踪

爬虫核查之所以列在第一位，是因为它属于 ChatGPT Search 独有、最频繁出现、代价也最大的那一类失误。

9. ChatGPT Search 对 GEO 为何重要

ChatGPT Search 所触达的受众最广，但被采信的概率却既稀疏，又按需触发。它在 GEO 上的价值，等于规模乘以难度：能看到引用的人最多，但也最容易因为一条配置错误的爬虫规则而曝光归零。它与 Perplexity AI 在方向上恰好相对。

引擎特性	它放大（或抑制）的 GEO 抓手	治理条目
分发规模最大	触达：在这里被引用所能影响的受众最广	GEO
按需检索	查询覆盖：内容不仅要有资格被引用，还得先把检索触发起来	GEO
三个爬虫各司其职（OAI-SearchBot ≠ GPTBot）	抓取放行：代价最高、最易出错的一项控制	AI 爬虫 · GPTBot
引用更稀疏且按需	结构性的可取用性：可用位置稀缺，入选门槛更高	面向 AI 引用的写作

ChatGPT Search 是检索增强对话型引擎中分发规模最大的实例。如果能正确理解它的三件事（按需检索、正确放行对应的爬虫、引用位置高度稀缺），它所能为你带来的受众，是整个 GEO 领域中最广的；理解错了，再大的呈现面对你也毫无意义。

参考资料

OpenAI 官方文档（截至 2026-05）：

Introducing ChatGPT search（2024-10-31）· ChatGPT search — Help Center
SearchGPT prototype（2024-07-25）
Overview of OpenAI Crawlers · Publishers and Developers FAQ
Web search — OpenAI API guide
Shopping research in ChatGPT（2025-04-28）· Introducing ChatGPT Atlas（2025-10-21）

业界：

Search Engine Land — OpenAI’s SearchGPT to be integrated into ChatGPT
Cybernews — OpenAI ChatGPT search available to all logged-out users（2025 年 2 月）

常见问题

ChatGPT Search 和 ChatGPT 是一回事吗？

不是。它是 ChatGPT 内的一项能力，不是独立产品。普通的 ChatGPT 只依赖模型记忆作答；ChatGPT Search 则会实时检索网络，并在答案中给出可点击的内联来源。检索是按需触发的：模型对每个查询自行判断要不要去搜。在 GEO Wiki 的分类里，它属于检索增强对话型的生成式引擎，与 Perplexity 这类原生答案引擎恰好相对。

屏蔽 GPTBot 会让我从 ChatGPT Search 中消失吗？

不会，这恰恰是在 ChatGPT Search 上最常见的 GEO 失误。GPTBot 是基础模型的训练爬虫；决定能否出现在 ChatGPT Search 中的，是另一个 user-agent：OAI-SearchBot。OpenAI 文档已明确说明，这三项设置彼此独立：可以禁止 GPTBot（退出训练），同时放行 OAI-SearchBot（保留搜索可见度）。真正会让站点在 ChatGPT Search 中消失的，是禁掉 OAI-SearchBot。

ChatGPT Search 会像 Perplexity 那样给出引用吗？

会引用，但密度更低。搜索答案中带有内联、可悬停、可点击的引用，链接回源页面。但由于检索按需触发、答案以对话形式呈现，单条答案的引用通常更少，也不像 Perplexity 那种编号、常驻的引用那么显眼。引用行为因查询而异，不是一个固定值，需要逐个查询去实测。

怎么让内容被 ChatGPT Search 引用？

先做到可被检索：在 robots.txt 中放行 OAI-SearchBot，并采用服务端渲染。再做到便于被模型取用：自包含的内容块、具体的事实、数字与日期、可整段引述的句子。由于检索是按需的，查询覆盖也同样重要：对那些时效性强、问法具体、足以触发一次检索的问题，要先成为强候选来源。具体打法见 [生成式引擎优化](/zh/generative-engine-optimization) 与 [面向 AI 引用的写作](/zh/playbooks/writing-for-ai-citation)。

SearchGPT 还在吗？

作为独立产品已经不在了。SearchGPT 是 2024 年 7 月推出的原型，其功能在 2024 年 10 月 31 日随 ChatGPT Search 正式发布而一并并入。没有一个可以单独优化的 SearchGPT 应用，所谓「SearchGPT 模式」只是同一项检索能力在 ChatGPT 内的旧称。

参考来源

一手来源

Introducing ChatGPT search · OpenAI · 2024-10-31
ChatGPT search (Help Center) · OpenAI
SearchGPT prototype · OpenAI · 2024-07-25
Overview of OpenAI Crawlers · OpenAI
Publishers and Developers FAQ · OpenAI
Web search (OpenAI API guide) · OpenAI
Shopping research in ChatGPT · OpenAI · 2025-04-28
Introducing ChatGPT Atlas · OpenAI · 2025-10-21

二手来源

OpenAI SearchGPT to be integrated into ChatGPT · Search Engine Land
OpenAI ChatGPT search available to all logged-out users · Cybernews