ChatGPT Search
速览要点
- 运营方
- OpenAI
- 创立时间
- 2024
- 官方文档
- https://help.openai.com/en/articles/9237897-chatgpt-search
- 引擎类别
- 检索增强对话型:模型仅在判断需要时才实时检索网络,并非每轮都检索
- 检索默认值
- 按需触发,与 Perplexity 的默认实时检索正好相反
- 爬虫
- OAI-SearchBot(决定搜索可见度)· ChatGPT-User(用户触发的取回)· GPTBot(仅训练,与搜索无关)
- 引用行为
- 内联、可悬停、可点击的来源链接;存在,但比 Perplexity 更稀疏、更不显眼
- GEO 意义
- 分发规模最大的 AI 搜索呈现面;最关键的一步是放行 OAI-SearchBot,而不是屏蔽训练爬虫
爬虫 User-Agent
- OAI-SearchBot
- ChatGPT-User
- GPTBot
1. ChatGPT Search 是什么
ChatGPT Search 是 ChatGPT 内的网络检索能力:在这条路径上,ChatGPT 实时取回网络内容,并给出带内联、可点击来源链接的答案,而不是仅凭模型记忆作答(见 Introducing ChatGPT search)。
在生成式引擎的分类里,ChatGPT Search 属于检索增强对话型:检索按需发生(模型对每个查询自行决定要不要检索),并非默认走的路径。正是这一点,使它与 Perplexity AI 恰好相对:后者属于检索始终开启的原生答案引擎。读这两个条目,最好对照着看。
有三件不同的东西共用这个名字,本条目只讲产品与引擎能力本身:
| 名称 | 是什么 | 详见 |
|---|---|---|
| ChatGPT Search(本条目) | ChatGPT 内的网络检索引擎能力(含旧称「SearchGPT 模式」) | 本条目 |
| OAI-SearchBot / ChatGPT-User / GPTBot | 三个职责不同的 user-agent | AI 爬虫 · 训练侧见 GPTBot |
| OpenAI(公司) | 公司主体、模型、API 商业 | OpenAI |
SearchGPT 是 2024 年 7 月的原型,已在正式发布时并入 ChatGPT Search,不是独立产品(见 §6)。公司主体、模型谱系与 API 商业条款见 OpenAI。
它为什么是优先级最高的平台条目?因为 ChatGPT Search 是分发规模最大的 AI 搜索呈现面:它背靠 ChatGPT 庞大的用户体量,在这里被引用,触达的人群是本系列引擎里最多的。
2. 它如何工作
ChatGPT Search 是通用 Answer Loop 的一个实例:查询理解 → 是否检索的判断 → 实时检索网络 → 采信(grounding)选段 → LLM 合成 → 引用回填。本节只讲平台特有的差异。
| 平台特有的特性 | 它如何改变 GEO |
|---|---|
| 检索按需触发,而非默认 | 模型按每个查询决定是否检索,符合命中资格只是必要条件,查询还必须触发一次取回 |
| 检索结果进入对话上下文 | 来源进入多轮对话,覆盖会随追问累积,而非一条孤立答案 |
| 对话式合成 | 答案以叙述为主,引用是附加而非主干,比 Perplexity 更少、更不显眼 |
| 查询改写 | 用户的自然语言会先被改写再去检索,要对上改写后的意图,而不是用户原话的措辞 |
| 「SearchGPT 模式」 | 优先走检索的同一项能力,不是独立引擎 |
选段这一步,偏向可检索、结构清晰、能直接整段引述的段落。由于检索按需触发,查询覆盖本身就是一个抓手:那些时效性强、问得很具体、足以让模型决定去检索的问题,你得先成为它们的强候选。也正因如此,面向 AI 引用的写作在这台引擎上的分量被抬到最高:能赢下这一次按需取回的,是切题、又便于被取用的内容块(chunk)。
3. 爬虫与 user-agent
OpenAI 运营三个有文档记载的 user-agent,职责完全不同。把它们混为一谈是本引擎上最常见的 GEO 失误,下面把它们一一分清。
| User-agent | 官方用途 | robots.txt | 触发场景 |
|---|---|---|---|
OAI-SearchBot | 在 ChatGPT 搜索功能中收录并链接站点 | 遵守 robots.txt,禁止它则不会在搜索中出现 | 后台搜索抓取 |
ChatGPT-User | 为 ChatGPT / Custom GPTs 的某个用户操作访问页面 | 由用户发起,robots.txt 可能不套用;不用于决定搜索收录 | 真实用户的提问需要该页面 |
GPTBot | 抓取可能用于训练基础模型的内容 | 遵守 robots.txt,纯粹是训练退出开关,与搜索无关 | 后台训练抓取 |
这是本引擎上 GEO 最关键的一点。OpenAI 文档写明,三项设置相互独立。屏蔽 GPTBot,也就是大家默认拿来阻止 AI 训练的那个动作,并不会把你从 ChatGPT Search 中移除,只有禁掉 OAI-SearchBot 才会。不少站点退出训练后,误以为自己也退出了搜索,其实没有;反过来的失误同样常见:本想屏蔽训练,却一并禁掉了 OAI-SearchBot,结果不声不响地从搜索里消失了。
三者都发布 IP 段 JSON 端点(searchbot.json、gptbot.json、chatgpt-user.json)供白名单校验(见 Overview of OpenAI Crawlers 与 Publishers and Developers FAQ)。放行、校验、审计的细节见 AI 爬虫;训练爬虫的伦理与退出机制见 GPTBot。
4. 引用偏好
这一节对 GEO 的价值最大。由于检索按需触发、引用更稀疏,一旦真的检索了,什么会被引用这个问题就既关键又稀缺。
| 高频被引 | 高频被跳过 | 它隐含的信号 |
|---|---|---|
| 结构清晰、标题层级分明的页面 | 取回时无法渲染的、强依赖 JavaScript 的内容 | 服务端渲染、保证可检索,见 AI 爬虫 |
| 具体的事实、数字、日期 | 没有可取用断言的空泛营销文案 | 事实密度,见 GEO |
| 自包含、可直接引述的段落 | 只有在整页语境里才说得通的内容 | 内容块独立性,见 面向 AI 引用的写作 |
| 针对时效性问题、内容新近且标了日期的材料 | 陈旧或没有日期的页面 | 时效性;也是成为「能触发检索的查询」的强候选所需要的 |
| 该话题下的权威域 | 登录墙或付费墙后的正文 | 来源权威度与开放可读 |
和其他类别只需对比一句:相比原生答案引擎 Perplexity AI,ChatGPT Search 单条答案的引用更少、更不显眼;和 SERP 内嵌型的 Google AI Overviews 或 Bing Copilot 又各不相同。引用密度更低、又按需触发,意味着这里每一个被引的位次都更稀缺,所以两件事都得做:内容在结构上便于取用,同时覆盖那些能触发检索的查询。上表每一行都对应一个 GEO 抓手,完整内容在各自的专条里。
5. API 与接入
ChatGPT Search 没有 Sonar 那样面向消费者的搜索 API。能用程序调用、与之最接近的,是 OpenAI API 的网络检索工具(Responses API 里的 web_search / web_search_preview):它让模型实时访问网络,并把答案背后的来源一并返回。
| 返回字段 | 内容 |
|---|---|
| message content | 合成后的答案(默认带内联引用) |
url_citation 注解 | 逐引用对象:url、title、start_index、end_index、type |
sources | 模型查阅过的完整 URL 列表,通常多于被引集合 |
OpenAI 要求,向终端用户展示结果时「内联引用必须清晰可见且可点击」(见 Web search 指南)。对 GEO 有一点要注意:这个 API 网络检索工具,跟消费端 ChatGPT Search 的排序并不一一对应,它只是最接近、又能拿来度量的替代,而非产品界面本身。关键在于:url_citation / sources 让「我的内容有没有被引用」变成一个可以自动化去查的问题,AI 引用追踪正是基于这一点。完整 API 参考请查阅官方文档。
6. 历史与时间线
这里只记录与 GEO 相关的里程碑,也就是会改变检索、引用或可见度机制的那些变更。模型版本史与公司的商业故事见 OpenAI,训练爬虫之争见 GPTBot。
| 日期 | 里程碑 | 对 GEO 的意义 |
|---|---|---|
| 2024 年 7 月 | SearchGPT 原型 | OpenAI 首个公开搜索呈现面,确立「搜索 ≠ 训练」的原则 |
| 2024 年 10 月 | ChatGPT Search 正式发布 | SearchGPT 并入 ChatGPT,内联可点击引用成为标配 |
| 2024 年 12 月 | 免费登录用户开放 | 分发面扩大,搜索触达不再受 Plus 限制 |
| 2025 年 2 月 | 免登录、无需注册 | 最大分发面,chatgpt.com 上任何人都能得到带引用的答案 |
| 2025 年 4 月 | 搜索内购物 | 商品与电商查询进入被引呈现面,结构化商品数据开始重要 |
| 2025 年 10 月 | ChatGPT Atlas 浏览器 | 一个 ChatGPT 原生浏览器,被引用开始替代传统点击 |
(日期取自 OpenAI 官方博客与 Search Engine Land、Cybernews 报道;SearchGPT 没有单独的下线公告,原型页面加上正式发布博文即是权威记录。)
7. 实测引用行为
这里有必要把适用范围说清楚。GEO 奠基基准(Aggarwal 等,KDD ‘24)用的是内部装置加 Perplexity.ai 作为实测引擎基线,不是 ChatGPT Search。没有任何学术基准把本引擎作为主要的实测基线,本条目的 relatedPapers 因此一直留空:我们不去内链一篇并未测试过本引擎的论文。
由此能给出的,只有以下几点:
- 跨引擎的证据,请回到它本来的来源去看。 已经做过基准测试的实测数字在 Perplexity AI 条目里;同一类内容改写到这里,表现并不相同,不应跨引擎硬套。
- 把引用行为当成变量,别当成常量。 按需检索意味着触发率本身就是未知数:一个查询会不会被检索都在变,要等真的检索了,才轮到哪些来源被引这一层。
- 只能给方向,给不了一个数字。 「ChatGPT Search 把可见度提升 X%」这种说法没有站得住脚的依据,不要去编。这里要做的是持续度量,而不是默认它已经成立。
抽样查询、抽取被引集合、长期追踪自己的份额,这一整套度量做法正是 AI 引用追踪;§5 里的 url_citation 代理,正是它在本引擎上能自动化的原因。
8. 针对 ChatGPT Search 的优化
下面是 ChatGPT Search 上特别要优先做的事,不是完整的 GEO 全流程,后者在 GEO 与各 playbook 里详述。
| 打法 | 为什么在 ChatGPT Search 上更关键 | 治理条目 |
|---|---|---|
不要误屏蔽 OAI-SearchBot(核查 robots.txt / WAF) | 一条写错的反训练规则会悄无声息把你移出搜索 | AI 爬虫 |
| 服务端渲染、可抓取的 HTML | 按需取回无法引用它渲染不出来的内容 | AI 爬虫 |
| 自包含、可引述的内容块 | 引用位次更少,只有最易取用的段落胜出 | 面向 AI 引用的写作 |
| 高密度的事实 / 数字 / 日期 | 按需检索偏好具体、可归属的断言 | GEO |
| 覆盖那些会触发检索的时效性、具体查询 | 查询若从不检索,可引用性无从谈起 | GEO |
| 用 API 网络检索代理追踪自己的被引份额 | 引用可抽取,要度量而非靠猜 | AI 引用追踪 |
要划清范围:这是一份平台打法清单,不是端到端的方法,更深的内容都在各自的专条里展开。爬虫核查排在第一位,因为它是本引擎独有、发生最频繁、代价也最大的失误。
9. ChatGPT Search 对 GEO 为何重要
ChatGPT Search 触达的受众最广、但被采信最稀疏、且按需。它的 GEO 价值,等于规模乘以难度:能看到这次引用的受众最多,却也最容易因为一条配错的爬虫规则而落得零曝光。它与 Perplexity AI 恰好相对,方向相反,对照着看最清楚。
| 引擎特性 | 它放大(或抑制)的 GEO 抓手 | 治理条目 |
|---|---|---|
| 分发面最大 | 触达,这里的引用受众最广 | GEO |
| 按需检索 | 查询覆盖,你必须触发检索,而非仅有资格 | GEO |
| 三爬虫之分(OAI-SearchBot ≠ GPTBot) | 抓取访问,代价最高、最易出错的控制项 | AI 爬虫 · GPTBot |
| 引用更稀疏且按需 | 结构性可取用性,稀缺位次抬高门槛 | 面向 AI 引用的写作 |
ChatGPT Search 是检索增强对话型里分发规模最大的实例。把这台引擎想清楚,也就是按需检索、对的爬虫、稀缺的引用位次,你触达的受众就是 GEO 里最广的;想错了,再大的呈现面也什么都不会返回给你。
参考资料
OpenAI 官方文档(截至 2026-05):
- Introducing ChatGPT search(2024-10-31)· ChatGPT search — Help Center
- SearchGPT prototype(2024-07-25)
- Overview of OpenAI Crawlers · Publishers and Developers FAQ
- Web search — OpenAI API guide
- Shopping research in ChatGPT(2025-04-28)· Introducing ChatGPT Atlas(2025-10-21)
业界:
- Search Engine Land — OpenAI’s SearchGPT to be integrated into ChatGPT
- Cybernews — OpenAI ChatGPT search available to all logged-out users(2025 年 2 月)
常见问题
ChatGPT Search 和 ChatGPT 是一回事吗?
屏蔽 GPTBot 会让我从 ChatGPT Search 中消失吗?
ChatGPT Search 会像 Perplexity 那样给出引用吗?
怎么让内容被 ChatGPT Search 引用?
SearchGPT 还在吗?
相关
参考来源
一手来源
- Introducing ChatGPT search · OpenAI · 2024-10-31
- ChatGPT search (Help Center) · OpenAI
- SearchGPT prototype · OpenAI · 2024-07-25
- Overview of OpenAI Crawlers · OpenAI
- Publishers and Developers FAQ · OpenAI
- Web search (OpenAI API guide) · OpenAI
- Shopping research in ChatGPT · OpenAI · 2025-04-28
- Introducing ChatGPT Atlas · OpenAI · 2025-10-21
二手来源
- OpenAI SearchGPT to be integrated into ChatGPT · Search Engine Land
- OpenAI ChatGPT search available to all logged-out users · Cybernews