跳到正文
平台 · 引擎

Perplexity AI

速览要点

运营方
Perplexity
创立时间
2022
官方文档
https://docs.perplexity.ai
引擎类别
原生答案引擎:实时检索网络是默认路径,而非附加能力
引用行为
每条答案默认都带编号、可点击的内联引用(citation)
爬虫
PerplexityBot(建索引)· Perplexity-User(用户触发的实时取回)
程序化接入
Sonar API,返回答案以及 citations / search_results 来源数组
GEO 意义
GEO 奠基基准论文(Aggarwal 等,KDD '24)采用的实测引擎基线

爬虫 User-Agent

  • PerplexityBot
  • Perplexity-User

1. Perplexity AI 是什么

Perplexity 自我定位为答案引擎(answer engine),既不是搜索引擎,也不是聊天机器人。它「实时检索互联网」,并把「答案直接给在前面,附带来源与引用(citation)」,而不是给一列链接(见 Perplexity 官方技术 FAQ)。

生成式引擎的分类里,Perplexity 属于原生答案引擎——实时检索是默认方式,每条答案天生引用密集。Perplexity 之所以是优先级最高的平台条目,正因为采信(grounding)在这里看得见,用它来讲清引用 vs 提及模型最为直观。

同名的有三件不同的东西,先分清楚:

名称是什么
Perplexity AI产品 / 生成式引擎本体(即本页)
PerplexityBot / Perplexity-User检索爬虫与 2024 年的 robots.txt 争议——见 PerplexityBot
Perplexity(公司)公司主体、融资、Pro 订阅——见 Perplexity(公司)

2. 它如何工作

Perplexity 是通用 Answer Loop 的一个实例:查询改写或扩展 → 实时检索网络 → 采信(grounding)选段 → LLM 合成 → 编号引用回填。下面列出这个平台特有的差异

平台特有的特性它如何改变 GEO
默认就实时检索能否被命中取决于一次实时取回,而非一份预建索引,更接近「此刻是否可检索」而非「排名第几」
后端模型可替换合成所用的 LLM 会变,你能掌控的只是被检索、被采信这一步,而非模型本身
Pro Search(多步检索)把一个问题拆成多个子查询,比拼话题覆盖广度,而非某个精确匹配的页面
Focus / 来源域过滤用户可限定来源(如学术或社交),因此某一领域内的权威度会被单独筛出
Spaces持久化集合会反复重新检索来源,长期保持可检索会持续累积优势

选段这一步偏好可检索、结构清晰、可直接引述的段落。可引用性在 Perplexity 上之所以格外吃重,根源就在这里:相比任何 SERP 内嵌型引擎,这里真正算赢的是一个可被取用的内容块(chunk),而不是一个排名靠前的页面。

3. 爬虫与 user-agent

Perplexity 运营两个有文档记载的爬虫——下面是摘要与速查;爬虫识别、IP 校验、以及 2024 年的 robots.txt 争议与事件时间线,见 PerplexityBot

User-agent用途robots.txt典型触发场景
PerplexityBot在 Perplexity 搜索结果中收录并链接站点,用于训练基础模型文档说明遵守 robots.txt,禁止它则页面正文不被收录后台建索引的抓取
Perplexity-User为回答某个具体用户问题而访问页面由用户发起,因此通常不套用 robots.txt 限制真实用户的提问需要这个页面

两个 user-agent 都发布了 IP 段 JSON 端点,可用来做白名单校验(见 Perplexity CrawlersPerplexity 如何遵守 robots.txt)。是否放行、怎样校验真伪、以及围绕访问控制的争论,都属于审计议题,见 PerplexityBot

4. 引用偏好

这一节对 GEO 的价值最大。由于 Perplexity 天生引用密集,它倾向于引用什么、又跳过什么,可以直接转化为可执行的动作。

高频被引高频被跳过它隐含的信号
结构清晰、标题层级分明的页面取回时无法渲染的、强依赖 JavaScript 的内容服务端渲染、保证可检索,见 PerplexityBot
具体的事实、数字、日期没有可取用断言的空泛营销文案事实密度,见 GEO
自包含、可直接引述的段落只有在整页语境里才说得通的内容内容块独立性,见 可引用性
新近、带日期的材料陈旧或无日期的页面时效性与可见的日期
该话题下的权威域登录墙或付费墙后的正文来源权威度与开放可读

和其他类别的引擎对比,一句话就够:相比 Google AI Overviews 这类 SERP 内嵌型引擎,Perplexity 单条答案给出的引用更多;相比 ChatGPT Search 这类检索增强对话型,它把引用呈现得更显眼。引用密度越高,结构性可引用性在这里能起的作用就比在别处都大。

5. API 与接入

Sonar API 是程序化接口:它既返回合成后的答案,返回答案背后的来源。Perplexity 对 GEO 之所以可度量,根源正在于此。

返回字段内容
choices合成后的答案,沿用 OpenAI 兼容的响应结构
citations用于生成本次答案的来源 URL
search_results逐来源对象:titleurldatesnippetsource

模型档位从 sonar(轻量的带采信检索)、sonar-pro(复杂查询与追问),到 sonar-reasoning-prosonar-deep-research(见 Sonar 模型Chat Completions 参考)。对 GEO 而言,重点不在有哪些模型可选,而在 citationssearch_results 让「我的内容是否被引用」变成一个可以自动化查询的问题,AI 引用追踪 也正是据此把这台引擎作为基准。完整的 API 参考请查阅官方文档。

6. 历史与时间线

这里只记录与 GEO 相关的里程碑,即影响检索、引用或可见度机制的变更。融资轮次见 Perplexity(公司),爬虫争议时间线见 PerplexityBot

日期里程碑对 GEO 的意义
2022 年 12 月公开上线首个进入主流的引用密集型答案引擎
2023–2024 年Copilot 演进为 Pro Search多步检索,胜出的是话题覆盖而非单个页面
2024 年 5 月PagesPerplexity 自动生成的页面本身就是一类带来源引用的内容呈现面
2025 年 1 月Sonar / Sonar Pro API引用变得可程序化抽取,GEO 度量得以规模化
2025 年 2 月Deep Research长篇多源报告抬高了对来源权威度与深度的门槛
2025 年 9 月Search API一个与对话补全分开、专用于检索的接口

(日期取自 Perplexity 官方博客与 TechCrunch,其中 Copilot 更名 Pro Search 的月份为近似值。)

7. 实测引用行为

Perplexity 不只是一台引擎,它是GEO 研究反复选用的那台实测引擎基线:它的引用可程序化抽取,因而结果可复现。

奠基论文 GEO: Generative Engine Optimization(Aggarwal 等,KDD ‘24;arXiv:2311.09735)测试了两台引擎:一套内部 GPT-3.5 装置,以及作为真实世界检验的 Perplexity.ai。内容实质类改写,即加入引用、统计数据、引述,在内部装置上把论文的可见度指标提升至多约 40%,但在真实的 Perplexity.ai 上仅至多约 22%

按论文自身的口径,这个数字要放在它的适用范围内来理解:

  • 它是一个分方法、分领域的上限,针对的是 2023–2024 形态的引擎,不能当作普遍可期的结果。
  • 不能跨引擎、跨领域外推,同样的改写在 ChatGPT SearchGoogle AI Overviews 上表现并不一样。
  • C-SEO Bench(Puerto 等)给出了反证:一旦多方对同一引擎同时做优化,许多对话式 SEO 改写会失效,甚至适得其反,单方提升只是上限,不是均衡结果。

该采用的是方向,而不是那个具体数字。 还有一处佐证:Liu 等的 Evaluating Verifiability in Generative Search Engines 发现,早期答案引擎的引用往往并不严谨。这也是另一个理由,说明引用行为要持续度量,不能默认它成立,AI 引用追踪 一贯强调的也正是这一点。

8. 针对 Perplexity 的优化

下面是 Perplexity 特有的优先事项;完整的 GEO 全流程见 GEO 与各 playbook。

打法为什么在 Perplexity 上更有效完整内容见
自包含、可引述的内容块天生引用密集,可取用的段落直接胜出可引用性
高密度的事实 / 数字 / 日期选段偏好具体、可归属的断言GEO
服务端渲染、可抓取的 HTML实时取回无法引用它渲染不出来的内容PerplexityBot
可见的发布 / 更新日期时效性在实时检索里被加权可引用性
话题广度优先于单个精确匹配页Pro Search 会扩展为多个子查询Answer Loop
追踪自己的引用份额(Sonar API 或人工)引用可抽取,要度量而非靠猜AI 引用追踪

9. Perplexity 对 GEO 为何重要

在所有引擎里,Perplexity 的采信过程最透明,也最可度量:透明,是因为每条答案都附带来源;可度量,是因为 Sonar API 会把这些来源以数据形式返回。正因如此,它既最适合用来讲 引用 vs 提及,也成了 GEO 实测的默认基线。

引擎特性它放大的 GEO 抓手完整内容见
默认引用密集结构性可引用性可引用性
实时检索为默认路径可抓取性与时效性PerplexityBot
引用可程序化抽取持续度量AI 引用追踪
原生答案引擎整套 GEO 方法在这里杠杆最大GEO

Perplexity 是生成式引擎里最纯粹的原生答案引擎样本。如果你能在这里被引用,就说明你对这台引擎的理解是对路的,而把引擎当作 GEO 的优化对象,要的就是这一步。

参考资料

Perplexity 官方文档(截至 2026-05):

学术:

  • Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K. & Deshpande, A. (2024). GEO: Generative Engine Optimization. KDD ‘24. arXiv:2311.09735 · ACM DL
  • Puerto, H., Gubri, M., Green, S., Oh, A. & Yun, S. (2025). C-SEO Bench: Does Conversational SEO Work? arXiv:2506.11097
  • Liu, N. F., Zhang, T. & Liang, P. (2023). Evaluating Verifiability in Generative Search Engines. Findings of EMNLP 2023. arXiv:2304.09848

业界:

常见问题

Perplexity 是搜索引擎还是聊天机器人?
按它自己的说法都不是,它自称为答案引擎(answer engine)。搜索引擎返回的是一列排序链接,纯聊天机器人靠训练记忆作答。Perplexity 实时检索网络,再合成一段带引用的答案。在 GEO Wiki 的分类里,它属于原生答案引擎类的生成式引擎:实时检索是默认路径,每条答案都带可核验的引用。
PerplexityBot 遵守 robots.txt 吗?
它一分为二。PerplexityBot 是建索引的爬虫,官方文档说明它遵守 robots.txt,禁止它,Perplexity 就不会收录你的页面正文。Perplexity-User 是用户触发的取回器,因为这次访问由用户提问发起,它通常不套用 robots.txt 限制。访问控制的细节与 2024 年的争议见 PerplexityBot 条目。
怎么让我的内容被 Perplexity 引用?
先做到可检索(放行 PerplexityBot、服务端渲染),再做到最易被取用:自包含的内容块(chunk)、具体的事实与数字与日期、可直接引述的句子。由于 Perplexity 天生引用密度高,结构性可引用性与来源权威度在这里比在 SERP 内嵌型引擎上更具决定性。具体打法见 [可引用性](/zh/citability) 与 [GEO](/zh/generative-engine-optimization)。
Perplexity 为什么被当作 GEO 基准基线?
它的引用可程序化抽取,既能从可见答案里取,也能从 Sonar API 的 citations / search_results 字段里取,因此「是否被引用」可度量、可复现。GEO 奠基论文(Aggarwal 等,KDD '24)就用 Perplexity.ai 作为实测引擎检验,业界实测至今也因同一原因默认选它。
GEO 论文里约 40% 的提升适用于 Perplexity 吗?
不适用,要按其边界来读。约 40% 的数字来自论文内部的 GPT-3.5 测试装置。在真实的 Perplexity.ai 引擎上,同样的内容实质类改写带来的可见度提升上限约为 22%;而 C-SEO Bench(Puerto 等)发现,一旦多方对同一引擎做优化,许多此类改写会失效。请采用方向,即内容实质优先于关键词技巧,而不是套用那个数字。

相关

参考来源

一手来源

  1. What is an answer engine, and how does Perplexity work as one? · Perplexity AI
  2. PerplexityBot — Perplexity Crawlers · Perplexity AI
  3. How does Perplexity follow robots.txt? · Perplexity AI
  4. Sonar API — Quickstart · Perplexity AI
  5. Sonar API — Chat Completions reference · Perplexity AI
  6. Sonar — Models · Perplexity AI
  7. Perplexity Pages · Perplexity AI · 2024-05-30
  8. Introducing the Sonar Pro API · Perplexity AI · 2025-01-21
  9. Introducing Perplexity Deep Research · Perplexity AI · 2025-02-14
  10. GEO: Generative Engine Optimization (Aggarwal et al., KDD '24) · arXiv · 2024-06-28
  11. GEO: Generative Engine Optimization (KDD '24 Proceedings) · ACM SIGKDD · 2024-08-25
  12. C-SEO Bench: Does Conversational SEO Work? (Puerto et al.) · arXiv · 2025-06-12
  13. Evaluating Verifiability in Generative Search Engines (Liu et al.) · arXiv · 2023-10-23

二手来源

  1. Perplexity launches Sonar, an API for AI search · TechCrunch
最近更新: 2026-05-17 作者: Ray Yang 主题: 引擎