跳到正文
第 2 步 / 共 8

三大 bot 逐个拆:GPTBot、ClaudeBot、PerplexityBot

每家主流 AI 厂商都至少跑一个有名有姓的爬虫,但 User-Agent、IP 段、速率限制、是训练 bot 还是实时取数 bot,差异大到一刀切的策略一定会失真。先从日志里出现最多的那一个入手,再逐步向外覆盖。

本步要读

  1. GPTBot
    Wiki · 即将上线
  2. ClaudeBot
    Wiki · 即将上线
  3. PerplexityBot
    Wiki · 即将上线

读完本步,你应当能回答

  • 每个 bot 的 UA 模式、抓取频率、opt-out 信号分别是什么?
  • 哪些 bot 同时承担训练抓取和实时取数,这一点对 opt-out 策略意味着什么?
  • 这三个里,眼下真正出现在你日志里的是哪一个?