技术 GEO 进阶
第 1 步 / 共 8
AI 爬虫的三种类型
动手改 robots.txt 之前,先看清「是谁在抓、为了什么」。三类爬虫的访问后果完全不同:拦错一类,最后挡掉的很可能是引用通道,训练通道反倒留着,这是这一层代价最高的一种错误。
本步要读
- AI 爬虫 Wiki
- ChatGPT-User Wiki · 即将上线
读完本步,你应当能回答
- 主流 AI 爬虫都有哪些?如何通过 User-Agent 把它们认出来?
- 为什么有的引擎从不抓你,却照样能引用你?
- 哪些爬虫是在训练模型,哪些是在用户提问的当下实时抓取?