GolOps
Назад к блогу
ИсследованиеЯзыковые модели

Когда ИИ приходит на ваш сайт. Анатомия 600 000 визитов краулеров

Исследование GolOps — 575 788 визитов ИИ-краулеров, 7 систем, окно с июня 2025 по февраль 2026. Кто обходит ваш сайт, как часто возвращается и почему разрыв между обходом и цитированием решает, попадёте ли вы в поле выбора.

Команда GolOpsКоманда GolOps
Когда ИИ приходит на ваш сайт. Анатомия 600 000 визитов краулеров
Когда ИИ приходит на ваш сайт. Анатомия 600 000 визитов краулеров
GolOps Lab

Прежде чем ИИ-система процитирует компанию, её краулер должен прийти на сайт, прочитать страницу и решить, что с ней делать. Большинство компаний не знают, кто к ним приходит, как часто и что именно забирает. А обходят сайт совсем не так, как Google.

GolOps разложил это поведение. 575 788 визитов ИИ-краулеров, 7 систем — GPTBot, OAI-SearchBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended, Bytespider — в окне с июня 2025 по февраль 2026. Источник данных — серверные логи доступа: фактические обращения ботов, а не оценки и не симуляции.

МетрикаЗначение
Визитов краулеров проанализировано575 788+
ИИ-краулеров отслежено7
Доля OpenAI в трафике72,3%
Страниц с единственным визитом88,5%

Окно данных: июнь 2025 — февраль 2026

Ключевые находки

72,3% трафика — OpenAI. GPTBot и OAI-SearchBot вместе дают почти три четверти всех визитов ИИ-краулеров. Это вчетверо больше, чем Anthropic, Google, Perplexity, Meta и Amazon вместе взятые. Кто оптимизирует под чужой обход, оптимизирует не под тот.

ИИ-краулеры пропускают главную. Обучающий краулер ChatGPT заходит на главную страницу лишь в 2,8% случаев — идёт прямо в глубину: статьи, документация, продуктовые страницы. ClaudeBot ведёт себя иначе: с главной он начинает в 19,2% случаев, обход сверху вниз. Разные системы читают сайт по разной логике.

88,5% страниц получают ровно один визит. Большинство краулеров работают по принципу «один раз и больше не вернусь». Содержимое должно быть готово до прихода бота — второго шанса может не быть. Значит, дорабатывать страницу после публикации почти бесполезно: важна готовность к первому обходу.

Блог — новая входная дверь. Поисковый краулер ChatGPT начинает сессию с блог-страницы в 21% случаев — против 1% для главной. ИИ-поиск тянет не структуру сайта, а ответ на конкретный вопрос. Цитируется не лендинг, а гайд.

Правило трёх кликов. Больше половины обучающего трафика приходится на страницы в пределах трёх кликов от главной. Контент, закопанный на глубине 5+, краулер находит редко. Плоская архитектура даёт измеримое преимущество.

Методология

В основе — серверные логи доступа сайтов, подключённых к мониторингу краулеров GolOps. Окно — июнь 2025 — февраль 2026, более 575 788 индивидуальных визитов от GPTBot, OAI-SearchBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended, Bytespider и других ботов с ИИ-идентификацией. Данные обезличены и агрегированы до анализа. Число визитов, глубина страницы, точки входа и частота повторных обходов посчитаны отдельно по каждому краулеру — чтобы развести поведение обучающих краулеров и краулеров реального времени.

Два типа краулеров: обучение против поиска

От цели краулера зависит, когда и как ваш контент попадёт в ответ пользователю.

Обучающие краулеры собирают данные для будущих моделей. Ваш контент формирует то, как ИИ будет отвечать через месяцы. Эффект отложенный, но долгий.

Поисковые краулеры тянут контент в реальном времени. Когда пользователь задаёт вопрос, система забирает страницу и цитирует её прямо в ответе. Эффект немедленный — страница может появиться в ответе ChatGPT уже сегодня.

ТипДоля трафикаЭффектЧто определяет
Обучающие краулеры61%ДолгосрочныйКак ИИ опишет вас через месяцы
Поисковые краулеры15%НемедленныйПопадёте ли в ответ сегодня

Здесь и проходит разрыв между обходом и цитированием. Обучающий обход — это инвестиция в будущую позицию. Поисковый — участие в выборе прямо сейчас. И разрыв огромен: по данным Cloudflare, Anthropic делает около 70 900 запросов HTML-страниц на один переход к источнику. Обход идёт несоизмеримо чаще, чем реальное цитирование.

Кто обходит ваш сайт

Между обучением и поиском OpenAI контролирует 72,3% всего трафика ИИ-краулеров. Claude — 3,8%. ByteSpider от TikTok тихо держит третье место и обходит больше сайтов, чем любой другой бот. Meta и Amazon замыкают пятёрку, но ни один не дотягивает до 8%.

#КраулерВизитовДоля
1ChatGPT Training (GPTBot)329 57257,2%
2ChatGPT Search (OAI-SearchBot)87 15515,1%
3ByteSpider (TikTok)52 7049,2%
4Meta45 4457,9%
5Amazon38 3356,7%
6Claude Training (ClaudeBot)22 0743,8%

Ранжировано по доле трафика. Июнь 2025 — февраль 2026

Соотношение обучающего и поискового обхода у OpenAI — 3,8 : 1. Рынок ботов поделён неравномерно: одна доминирующая система и длинный хвост остальных. Кто хочет управлять своей позицией в поле выбора, начинает с того, что видит именно краулер OpenAI. Cloudflare публикует разбивку трафика ИИ-краулеров по цели и отрасли, и она подтверждает: обучение и поиск ведут себя как два разных типа обхода.

Разные философии обхода

Обучающие краулеры читают сайт по-разному, и это не случайные расхождения.

КраулерЗаходы на главнуюЛогика
Claude Training19,2%Сначала разбирается, кто вы
ChatGPT Training2,8%Сразу уходит в глубину контента

Claude заходит на главную в 7 раз чаще, чем обучающий краулер ChatGPT. Ему важно понять, кто вы и в чём ваша экспертиза, — отсюда обход сверху вниз. ChatGPT пропускает фасад и идёт за содержанием. Для Claude это значит, что главная должна прямо отвечать на вопрос «кто эта компания и в чём она авторитет». Для ChatGPT важнее глубина каталога.

Время обхода выдаёт намерение

Краулеры работают по расписанию, и у каждой системы оно своё.

КраулерБудни (сред.)Выходные (сред.)Изменение
ChatGPT Training1 4301 841+29%
ChatGPT Search383540+41%
Claude Training9991−8%

OpenAI наращивает обход на выходных, когда человеческий трафик падает, — забирает свободную ёмкость. Claude делает обратное: на выходных он на 8% менее активен. Отсюда практическое следствие: публикация в будни быстрее попадёт под обход Anthropic, публикация под выходные — под обход OpenAI.

Блог — ваша входная дверь в ИИ

Поисковый краулер ChatGPT — тот, что питает ответы в реальном времени, — начинает сессию с блог-страницы в 21% случаев. Это не случайный обход. Когда пользователь задаёт вопрос, система целевым образом забирает блог-контент.

Точка входаДоля сессийЧто это
Блог-страницы21%Статьи, гайды, разборы
Продуктовые страницы3%Фичи, цены, документация
Главная1%Основной лендинг
Прочее75%Остальные входы

Через блог-контент входят в 21 раз чаще, чем через главную. Значит, краулер не индексирует сайт иерархически — он ищет ответ на конкретный запрос. Первыми забираются страницы, которые прямо отвечают на вопрос: «как сделать», «лучшие практики», сравнения «X против Y». Это и есть новый органический канал, и держится он на гайдах, сравнениях и инструкциях. Этот разрыв мы разобрали отдельно: ИИ ходит на продуктовые страницы, а цитирует блог.

Почему они приходят только раз

Визитов на URLДоля URL
188,5%
28,3%
3–52,4%
6–100,4%
10+0,3%

88,5% адресов краулер посещает ровно один раз и больше не возвращается. Третьего захода удостаиваются лишь 2,4% URL. Даже у выбросов потолок практический — около пяти визитов (P99). Краулер обращается со страницей как с одноразовой: один взгляд, без возврата.

Из этого следует жёсткое правило. Содержимое должно быть готово к моменту первого обхода: разметка, структура, упоминание бренда, свежесть. И готово именно в HTML: исследование Vercel показало, что ИИ-краулеры не выполняют JavaScript — что не отрисовано на сервере, бот не увидит. Регулярная донастройка после публикации работает слабо — бот к этому моменту уже ушёл и не вернётся. Что важнее для первого обхода — разметка или сам формат, мы проверяли в контролируемом эксперименте.

Правило трёх кликов

Обучающий краулер ChatGPT идёт по архитектуре сайта. Наибольшее внимание получают страницы средней глубины; на главную приходится менее 3% визитов.

УровеньПримерДоля визитов
Глубина 0/2,7%
Глубина 1/about10,3%
Глубина 2/blog/post19,6%
Глубина 3/blog/2024/post51,7%
Глубина 3/docs/api/auth12,0%
Глубина 4+/docs/api/v1/...3,7%

Больше половины обхода концентрируется на глубине 3. Если лучший контент закопан на глубине 5+, шанс, что краулер его найдёт, резко падает. Держите важные страницы в пределах трёх кликов от главной. Плоская архитектура — это не вопрос вкуса, а измеримое преимущество в обходе.

Охват против глубины

Каждый краулер по-своему выбирает между широтой охвата и глубиной обхода.

КраулерОхват сайтовВизитов на сайтСтратегия
ChatGPT Search76%1 362Широкий охват, умеренная глубина
ChatGPT Training70%5 586Меньше сайтов, исчерпывающий обход
Claude Training56%470Избирательно, точечно

ChatGPT Search ставит на широту — обходит 76% сайтов в выборке. ChatGPT Training ставит на глубину: сайтов меньше, но в среднем 5 586 визитов на каждый. Claude самый избирательный — всего 470 визитов на сайт. Важная деталь для небольших компаний: через поисковый краулер ChatGPT (76%) доступно больше сайтов, чем глубоко обучает обучающий краулер (70%). Шанс попасть в ответ реального времени выше, чем шанс попасть в обучающую выборку.

Управленческое чтение

  • Обход — не цитирование. Между приходом краулера и появлением бренда в ответе лежит разрыв: страницу нужно прочитать, извлечь из неё пригодный фрагмент и выбрать при сборке ответа — это вопрос структуры, а не объёма контента.
  • Один заход — и всё. 88,5% страниц краулер посещает ровно раз; окно влияния узкое и не повторяется, поэтому контент должен быть готов до прихода бота, а не дорабатываться после.
  • Блог — парадная дверь. Поисковый ChatGPT входит через блог в 21 раз чаще, чем через главную, — цитируется ответ на конкретный вопрос, а не структура сайта.

GolOps берёт этот слой под управление: измеряет позицию в поле выбора через Индекс Контроля Выбора, привязывает её к конкретным краулерам и сценариям и переводит замер в приоритизированный план. Стратегический пилот закрывает первый цикл за 10–12 недель, а Центр Управления держит контур на семи ИИ-системах в постоянном режиме.

Чего стоит молчание

Обход идёт уже сейчас, а позиция в выборе остаётся неизвестной: краулер приходит, но компания не знает, ту ли версию себя он прочитал. Gartner прогнозирует, что к 2028 году 90% B2B-закупок пойдут через автономных ИИ-агентов, а Semrush уже фиксирует конверсию из ИИ-каналов в 4,4 раза выше, чем из органического поиска. А цена молчания сводится к одной цифре: 72,3% всего обхода контролирует OpenAI, и каждый необработанный визит этого краулера уходит конкуренту, чью страницу он прочитал и забрал.

Но даже попасть в цитирование — половина дела: его ещё нужно удержать:

Период полураспада ИИ-цитирований. Как быстро вас перестают цитировать

Запросить стратегическую диагностику → · Обсудить пилот →