GolOps
Назад к блогу
Исследование

Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований

Исследование GolOps — 15M цитирований из ИИ-выдачи, 1174 бренда, 265K доменов. Карта источников, на которые опираются языковые модели, и поле выбора, в котором решается ИИ-видимость.

Команда GolOpsКоманда GolOps
Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований
Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований
GolOps Lab

Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований

Когда языковая модель отвечает пользователю, она тянет ссылки из узкого, концентрированного поля источников. Доступ к этому полю не безграничен. Оно сформировано без участия большинства компаний и живёт по правилам, которые не сводятся к рекламному бюджету.

GolOps замерил это поле. 15 миллионов цитирований из живых ИИ-ответов, 1 174 наблюдаемых бренда, 265 000 уникальных доменов, 1 050 000 ссылок — за окно в 90 дней. Источник данных — фактические выдачи ИИ-систем, которые увидели реальные пользователи.

МетрикаЗначение
Цитирований проанализировано15 000 000+
Доменов отслежено265 000
Брендов в выборке1 174
Уникальных URL1 050 000

Окно данных: 90 дней

Ключевые находки

17% — доля Wikipedia. Один источник держит шестую часть всего видимого поля ИИ-выдачи. Это уровень концентрации, на котором обычные тактики набора видимости теряют смысл. Реальная конкуренция разворачивается за оставшиеся 83% потока цитирований.

60 000+ — длинный хвост. Столько доменов делят между собой эти 83%. Реальная инфраструктура цитирования начинается на входе в первую тысячу доменов.

1,2× — заголовки-списки. Страницы с заголовками «Топ-N» или «N лучших 2026» цитируются ощутимо чаще стандартных продуктовых лендингов. Формат заголовка — измеримый рычаг.

83% — стабильность топа. Большинство источников верхней части распределения удерживают позиции уже шесть месяцев. ИИ-выбор инертен — окно входа в верхушку короче, чем кажется.

Карта топ-источников

За 30-дневное окно — пятнадцать доменов с наибольшим числом цитирований:

#ДоменЦитированийТип источника
1youtube.com236 322Видео / UGC
2en.wikipedia.org88 807Справочник
3reddit.com83 578Социальная платформа
4forbes.com28 382СМИ
5pmc.ncbi.nlm.nih.gov26 905Академический
6linkedin.com25 564Социальная платформа
7gartner.com25 444Отраслевая аналитика
8edmunds.com23 997Отраслевой агрегатор
9g2.com22 638Площадка отзывов
10facebook.com18 737Социальная платформа
11clutch.co17 087B2B-каталог
12cars.com16 822Отраслевой агрегатор
13carfax.com14 223Отраслевой агрегатор
14nerdwallet.com13 902Финансовый агрегатор
15tripadvisor.com13 631Площадка отзывов

Это не «топ СМИ» и не подборка лидеров мнений. В верхушке — структурированные базы знаний, видеоплатформы, агрегаторы отзывов и узкоспециализированные справочники. ИИ обращается туда, где данные размечены и проверяемы. Громкость бренда без этой структурности в выборку не транслируется.

Степенной закон распределения

Полная выборка из 15M ссылок выстраивается в классическую степенную функцию.

ПозицияДоменДоляЦитирований
1en.wikipedia.org4,26%639 396
2youtube.com2,64%396 239
3reddit.com0,96%144 320
4forbes.com0,44%66 708
5linkedin.com0,37%55 529
6techradar.com0,35%52 055
7g2.com0,33%49 091
8gartner.com0,31%46 428
9pmc.ncbi.nlm.nih.gov0,29%43 902
10edmunds.com0,24%35 884
11clutch.co0,22%32 739
12facebook.com0,20%29 635
13nerdwallet.com0,19%28 937
14cars.com0,17%24 892
15tripadvisor.com0,15%22 625

Wikipedia держит более 4% всех URL-цитирований; следующий источник вдвое меньше. К двадцатой позиции доля падает ниже 0,15%, к сотой — ниже 0,06%. После сотни — длинный хвост из десятков тысяч доменов, каждый собирает доли промилле.

Из этой кривой следует другое. Реальная конкуренция за ИИ-видимость разворачивается в зоне 0,01–0,1%, и именно туда попадают крупные отраслевые ресурсы, нишевые справочники, корпоративные блоги, специализированные агрегаторы. Это и есть управляемое поле выбора.

Типы источников

Если разложить 15M цитирований по категориям, картина перестаёт совпадать с интуицией маркетолога:

КатегорияДоляПримеры
Отраслевые ресурсы и иное86,5%gartner.com, edmunds.com, clutch.co, nerdwallet.com
Социальные платформы / UGC4,7%youtube.com, reddit.com, linkedin.com, facebook.com, tiktok.com
Справочники и энциклопедии4,5%en.wikipedia.org, investopedia.com, de.wikipedia.org
СМИ и медиа1,1%forbes.com, reuters.com, axios.com, businessinsider.com
Площадки отзывов1,0%g2.com, tripadvisor.com, m.yelp.com, consumerreports.org
Tech-издания0,6%techradar.com, wired.com, tomsguide.com, theverge.com
Академические публикации0,5%pmc.ncbi.nlm.nih.gov, sciencedirect.com, arxiv.org
App-сторы0,2%apps.apple.com, play.google.com
Документация0,2%aws.amazon.com, learn.microsoft.com
Пресс-релизы0,2%prnewswire.com, businesswire.com
E-commerce0,2%amazon.com, shopify.com, walmart.com
Market research0,2%marketsandmarkets.com, mordorintelligence.com
Developer0,2%github.com, dev.to, stackoverflow.com

Категория «Отраслевые ресурсы и иное» — 86,5% — это и есть поле, в котором конкурирует большинство компаний. Все профильные сайты, корпоративные ресурсы, специализированные справочники, торговые площадки, агрегаторы — всё, что не попадает в стандартные ярлыки. Здесь и находится реальная инфраструктура цитирования, и именно она требует контура управления.

Фантом социальных платформ

В отраслевых разговорах закрепился нарратив: «Reddit — ключ к ИИ-видимости, UGC побеждает, форумы — золотой источник». Этот нарратив не выдерживает столкновения с данными.

Социальные платформы и UGC в сумме — 4,7% цитирований. Reddit отдельно — 0,96%. Справочники как класс дают 4,5% — и эти 4,5% делают больше упорядоченной работы по факту: одно цитирование Wikipedia в фактологическом запросе формирует канву ответа целиком.

Языковые модели обращаются к Reddit и YouTube там, где запрос субъективный: «лучшие наушники для тренировок» или «честные отзывы пользователей». В фактологических и B2B-запросах социалки исчезают.

Причина простая. ИИ предпочитает источники с предсказуемой структурой — выводимым ответом и единым форматом разметки. Wikipedia выигрывает именно за счёт этого: её содержимое сразу пригодно к извлечению. Социальные платформы — диалогические и противоречивые, без устойчивого фрейма цитирования. Для короткого ответа в чат-окне они слишком шумные.

Отсюда не следует «забыть Reddit». Из этого следует другое: ИИ-видимость нельзя строить на одном только UGC-слое. Соцсети покрывают до 5% поля. Остальные 95% живут по другим правилам.

Намерения запросов

GolOps разложил 23 093 уникальных промпта по типу намерения. Распределение показывает, как пользователи реально обращаются к ИИ:

Тип запросаДоляЧто ищет пользователь
«Лучший / топ-N»35,1%Готовые шорт-листы, рейтинги, рекомендации
Сравнение «X vs Y»9,7%Парные оценки, выбор между альтернативами
«Как сделать»3,1%Пошаговые инструкции
«Найти / обнаружить»2,0%Новые, неизвестные ранее варианты
«Альтернативы X»0,2%Замена известного решения
Фактологические49,9%Определения, числа, справки

Каждый третий запрос — поиск списка. Это значит: ИИ-ответ о вашей категории с высокой вероятностью приходит в форме ранжированного шорт-листа. Решающее условие попадания — упомянуты ли вы в источниках, на которые модель опирается при сборке этого списка.

Что повышает цитируемость

GolOps замерил, как формат страницы коррелирует с частотой цитирования. Четыре измеримых рычага:

Заголовки-списки → 1,2×. Страницы с «Топ-10» или «5 лучших 2026» цитируются примерно на 20% чаще стандартных продуктовых страниц по той же теме. Причина — в формате контента под таким заголовком: он обычно структурирован так, что языковой модели удобно извлекать из него фрагменты.

Сравнительные заголовки → 1,1×. Конструкции «X vs Y», «X или Y», «Сравнение X и Y» — отдельная категория с собственным усилением. Связь прямая: 9,7% запросов в ИИ — сравнительные, и модель целевым образом ищет такие источники.

Инструкции → 1,1×. Заголовки «Как сделать», «Гайд по…», «Пошагово» получают сопоставимое усиление за счёт совпадения с интентом «How to» (3,1% запросов).

Год в заголовке → 1,1×. «Лучшие платформы в 2026», «Гайд 2026» — простое указание текущего года повышает цитируемость на ~10%. Сигнал свежести.

Параллельный замер — рецентность для технологической вертикали. 25,3% цитирований в tech-категории приходится на контент моложе 60 дней. В других категориях этот показатель кратно ниже. Для tech-аудитории старые страницы — мёртвый актив, требующий регулярного обновления.

Упоминание бренда → 1,5×. Страница, на которой встречается название бренда, цитируется в 1,5 раза чаще, чем страница без него. Работает в обе стороны: упоминание должно быть не только у вас на собственном домене, но и в авторитетных контекстах третьих сторон.

Методология

Что лежит в основе цифр:

  • 15 миллионов цитирований — все из живых ответов ИИ-систем с поддержкой веб-поиска, развёрнутых в production. Источник — фактические выдачи моделей; симуляции и offline-снапшоты в выборку не входят.
  • 1 174 наблюдаемых бренда — выборка по отраслям и размерам: от глобальных корпораций до средних B2B-игроков.
  • 265 000 доменов — полный охват источников, на которые ссылались модели за окно.
  • Скользящее окно 90 дней — данные обновляются ежедневно, тренды считаются на свежем материале.
  • Источники замеров — современные большие языковые модели с поддержкой веб-поиска, доступные в коммерческих интерфейсах.

Главный принцип — измеряемо то, что пользователь увидел в окне ответа. Теоретический потенциал модели и идеальные условия выдачи остаются за рамками выборки.

Перевод проблемы на язык ЛПР

Если 17% всех цитирований забирает один источник, а 83% распределены между десятками тысяч игроков, перед компаниями встаёт инфраструктурный сдвиг, переписывающий правила входа на рынок. Маркетинговый инструментарий с этой задачей не справляется.

ИИ-видимость определяется архитектурой присутствия в источниках, на которые опирается модель; рекламная активность здесь работает слабо. Попадание в шорт-лист ИИ зависит от того, насколько бренд встроен в структуру цитирования — одной узнаваемости недостаточно. Наконец, стабильность 83% топ-источников открывает окно для тех, кто начинает строить контур сейчас: через два-три года поле затвердеет, и стоимость входа вырастет кратно.

Речь идёт об инфраструктурном слое. Он измеряет присутствие компании в поле выбора и характер её представления в ИИ-выдаче.

GolOps превращает эти переменные в управляемый слой. Измерение, интерпретация, действие и перемер живут на одной базе данных и в одном интерфейсе.

Запросить диагностику ИИ-видимости →