Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований
Исследование GolOps — 15M цитирований из ИИ-выдачи, 1174 бренда, 265K доменов. Карта источников, на которые опираются языковые модели, и поле выбора, в котором решается ИИ-видимость.

Откуда ИИ берёт ответы. Анатомия 15 миллионов цитирований
Когда языковая модель отвечает пользователю, она тянет ссылки из узкого, концентрированного поля источников. Доступ к этому полю не безграничен. Оно сформировано без участия большинства компаний и живёт по правилам, которые не сводятся к рекламному бюджету.
GolOps замерил это поле. 15 миллионов цитирований из живых ИИ-ответов, 1 174 наблюдаемых бренда, 265 000 уникальных доменов, 1 050 000 ссылок — за окно в 90 дней. Источник данных — фактические выдачи ИИ-систем, которые увидели реальные пользователи.
| Метрика | Значение |
|---|---|
| Цитирований проанализировано | 15 000 000+ |
| Доменов отслежено | 265 000 |
| Брендов в выборке | 1 174 |
| Уникальных URL | 1 050 000 |
Окно данных: 90 дней
Ключевые находки
17% — доля Wikipedia. Один источник держит шестую часть всего видимого поля ИИ-выдачи. Это уровень концентрации, на котором обычные тактики набора видимости теряют смысл. Реальная конкуренция разворачивается за оставшиеся 83% потока цитирований.
60 000+ — длинный хвост. Столько доменов делят между собой эти 83%. Реальная инфраструктура цитирования начинается на входе в первую тысячу доменов.
1,2× — заголовки-списки. Страницы с заголовками «Топ-N» или «N лучших 2026» цитируются ощутимо чаще стандартных продуктовых лендингов. Формат заголовка — измеримый рычаг.
83% — стабильность топа. Большинство источников верхней части распределения удерживают позиции уже шесть месяцев. ИИ-выбор инертен — окно входа в верхушку короче, чем кажется.
Карта топ-источников
За 30-дневное окно — пятнадцать доменов с наибольшим числом цитирований:
| # | Домен | Цитирований | Тип источника |
|---|---|---|---|
| 1 | youtube.com | 236 322 | Видео / UGC |
| 2 | en.wikipedia.org | 88 807 | Справочник |
| 3 | reddit.com | 83 578 | Социальная платформа |
| 4 | forbes.com | 28 382 | СМИ |
| 5 | pmc.ncbi.nlm.nih.gov | 26 905 | Академический |
| 6 | linkedin.com | 25 564 | Социальная платформа |
| 7 | gartner.com | 25 444 | Отраслевая аналитика |
| 8 | edmunds.com | 23 997 | Отраслевой агрегатор |
| 9 | g2.com | 22 638 | Площадка отзывов |
| 10 | facebook.com | 18 737 | Социальная платформа |
| 11 | clutch.co | 17 087 | B2B-каталог |
| 12 | cars.com | 16 822 | Отраслевой агрегатор |
| 13 | carfax.com | 14 223 | Отраслевой агрегатор |
| 14 | nerdwallet.com | 13 902 | Финансовый агрегатор |
| 15 | tripadvisor.com | 13 631 | Площадка отзывов |
Это не «топ СМИ» и не подборка лидеров мнений. В верхушке — структурированные базы знаний, видеоплатформы, агрегаторы отзывов и узкоспециализированные справочники. ИИ обращается туда, где данные размечены и проверяемы. Громкость бренда без этой структурности в выборку не транслируется.
Степенной закон распределения
Полная выборка из 15M ссылок выстраивается в классическую степенную функцию.
| Позиция | Домен | Доля | Цитирований |
|---|---|---|---|
| 1 | en.wikipedia.org | 4,26% | 639 396 |
| 2 | youtube.com | 2,64% | 396 239 |
| 3 | reddit.com | 0,96% | 144 320 |
| 4 | forbes.com | 0,44% | 66 708 |
| 5 | linkedin.com | 0,37% | 55 529 |
| 6 | techradar.com | 0,35% | 52 055 |
| 7 | g2.com | 0,33% | 49 091 |
| 8 | gartner.com | 0,31% | 46 428 |
| 9 | pmc.ncbi.nlm.nih.gov | 0,29% | 43 902 |
| 10 | edmunds.com | 0,24% | 35 884 |
| 11 | clutch.co | 0,22% | 32 739 |
| 12 | facebook.com | 0,20% | 29 635 |
| 13 | nerdwallet.com | 0,19% | 28 937 |
| 14 | cars.com | 0,17% | 24 892 |
| 15 | tripadvisor.com | 0,15% | 22 625 |
Wikipedia держит более 4% всех URL-цитирований; следующий источник вдвое меньше. К двадцатой позиции доля падает ниже 0,15%, к сотой — ниже 0,06%. После сотни — длинный хвост из десятков тысяч доменов, каждый собирает доли промилле.
Из этой кривой следует другое. Реальная конкуренция за ИИ-видимость разворачивается в зоне 0,01–0,1%, и именно туда попадают крупные отраслевые ресурсы, нишевые справочники, корпоративные блоги, специализированные агрегаторы. Это и есть управляемое поле выбора.
Типы источников
Если разложить 15M цитирований по категориям, картина перестаёт совпадать с интуицией маркетолога:
| Категория | Доля | Примеры |
|---|---|---|
| Отраслевые ресурсы и иное | 86,5% | gartner.com, edmunds.com, clutch.co, nerdwallet.com |
| Социальные платформы / UGC | 4,7% | youtube.com, reddit.com, linkedin.com, facebook.com, tiktok.com |
| Справочники и энциклопедии | 4,5% | en.wikipedia.org, investopedia.com, de.wikipedia.org |
| СМИ и медиа | 1,1% | forbes.com, reuters.com, axios.com, businessinsider.com |
| Площадки отзывов | 1,0% | g2.com, tripadvisor.com, m.yelp.com, consumerreports.org |
| Tech-издания | 0,6% | techradar.com, wired.com, tomsguide.com, theverge.com |
| Академические публикации | 0,5% | pmc.ncbi.nlm.nih.gov, sciencedirect.com, arxiv.org |
| App-сторы | 0,2% | apps.apple.com, play.google.com |
| Документация | 0,2% | aws.amazon.com, learn.microsoft.com |
| Пресс-релизы | 0,2% | prnewswire.com, businesswire.com |
| E-commerce | 0,2% | amazon.com, shopify.com, walmart.com |
| Market research | 0,2% | marketsandmarkets.com, mordorintelligence.com |
| Developer | 0,2% | github.com, dev.to, stackoverflow.com |
Категория «Отраслевые ресурсы и иное» — 86,5% — это и есть поле, в котором конкурирует большинство компаний. Все профильные сайты, корпоративные ресурсы, специализированные справочники, торговые площадки, агрегаторы — всё, что не попадает в стандартные ярлыки. Здесь и находится реальная инфраструктура цитирования, и именно она требует контура управления.
Фантом социальных платформ
В отраслевых разговорах закрепился нарратив: «Reddit — ключ к ИИ-видимости, UGC побеждает, форумы — золотой источник». Этот нарратив не выдерживает столкновения с данными.
Социальные платформы и UGC в сумме — 4,7% цитирований. Reddit отдельно — 0,96%. Справочники как класс дают 4,5% — и эти 4,5% делают больше упорядоченной работы по факту: одно цитирование Wikipedia в фактологическом запросе формирует канву ответа целиком.
Языковые модели обращаются к Reddit и YouTube там, где запрос субъективный: «лучшие наушники для тренировок» или «честные отзывы пользователей». В фактологических и B2B-запросах социалки исчезают.
Причина простая. ИИ предпочитает источники с предсказуемой структурой — выводимым ответом и единым форматом разметки. Wikipedia выигрывает именно за счёт этого: её содержимое сразу пригодно к извлечению. Социальные платформы — диалогические и противоречивые, без устойчивого фрейма цитирования. Для короткого ответа в чат-окне они слишком шумные.
Отсюда не следует «забыть Reddit». Из этого следует другое: ИИ-видимость нельзя строить на одном только UGC-слое. Соцсети покрывают до 5% поля. Остальные 95% живут по другим правилам.
Намерения запросов
GolOps разложил 23 093 уникальных промпта по типу намерения. Распределение показывает, как пользователи реально обращаются к ИИ:
| Тип запроса | Доля | Что ищет пользователь |
|---|---|---|
| «Лучший / топ-N» | 35,1% | Готовые шорт-листы, рейтинги, рекомендации |
| Сравнение «X vs Y» | 9,7% | Парные оценки, выбор между альтернативами |
| «Как сделать» | 3,1% | Пошаговые инструкции |
| «Найти / обнаружить» | 2,0% | Новые, неизвестные ранее варианты |
| «Альтернативы X» | 0,2% | Замена известного решения |
| Фактологические | 49,9% | Определения, числа, справки |
Каждый третий запрос — поиск списка. Это значит: ИИ-ответ о вашей категории с высокой вероятностью приходит в форме ранжированного шорт-листа. Решающее условие попадания — упомянуты ли вы в источниках, на которые модель опирается при сборке этого списка.
Что повышает цитируемость
GolOps замерил, как формат страницы коррелирует с частотой цитирования. Четыре измеримых рычага:
Заголовки-списки → 1,2×. Страницы с «Топ-10» или «5 лучших 2026» цитируются примерно на 20% чаще стандартных продуктовых страниц по той же теме. Причина — в формате контента под таким заголовком: он обычно структурирован так, что языковой модели удобно извлекать из него фрагменты.
Сравнительные заголовки → 1,1×. Конструкции «X vs Y», «X или Y», «Сравнение X и Y» — отдельная категория с собственным усилением. Связь прямая: 9,7% запросов в ИИ — сравнительные, и модель целевым образом ищет такие источники.
Инструкции → 1,1×. Заголовки «Как сделать», «Гайд по…», «Пошагово» получают сопоставимое усиление за счёт совпадения с интентом «How to» (3,1% запросов).
Год в заголовке → 1,1×. «Лучшие платформы в 2026», «Гайд 2026» — простое указание текущего года повышает цитируемость на ~10%. Сигнал свежести.
Параллельный замер — рецентность для технологической вертикали. 25,3% цитирований в tech-категории приходится на контент моложе 60 дней. В других категориях этот показатель кратно ниже. Для tech-аудитории старые страницы — мёртвый актив, требующий регулярного обновления.
Упоминание бренда → 1,5×. Страница, на которой встречается название бренда, цитируется в 1,5 раза чаще, чем страница без него. Работает в обе стороны: упоминание должно быть не только у вас на собственном домене, но и в авторитетных контекстах третьих сторон.
Методология
Что лежит в основе цифр:
- 15 миллионов цитирований — все из живых ответов ИИ-систем с поддержкой веб-поиска, развёрнутых в production. Источник — фактические выдачи моделей; симуляции и offline-снапшоты в выборку не входят.
- 1 174 наблюдаемых бренда — выборка по отраслям и размерам: от глобальных корпораций до средних B2B-игроков.
- 265 000 доменов — полный охват источников, на которые ссылались модели за окно.
- Скользящее окно 90 дней — данные обновляются ежедневно, тренды считаются на свежем материале.
- Источники замеров — современные большие языковые модели с поддержкой веб-поиска, доступные в коммерческих интерфейсах.
Главный принцип — измеряемо то, что пользователь увидел в окне ответа. Теоретический потенциал модели и идеальные условия выдачи остаются за рамками выборки.
Перевод проблемы на язык ЛПР
Если 17% всех цитирований забирает один источник, а 83% распределены между десятками тысяч игроков, перед компаниями встаёт инфраструктурный сдвиг, переписывающий правила входа на рынок. Маркетинговый инструментарий с этой задачей не справляется.
ИИ-видимость определяется архитектурой присутствия в источниках, на которые опирается модель; рекламная активность здесь работает слабо. Попадание в шорт-лист ИИ зависит от того, насколько бренд встроен в структуру цитирования — одной узнаваемости недостаточно. Наконец, стабильность 83% топ-источников открывает окно для тех, кто начинает строить контур сейчас: через два-три года поле затвердеет, и стоимость входа вырастет кратно.
Речь идёт об инфраструктурном слое. Он измеряет присутствие компании в поле выбора и характер её представления в ИИ-выдаче.
GolOps превращает эти переменные в управляемый слой. Измерение, интерпретация, действие и перемер живут на одной базе данных и в одном интерфейсе.