﻿---
title: Анатомия ИИ-цитирования. Что делает страницу пригодной для цитаты
description: Исследование GolOps — 1 465 цитируемых ИИ страниц на 950 доменах, 28 000+ цитирований. 68% имеют разметку schema, FAQ-разметка даёт +45% цитирований, лёгкая разметка обходит тяжёлую. Измеримая анатомия страницы, которую модель берёт в ответ.
date: 2025-12-02T00:00:00Z
lastmod: 2026-06-02T00:00:00Z
published: true
categories: [research, llm]
author: golops
---

Когда языковая модель собирает ответ, она тянет фрагменты из узкого набора страниц. Выбор не случаен. У этих страниц общая анатомия — измеримый набор признаков, которые повторяются от цитаты к цитате. Рекламный бюджет на него не влияет.

GolOps разложил эту анатомию на части. 1 465 страниц на 950 доменах, которые ChatGPT, Perplexity и Gemini цитируют в живых ответах, — выборка из 28 000+ фактических цитирований. Для каждой страницы мы извлекли разметку schema, структуру контента и технические метаданные, затем сопоставили каждый признак с веб-средними из HTTP Archive.

| Метрика | Значение |
|---|---|
| Цитируемых страниц разобрано | 1 465 |
| Доменов в выборке | 950 |
| Цитирований проанализировано | 28 000+ |
| Доля страниц с разметкой schema | 68% |

*Это корреляционная картина. Она описывает, как устроены цитируемые страницы, а не доказывает, почему модель выбрала именно их. Где выборка мала или есть смешивающий фактор, мы это отмечаем.*

## Ключевые находки

**68% — порог входа, а не преимущество.** Две трети цитируемых страниц несут разметку schema против ~38,5% по вебу в целом. Структурированные данные есть почти у всех в выборке — это входной билет, а не отрыв от соседей по полю.

**+45% — эффект FAQ-разметки.** Страницы с разметкой FAQPage собирают в среднем на 45% больше цитирований, чем страницы без FAQ-сигнала. Единственный тип разметки, который внутри выборки коррелирует с частотой цитирования.

**Лёгкая разметка обходит тяжёлую.** Страницы с лёгкой реализацией schema цитируются чаще, чем с громоздкой. За скромным порогом дополнительная разметка даёт убывающую, а затем отрицательную отдачу.

**~2 290 слов — медиана глубины.** Цитируемая страница в среднем втрое длиннее типичной веб-страницы. Содержание весит больше любого отдельного формального признака.

## Эффект FAQ-разметки

Самый сильный сигнал в наборе. Страницы с разметкой FAQPage собирают в среднем 36,9 цитирования против 25,4 у страниц без FAQ-сигнала — разрыв в 45%.

| FAQ-сигнал страницы | Среднее число цитирований | Выборка |
|---|---|---|
| Разметка FAQPage + FAQ-контент | 36,9 | n=23 |
| Только FAQ-контент, без разметки | 27,2 | n=161 |
| Нет FAQ-сигнала | 25,4 | n=269 |

Промежуточная позиция страниц с FAQ-контентом, но без разметки, говорит о том, что разметка добавляет сигнал поверх самого формата. Оговорка обязательна: страниц с FAQ-разметкой всего 23, и они же обычно заметно длиннее, что частично объясняет подъём. Это ранний, рабочий сигнал, а не доказанная причинная связь. FAQPage — единственный тип разметки, который внутри выборки самостоятельно связан с ростом частоты цитирования. Остальные типы чаще встречаются на цитируемых страницах, но не предсказывают объём цитирований внутри них.

## Какая разметка живёт на цитируемых страницах

68% цитируемых страниц несут разметку schema — почти вдвое выше веб-среднего (~38,5%, Web Almanac 2024). Разметка schema — это структурированные данные, которые машины читают напрямую (документация [Google](https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data)). Если разложить по типам и сравнить с вебом в целом, видно, какие именно форматы ИИ берёт в работу непропорционально часто.

| Тип разметки | Превышение над вебом | На цитируемых / по вебу |
|---|---|---|
| Person | 9,4× | 18,9% / 2,0% |
| ImageObject | 8,9× | 21,4% / 2,4% |
| NewsArticle | 8,7× | 10,4% / 1,2% |
| SoftwareApplication | 8,0× | 2,4% / 0,3% |
| Service | 6,5× | 1,3% / 0,2% |
| BreadcrumbList | 5,2× | 37,7% / 7,3% |
| WebPage | 5,1× | 29,3% / 5,8% |
| BlogPosting | 4,8× | 8,1% / 1,7% |
| ItemList | 4,4× | 4,4% / 1,0% |
| WebSite | 4,3× | 33,0% / 7,7% |
| Organization | 4,1× | 31,5% / 7,6% |
| Article | 3,8× | 24,4% / 6,5% |

Сильнее всего над вебом стоят Person (атрибуция автора), ImageObject и NewsArticle — каждый встречается на цитируемых страницах в 8–9 раз чаще, чем по вебу. Но превышение описывает тип страниц, которые ИИ цитирует, а не прямой причинный эффект. Это совпадает с независимыми данными: [анализ Search Engine Land](https://searchengineland.com/how-to-get-cited-by-ai-seo-insights-from-8000-ai-citations-455284) по 8 000 цитирований показал, что доминируют блоги и новости, а продуктовые страницы вендоров берутся в ответ менее чем в 3% случаев — мы разобрали этот разрыв между тем, что ИИ обходит, и тем, что цитирует, в [**ИИ ходит на продуктовые страницы. Цитирует блог**](/publications/page-type-citation-gap). Из всех измеренных типов только FAQPage самостоятельно связан с ростом частоты цитирования.

## Лёгкая разметка обходит тяжёлую

Здесь интуиция «больше разметки — больше сигнала» ломается. Страницы с лёгкой реализацией schema цитируются чаще всех. После скромного порога каждый дополнительный слой структурированных данных даёт убывающую, а в верхних тиерах — отрицательную отдачу.

| Тир разметки | Среднее число цитирований | Выборка | Среднее число слов |
|---|---|---|---|
| Нет разметки | 24,1 | n=146 | 1 843,4 |
| Лёгкая | 30,5 | n=135 | 2 551,6 |
| Средняя | 26,6 | n=89 | 2 310,0 |
| Богатая | 24,8 | n=72 | 2 646,6 |
| Очень богатая | 23,7 | n=12 | 2 478,6 |

Лёгкий тир — 30,5 цитирования — стабильно собирает больше всех. Фокус обходит исчерпывающую полноту. Помогает ли это потому, что модель так предпочитает, или потому что лёгкая разметка просто свойственна сильным страницам, мы пока не знаем. На практике это ничего не меняет: размечать стоит выводимый ответ и базовую структуру, а не наращивать поля ради полноты.

## Чертёж цитируемости

Десять признаков страницы в сравнении: топ-10% самых цитируемых против нижних 50%. Разрывы уже, чем можно ожидать. Это внутренние свойства страницы, а не внешние сигналы вроде ссылочной массы или авторитета домена.

| Признак | Топ-10% | Нижние 50% | Дельта |
|---|---|---|---|
| Есть любая разметка | 80,0% | 65,6% | +14,4% |
| Разметка Article | 37,8% | 23,3% | +14,5% |
| Разметка FAQ | 11,1% | 5,3% | +5,8% |
| Разметка Person | 17,8% | 19,4% | −1,6% |
| Число слов | 2 521,1 | 2 304,7 | +216,4 |
| Всего заголовков | 33,7 | 31,4 | +2,3 |
| Пунктов в списках | 146,9 | 120,3 | +26,6 |
| Есть таблицы | 40,0% | 28,2% | +11,8% |
| Есть FAQ-контент | 42,2% | 38,3% | +3,9% |
| Есть How-To-контент | 73,3% | 70,0% | +3,3% |

Чётче всего тиеры разделяет разметка: наличие любой schema, Article, FAQ, таблиц. Признаки структуры контента — заголовки, FAQ-паттерны, инструкции — у верхних и нижних страниц почти одинаковы. Базовое качество среди цитируемых страниц уже высокое, поэтому отрыв создают формальные сигналы разметки, а не глубина текста как таковая.

## Самые цитируемые страницы

Пятнадцать URL с наибольшим числом цитирований в выборке. Виден и паттерн, и исключения: у большинства — сфокусированная разметка, но несколько лидеров не несут её вовсе.

| Домен | Цитирований | Слов | Типы разметки |
|---|---|---|---|
| softwarefinder.com | 218 | 2 937 | Corporation |
| rankmyagent.com | 174 | 1 461 | FAQPage · RealEstateAgent · ItemList |
| collegenet.com | 123 | 808 | WebPage · BreadcrumbList · VideoObject |
| dotcom-monitor.com | 111 | 5 785 | BreadcrumbList · Person · WebSite + ещё 4 |
| runnersworld.com | 82 | 3 834 | NewsArticle · ItemList |
| g-co.agency | 80 | 2 558 | Нет |
| iiba.org | 80 | 2 806 | Нет |
| milanote.com | 79 | 1 111 | HowTo |
| offers.hubspot.com | 75 | 553 | Нет |
| dash.dropbox.com | 75 | 1 474 | MobileApplication · SoftwareApplication · Organization + ещё 2 |
| nokia.com | 72 | 1 771 | BreadcrumbList |
| ehrinpractice.com | 72 | 1 832 | Нет |
| skyquestt.com | 71 | 2 993 | WebPage · ItemList |
| readycontacts.com | 70 | 1 857 | Person · Article |

Разметка — частый, но не обязательный признак лидера. Несколько верхних страниц цитируются десятками раз вообще без schema. Это и есть разрыв между «иметь разметку» и «быть выбранным»: первое распространено среди цитируемых, второе решается содержанием и форматом.

## Что это складывает в портрет

Собранные в один портрет цитируемой страницы, признаки дают четыре вывода.

**Разметка — это инфраструктура, а не отрыв.** 68% цитируемых страниц несут структурированные данные, почти вдвое выше веба. Но большинство типов разметки не предсказывает объём цитирований — они описывают тип страниц, которые ИИ и так берёт. Иметь schema среди цитируемых нормально; различия внутри поля она не создаёт.

**FAQ-разметка — исключение, с оговорками.** +45% к цитированиям против страниц без FAQ-сигнала. Но выборка мала (n=23), а такие страницы заметно длиннее. Реальная связь, ещё не доказанная причина.

**Сфокусированная разметка обходит исчерпывающую.** Лёгкая реализация (1–20 полей) собирает больше всех. Тяжёлая даёт убывающую отдачу. Сложность разметки не помогает; качество содержания — может.

**Глубина содержания — вероятный фундамент.** Цитируемая страница в среднем 2 289,6 слова — втрое больше типичной веб-страницы. Между топ-10% и нижними 50% структурные различия скромные. Содержание весит больше любого отдельного формального сигнала.

Эти выводы согласуются с тем, что GolOps уже фиксировал в более широком замере поля цитирования: заголовки-списки дают усиление ~1,2×, сравнительные и инструкционные заголовки — около 1,1×, год в заголовке — ещё ~1,1× как сигнал свежести, упоминание бренда на странице — до 1,5×. Анатомия страницы и формат её заголовка работают как два слоя одного управляемого сигнала.

## Методология

Что лежит в основе цифр:

- **1 465 страниц** — топ-цитируемые URL из системы наблюдения GolOps, отобранные из 28 000+ цитирований на 950 доменах. Каждый URL загружался вживую, чтобы извлечь JSON-LD-разметку, характеристики контента (число слов, заголовки, списки, таблицы, FAQ-паттерны) и технические метаданные.
- **Веб-средние** — бенчмарки из HTTP Archive / Web Almanac 2024.
- **Профиль выборки** — смещён к B2B, SaaS и DTC-брендам; выводы наиболее точны для этих вертикалей.
- **Малая FAQ-выборка (n=23)** — находка по FAQ-разметке остаётся ранним рабочим сигналом, а не доказанной причиной. Бо́льшая выборка уточнит оценку.
- **Нет контрольной группы нецитируемых страниц** — мы сравниваем цитируемые страницы с веб-средними, а не с сопоставимыми нецитируемыми. Часть различий может отражать качество страницы, а не признаки, под которые ИИ отбирает.
- **Наличие, а не качество** — доли разметки фиксируют, есть ли структурированные данные, а не корректность их реализации.

## Практический вывод

Если делать что-то одно, делайте контент глубже. Из всех измеримых сигналов именно глубина содержания — медианные ~2 290 слов, втрое больше типичной страницы — весит больше любого отдельного формального маркера. Разметка schema и FAQ-блок помогают на марже: они добавляют сигнал, но не заменяют вещество страницы и не создают отрыв сами по себе. Анатомию страницы можно знать и чинить — но только после того, как вы измерите, какие именно ваши страницы модели реально берут в ответ. Без этого замера правки идут вслепую: вы наращиваете поля разметки там, где решает текст, и наоборот.

Этот замер и берёт под управление GolOps. Мы фиксируем позицию компании в поле выбора через Индекс Контроля Выбора, разбираем, какие страницы и сигналы её формируют, и переводим это в приоритизированный план правок: Стратегический пилот закрывает первый цикл за 10–12 недель, Центр Управления держит контур в постоянном режиме на семи ИИ-системах. Цена отсрочки считается прямо. Gartner прогнозирует, что к 2028 году 90% B2B-закупок пойдут через автономных ИИ-агентов, а Semrush уже фиксирует конверсию из ИИ-каналов в 4,4 раза выше органического поиска: каждый квартал без управляемой анатомии цитирования — это квартал ответов, собранных без вашей страницы внутри.

**Анатомия страницы — лишь один слой управляемого сигнала. Соседние замеры:**

[**Эффект llms.txt: 37 894 домена и ноль преимущества в цитировании**](/publications/llms-txt-effect)

[**Период полураспада ИИ-цитирований. Как быстро вас перестают цитировать**](/publications/ai-citation-half-life)

[Запросить стратегическую диагностику →](https://golops.io/position) · [Обсудить пилот →](https://golops.io/pilot)
