﻿---
title: "Эффект llms.txt: 37 894 домена и ноль преимущества в цитировании"
description: Исследование GolOps — 37 894 домена, цитируемых ИИ, просканированы на наличие llms.txt. У 13,3% файл есть. Преимущество в цитировании — ноль. Mann-Whitney U p=0,85. Разбор популярного мифа на данных.
date: 2026-02-03T00:00:00Z
lastmod: 2026-06-02T00:00:00Z
published: true
categories: [research, llm]
author: golops
---

Вокруг файла `llms.txt` сложился отдельный нарратив: положи текстовый файл в корень сайта — и ИИ-системы начнут цитировать тебя чаще. Его подают как тот самый «один приём», который двигает ИИ-видимость. Данные этого не показывают.

GolOps просканировал 37 894 домена, которые ИИ-системы реально цитируют в своих ответах. У 5 035 из них (13,3%) есть `llms.txt`. Преимущество в частоте цитирования у этой группы — статистический ноль. Mann-Whitney U даёт p=0,85, и это примерно максимально далёкая от значимости точка, какую можно получить.

| Метрика | Значение |
|---|---|
| Доменов просканировано | 37 894 |
| Цитирований проанализировано | 337 000+ |
| Брендовых срезов | 882 |
| Доля доменов с llms.txt | 13,3% |
| Mann-Whitney U | p=0,85 |

*Корпус: домены с двумя и более появлениями в ИИ-ответах*

## Ключевые находки

**13,3% — доля с llms.txt.** Из всех доменов, которые ИИ цитирует, файл есть у одного из восьми. Те, кто его ставит, делают ставку на будущее, а преимущества сегодня не получают.

**6,8 против 6,7 — среднее цитирований.** Домены с `llms.txt` собирают в среднем 6,8 цитирования, без него — 6,7. Разница неотличима от шума. Медиана в обеих группах — ровно 3,0.

**6% — адопция в топ-50.** Среди пятидесяти самых цитируемых доменов файл есть лишь у 6%. Чем выше домен в рейтинге цитируемости, тем реже у него `llms.txt`. Стандарт ставят те, кто надеется на видимость, а не те, у кого она уже есть.

**24,1% против 0% — перекос по категориям.** Адопцию ведут SaaS и dev-инструменты — ровно то сообщество, что предложило стандарт. Справочники и площадки отзывов — на нуле. И именно у них самая высокая цитируемость.

## Кривая адопции по уровням цитируемости

Если ранжировать домены по числу цитирований в ИИ и смотреть на адопцию по срезам, проявляется обратная зависимость:

| Срез по цитируемости | Доля с llms.txt |
|---|---|
| Топ-50 | 6,0% |
| Топ-100 | 7,0% |
| Топ-250 | 13,6% |
| Топ-500 | 14,4% |
| Топ-1000 | 15,3% |
| Топ-2500 | 15,9% |
| Топ-5000 | 16,1% |
| Топ-10000 | 15,7% |
| Топ-25000 | 13,7% |
| Полная выборка (37 894) | 13,3% |

Самые цитируемые домены в ИИ файла не ставят. По мере спуска по рейтингу адопция сначала растёт, потом снова оседает. Будь `llms.txt` рычагом видимости, кривая шла бы в обратную сторону: верхушка была бы насыщена файлом. Она пустует.

Если самые цитируемые домены не используют `llms.txt`, что тогда определяет ИИ-цитирование? Данные указывают на авторитет домена, глубину контента и присутствие в обучающих данных, а не на файл в корне.

## Вердикт: помогает ли файл

Прямое сравнение двух групп отвечает на вопрос.

| Показатель | С llms.txt | Без llms.txt |
|---|---|---|
| Среднее цитирований на домен | 6,8 | 6,7 |
| Медиана цитирований | 3,0 | 3,0 |
| Mann-Whitney U | — | p=0,85 |

Среднее различается на одну десятую цитирования — на масштабе 37 894 доменов это неотличимо от шума. Медианы совпадают точно: обе группы садятся на 3,0.

На полной выборке тест формально становится значимым (p&lt;0,001) — но исключительно из-за размера выборки. Размер эффекта при этом r=−0,065, ниже порога 0,1 даже для «малого» эффекта. Это статистическая значимость без практической. Наличие `llms.txt` не даёт измеримого преимущества в частоте ИИ-цитирования. Что бы ни управляло выбором источников в ИИ-ответах, это не `llms.txt`. К тому же выводу пришёл и независимый анализ [SE Ranking](https://www.searchenginejournal.com/llms-txt-shows-no-clear-effect-on-ai-citations-based-on-300k-domains/561542/) на 300 000 доменов: файл нашёлся у 10,13% и не показал измеримой связи с частотой ИИ-цитирования.

## Кто ставит файл: эхо технического сообщества

Если разложить адопцию по категориям доменов, видно, кто двигает стандарт:

| Категория | Адопция | Соотношение |
|---|---|---|
| SaaS / dev-инструменты | 24,1% | 97 из 403 |
| E-commerce | 18,2% | 10 из 55 |
| СМИ и медиа | 15,7% | 52 из 332 |
| Социальные платформы | 15,7% | 84 из 536 |
| Госсектор / академия | 11,5% | 9 из 58 |
| Справочники / вики | 0,0% | 0 из 36 |
| Площадки отзывов | 0,0% | 0 из 39 |

Адопцию ведут SaaS и dev-инструменты на 24,1% — ровно то сообщество, которое и предложило стандарт: [llms.txt предложил Джереми Ховард из Answer.AI](https://www.answer.ai/posts/2024-09-03-llmstxt.html) в сентябре 2024 года. Госсектор и академия — 1,5% от соответствующего показателя верхних категорий, справочники и площадки отзывов — ноль.

Здесь же кроется смещение выборки. Сайты, которые охотнее всего ставят `llms.txt`, и без него технически зрелые, хорошо структурированы и дружелюбны к API. Эти свойства сами по себе коррелируют с ИИ-видимостью. Файл едет вторым вагоном, а не тянет состав.

Категории с наивысшим авторитетом домена — справочники, площадки отзывов, академия — имеют наинизшую адопцию `llms.txt`. Домены, доминирующие в ИИ-цитировании, в файле не нуждаются: их цитируют за авторитет бренда и качество контента.

## Лидеры цитирования: с файлом и без

Десять самых цитируемых доменов, у которых `llms.txt` есть:

| Домен | Цитирований |
|---|---|
| prnewswire.com | 1 070 |
| github.com | 449 |
| chainalysis.com | 291 |
| accio.com | 236 |
| shopify.com | 202 |
| essfeed.com | 200 |
| sodimac.cl | 160 |
| slashdot.org | 143 |
| marketsandmarkets.com | 137 |
| trmlabs.com | 134 |

Десять самых цитируемых доменов, у которых файла нет:

| Домен | Цитирований |
|---|---|
| reddit.com | 2 769 |
| techradar.com | 2 499 |
| reuters.com | 1 915 |
| linkedin.com | 1 579 |
| forbes.com | 1 479 |
| youtube.com | 1 344 |
| wired.com | 1 244 |
| axios.com | 1 015 |
| ft.com | 945 |
| theverge.com | 943 |

Колонка без файла читается как перечень опор всего интернета. Reddit, Reuters, Forbes, LinkedIn доминируют в ИИ-цитировании без какой-либо оптимизации под `llms.txt`. Самый цитируемый адоптер — prnewswire.com с 1 070 цитированиями — отстаёт от Reddit почти втрое. Авторитет выигрывает у технического сигнала.

## Та же картина в композитном индексе

Чтобы исключить артефакт сырого подсчёта, GolOps сверил группы по композитному показателю ИИ-видимости. Он сводит присутствие, ранг, упоминания и тональность по нескольким ИИ-моделям в шкалу 0–100. Срез построен на 205 брендах, у которых есть и аудит сайта, и активный мониторинг видимости.

| Показатель видимости (0–100) | С llms.txt | Без llms.txt |
|---|---|---|
| Медиана | 23,1 | 23,6 |
| Среднее | 27,8 | 26,3 |

Разрыв в 0,4 пункта по медиане — внутри шума, причём в пользу группы без файла. Смотрим ли мы на сырые цитирования или на композитный показатель — результат один: `llms.txt` сегодня не входит в число факторов, по которым ИИ-системы формируют рекомендацию.

## Что это значит на самом деле

Наличие `llms.txt` сообщает ИИ-системам «мы хотим, чтобы нас понимали модели», но это сигнал, а не рычаг: текущие модели не читают и не приоритизируют этот файл при сборке цитирований. Скепсис разделяют и в самих поисковиках: [Джон Мюллер из Google](https://www.searchenginejournal.com/google-says-llms-txt-comparable-to-keywords-meta-tag/544804/) сравнил `llms.txt` с мета-тегом keywords — сигналом, который давно игнорируется. Цитирование определяют обучающие данные: авторитетные домены, часто линкуемый контент, размеченные страницы, тематическая релевантность. Текстовый файл по адресу `/llms.txt` не переписывает задним числом то, что модель уже выучила.

Это не значит, что файл бесполезен. Он дёшев во внедрении и полезен как практика структурирования, и когда модели начнут использовать его на этапе retrieval-augmented generation, ранние адоптеры могут выиграть. Но сегодня ИИ-видимость двигают вещи поглубже: авторитетный контент, сильный профиль ссылок, размеченные данные, регулярная публикация, тематическая экспертиза. Что именно на уровне страницы делает её пригодной для цитаты, мы разбирали в [«Анатомии ИИ-цитирования»](/publications/anatomy-of-ai-citation). Файл — страховка на будущее, а не способ попасть в выбор сейчас.

## Методология

Что лежит в основе цифр:

- **882 брендовых среза** дали 337 000+ цитирований по 102 000+ уникальных доменов — агрегированные данные ИИ-ответов.
- **37 894 домена** — отобраны как имеющие два и более появления в цитированиях; на них и проводился анализ.
- **Детекция llms.txt** — асинхронные HTTP-проверки `/llms.txt` с валидацией содержимого, чтобы отсеять HTML-страницы ошибок, мягкие 404 и редиректы на логин, отдающие статус 200.
- **Непараметрический тест** — Mann-Whitney U вместо t-теста: распределения цитирований сильно скошены вправо.
- **Контроль конфаундеров** — адоптеры `llms.txt` не отличаются систематически по баллам аудита сайта, что снимает версию «дело в качестве сайта, а не в файле».
- **Качество файлов** — среди адоптеров у 89% есть заголовок, у 98% — URL, 79% набирают 4/4 по рубрике качества. Файлы реализованы хорошо. Они просто не двигают цитирование.

Источник — производственные данные мониторинга ИИ-видимости по 882 брендам. Измеряется то, что модели реально выдают, а не идеальные условия выдачи.

## Вывод для практики

Миф обещает простую сделку: один файл в корне сайта — и ИИ-системы начинают цитировать вас чаще. Данные эту сделку не подтверждают. На 37 894 доменах группа с `llms.txt` и группа без него цитируются неотличимо: p=0,85, размер эффекта ниже порога даже для «малого». Преимущества нет ни в сырых цитированиях, ни в композитном индексе видимости. Вера в «один приём», закрывающий вопрос ИИ-видимости, держится на удобстве, а не на наблюдениях.

Видимость в ИИ — это не файл, а инфраструктура: авторитет домена, глубина контента, присутствие в обучающем корпусе и контур, который всё это измеряет и корректирует. Именно этот контур GolOps берёт под управление. Мы измеряем позицию компании в поле выбора через Индекс Контроля Выбора, разбираем, какие источники и сценарии её формируют, и переводим замер в приоритизированный план. Стратегический пилот закрывает первый цикл за 10–12 недель; Центр Управления держит контур в постоянном режиме на семи ИИ-системах. Это и есть ответ уровня инфраструктуры — там, где один файл бессилен.

**Ещё один технический сигнал, который не работает так, как обещают:**

[**Предпочитают ли ИИ-краулеры Markdown. Контролируемый эксперимент**](/publications/markdown-crawler-experiment)

## Сколько стоит вера в миф

Компания, которая поставила `llms.txt` и сочла задачу закрытой, остаётся ровно так же невидимой, как и до файла: шорт-лист формируется без неё, закупочный сценарий проходит без неё. Gartner прогнозирует, что к 2028 году 90% B2B-закупок пойдут через автономных ИИ-агентов, а Semrush уже фиксирует конверсию из ИИ-каналов в 4,4 раза выше органического поиска — то есть реальное поле смещается, пока бюджет уходит на нерычаг. Цена этой веры измеряется не в файле, а в кварталах решений, принятых без вас в комнате: каждый такой квартал — это упущенная доля от тех самых 90%.

[Запросить стратегическую диагностику →](https://golops.io/position) · [Обсудить пилот →](https://golops.io/pilot)
