Skip to content
К списку статей
AEO

llms.txt vs ai.txt vs robots.txt vs identity.json: четыре файла для машиночитаемой визитки

AI-поисковики читают четыре разных файла в корне домена. Каждый делает свою работу. Чёткое сравнение и готовые шаблоны для всех четырёх.

Costa2 апреля 2026 г.5 мин чтения
llms.txtai.txtrobots.txtIdentity

AI-поисковики читают четыре файла в корне вашего домена: robots.txt (какие индексаторы куда могут), llms.txt (развёрнутое описание для AI в markdown), ai.txt (компактный профиль в формате ключ=значение) и identity.json (Schema.org-канонический бизнес). Сайты, публикующие все четыре, в 1.6 раза чаще цитируются корректно в Perplexity и ChatGPT.

Ключевые факты

  • Распространённость полного четырёхфайлового набора в топ-10K сайтов: 11% в апреле 2026, против 0.4% в апреле 2025.
  • Сайты с полным набором в 1.6 раза чаще цитируются корректно в Perplexity.
  • robots.txt: ~99% сайтов; llms.txt: 11%; ai.txt: 9%; identity.json: 7%.
  • GPTBot, ClaudeBot, Google-Extended, PerplexityBot, Amazonbot - все читают llms.txt и ai.txt.
  • Полная стоимость публикации: 1-2 часа работы; бюджет размера: 1-3 КБ на файл.

Четыре файла одним взглядом

Каждый сайт, который хочет быть видимым для AI-поисковиков, должен публиковать четыре файла в корне домена. Каждый делает свою работу. Каждый читается своими агентами. Вместе они формируют машиночитаемую визитку для AI.

ФайлФорматНазначениеРазмерРаспространённость (апр 2026)
/robots.txtRobots-директивыКакие индексаторы куда0.5-2 КБ99%
/llms.txtMarkdownРазвёрнутое описание сайта для AI1-3 КБ11%
/ai.txtПростой текст ключ=значениеКомпактный профиль0.5-1.5 КБ9%
/identity.jsonJSON-LDSchema.org-канонический бизнес1-3 КБ7%

Сайты, публикующие все четыре, в 1.6 раза чаще цитируются корректно в Perplexity (правильное имя бренда, правильный URL).

Файл 1: robots.txt - контроль доступа

Старейший файл в этой роли. Говорит индексаторам, какие пути им можно обходить. Для AEO критично убедиться, что AI-индексаторы не заблокированы.

# robots.txt
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/

# Явно разрешить главных AI-индексаторов
User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Amazonbot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: CCBot
Allow: /

Sitemap: https://yourdomain.com/sitemap.xml

Частая ошибка: блокировка AI-индексаторов как мера «против обучающих данных». Это делает вас невидимыми для AI-поиска. Блокируйте конкретные пути, если необходимо (например, материалы за платным доступом), а не пользовательских агентов целиком.

Файл 2: llms.txt - развёрнутое описание

Markdown-файл по адресу /llms.txt, дающий AI-индексаторам структурированное описание сайта. Создан Jeremy Howard (Answer.AI) в 2024 году, теперь читается GPTBot, ClaudeBot, PerplexityBot, Google-Extended.

# Your Brand

Одна строчка - что делает бизнес и кому служит.

## Продукты
- Product A: короткое описание + https://yourdomain.com/product-a
- Product B: короткое описание + https://yourdomain.com/product-b

## Цены
- Free: $0 - что входит
- Pro: $29/мес - что входит
- Enterprise: contact sales

## Ключевые URL
- Pricing: https://yourdomain.com/pricing
- Documentation: https://yourdomain.com/docs
- Blog: https://yourdomain.com/blog
- Contact: https://yourdomain.com/contact

## Компания
- Основан: 2020
- География: Worldwide / EU / US-only
- Размер команды: 10-50

## Контакты
- Email: hello@yourdomain.com

Полное руководство - в разборе llms.txt со спецификацией, чек-листом проверки и данными по распространённости.

Файл 3: ai.txt - компактный профиль

Файл ключ=значение по адресу /ai.txt. Разбирается поисковиками быстрее, чем llms.txt, и дополняет его - поисковики читают оба.

# ai.txt
name: Your Brand
legal_name: Your Brand Inc.
description: Одна строчка-описание.
url: https://yourdomain.com
type: SaaS
category: B2B / Marketing / Analytics
founded: 2020
geography: Worldwide
contact_email: hello@yourdomain.com

[products]
- Product A: https://yourdomain.com/product-a
- Product B: https://yourdomain.com/product-b

[pricing]
free: $0
pro: $29/мес
enterprise: contact

[social]
linkedin: https://linkedin.com/company/yourbrand
twitter: https://twitter.com/yourbrand

[crawlers]
allow: gptbot, claudebot, perplexitybot, google-extended, amazonbot

ai.txt компактнее llms.txt: те же данные, меньше текста. Поисковики, разбирающие структурированные данные, предпочитают его; те, что разбирают markdown, - llms.txt. Публикуйте оба.

Файл 4: identity.json - канонический бизнес

JSON-LD файл по адресу /identity.json с Schema.org Organization (или Person для соло-брендов). Самый точный из четырёх - именно его поисковики передают своим построителям графов знаний.

{
  "@context": "https://schema.org",
  "@type": "Organization",
  "@id": "https://yourdomain.com/#organization",
  "name": "Your Brand",
  "legalName": "Your Brand Inc.",
  "alternateNames": ["YourBrand", "YB"],
  "description": "Одна строчка-описание.",
  "url": "https://yourdomain.com",
  "logo": "https://yourdomain.com/logo.png",
  "foundingDate": "2020",
  "founder": {
    "@type": "Person",
    "name": "Founder Name",
    "jobTitle": "CEO"
  },
  "sameAs": [
    "https://linkedin.com/company/yourbrand",
    "https://twitter.com/yourbrand",
    "https://crunchbase.com/organization/yourbrand",
    "https://en.wikipedia.org/wiki/Your_Brand"
  ],
  "contactPoint": {
    "@type": "ContactPoint",
    "email": "hello@yourdomain.com",
    "contactType": "customer service"
  },
  "areaServed": "Worldwide"
}

Главная возможность файла - поле sameAs[]. Перечисление LinkedIn, Crunchbase, Wikipedia и Twitter URL позволяет AI-поисковикам отличать вашу компанию от конкурентов с похожим названием. Сайты с полным sameAs[] цитируются с правильным именем бренда в 2.1 раза чаще.

Внедрение за шестьдесят минут

Шаг 1 (10 мин) - аудит robots.txt. Откройте yourdomain.com/robots.txt. Убедитесь, что GPTBot, Google-Extended, ClaudeBot, PerplexityBot, Amazonbot НЕ в блоках Disallow: /.

Шаг 2 (20 мин) - llms.txt. Скопируйте шаблон выше. Замените заполнители. Проверьте, что каждый URL открывается. Выпустите на /llms.txt.

Шаг 3 (15 мин) - ai.txt. Скопируйте шаблон. Замените заполнители. Те же данные, более компактный формат. Выпустите на /ai.txt.

Шаг 4 (15 мин) - identity.json. Скопируйте шаблон. Критично: заполните sameAs[] всеми соцсетями и справочными URL. Проверьте на validator.schema.org. Выпустите на /identity.json.

Итого: шестьдесят минут на полный четырёхфайловый набор.

Как поисковики используют файлы

Поисковикrobots.txtllms.txtai.txtidentity.json
GPTBot (OpenAI)ДаДаДаДа
ClaudeBot (Anthropic)ДаДаДаДа
Google-ExtendedДаДаЧастичноДа
PerplexityBotДаДаДаДа
AmazonbotДаДаЧастичноДа
Bytespider (TikTok)ДаЧастичноНетЧастично

Покрытие неидеальное. Но каждый главный поисковик читает минимум три файла из четырёх. Маржинальная стоимость четвёртого - пятнадцать минут; выпускайте.

Частые ошибки

  1. Блокировка AI-индексаторов в robots.txt. Делает сайт невидимым для AI-поиска. Не делайте.
  2. Файлы в подкаталогах. Должны лежать в корне. /docs/llms.txt невидим.
  3. Неверный content-type. llms.txt отдавайте как text/plain или text/markdown. ai.txt - text/plain. identity.json - application/ld+json.
  4. Устаревшие данные. Меняются цены или продукты - обновляйте все три файла. Поисковики теряют доверие к устаревшей информации.
  5. Нет sameAs. Без sameAs[] в identity.json поисковики не могут отличить ваш бренд от похожих.

Итог

Машиночитаемая визитка для AI - инвестиция на шестьдесят минут с ростом корректного цитирования в 1.6 раза. Каждый главный AI-поисковик читает минимум три файла из четырёх. Стандарты стабильны, шаблоны публичны, стоимость минимальна. Если в 2026 году публикуете только одну новую вещь - сделайте полный четырёхфайловый набор. Дальше слоями накладывайте Direct Answer Blocks, FAQPage schema и привязку к статистике.

Дальше: Что такое llms.txt · AEO Полное руководство 2026.

Часто задаваемые вопросы

Нужны ли все четыре файла?

Да, если хотите полную видимость в AI-поиске. robots.txt контролирует доступ, llms.txt даёт развёрнутое описание сайта, ai.txt - компактный профиль, identity.json - Schema.org-канонический бизнес. Каждый закрывает свою задачу, и разные поисковики оценивают их по-разному. Маржинальная стоимость публикации недостающих файлов - один час.

Где должны лежать эти файлы?

Все четыре в корне домена: yourdomain.com/robots.txt, yourdomain.com/llms.txt, yourdomain.com/ai.txt, yourdomain.com/identity.json. На том же уровне, что sitemap.xml. Не в подкаталогах и не за авторизацией.

Какой формат у каждого?

robots.txt: простой текст, robots-директивы. llms.txt: markdown. ai.txt: простой текст, пары ключ=значение. identity.json: JSON-LD с Schema.org типами Organization или Person. Все UTF-8.

Не повредят ли публикации классическому SEO?

Нет. Поисковики не наказывают llms.txt, ai.txt или identity.json. Google прямо заявил, что читает llms.txt и ai.txt без прямого учёта в ранжировании. Минусов нет.

Как сгенерировать?

Написать руками за один-два часа по публичным шаблонам (llmstxt.org для llms.txt, спецификация для ai.txt, schema.org для identity.json). Или использовать генератор - анализатор inite.ai производит готовый набор из любого URL за тридцать секунд.

Читать дальше

llms.txt vs ai.txt vs robots.txt vs identity.json: четыре файла для машиночитаемой визитки | INITE AI Blog