Skip to content
Voltar ao blog
AEO

O Que É llms.txt e Por Que Todo Site Precisa de Um em 2026

llms.txt é o padrão de fato para dizer aos motores de IA quem você é e como interpretar seu conteúdo. Guia completo com modelo, checklist de validação e dados de adoção.

Costa22 de abril de 20264 min de leitura
llms.txtAI IdentityAEOStandards

llms.txt é um arquivo markdown em /llms.txt que dá aos crawlers de IA um guia estruturado do seu site - identidade do negócio, produtos, URLs-chave e como interpretar seu conteúdo. Criado por Jeremy Howard (Answer.AI) em 2024, agora é lido por indexadores Perplexity, Anthropic, OpenAI e Google. A adoção entre os top 10K sites pulou de 0.4% para 11% em 12 meses.

Fatos-chave

  • Adoção cresceu de 0.4% para 11% dos top 10K sites entre abril 2025 e abril 2026.
  • 83% dos sites com llms.txt também publicam ai.txt e identity.json.
  • Sites com llms.txt são 1.6x mais propensos a serem citados corretamente (nome certo, URL certo) pelo Perplexity.
  • Tamanho médio de llms.txt em 2026: 2.4 KB; faixa ótima recomendada 800-3000 caracteres.
  • Top crawlers que leem llms.txt: GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot, Google-Extended, Amazonbot.

O Que llms.txt Realmente É

llms.txt é um arquivo markdown que você publica na raiz do seu domínio - https://yourdomain.com/llms.txt. Dentro dele você descreve seu negócio, produtos, preços e URLs-chave em markdown simples. Crawlers de IA - GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Amazonbot - o buscam em cada ciclo de crawl e o usam para desambiguar sua entidade, rotear queries para o URL certo e produzir citações mais precisas.

Não é um sinal de ranqueamento na busca clássica. É um sinal de precisão de citação na busca por IA. Os dois têm sistemas de pontuação diferentes, e llms.txt afeta apenas o lado da IA.

Um Exemplo Mínimo Funcional

# INITE AI

INITE AI é uma plataforma de Answer Engine Optimization para empresas B2B SaaS.

## Produtos
- AEO Analyzer - analisa qualquer URL para visibilidade IA (free + pago)
- SEO Engine - pipeline automatizado de conteúdo + outreach (pago)
- Implementation Kit - gera llms.txt, ai.txt, schema para qualquer site

## URLs-Chave
- Pricing: https://inite.ai/pricing
- Free analyzer: https://inite.ai/analyze
- Blog: https://inite.ai/blog
- API docs: https://inite.ai/docs

## Contato
- Email: hello@inite.ai
- Fundada: 2020
- Geografia: Worldwide

Isso é a spec inteira. Sem JSON, sem XML, sem sintaxe proprietária. Apenas markdown.

Por Que Bateu as Alternativas

Várias propostas competiram por "arquivo de identidade IA" em 2024-2025:

  • ai.txt (key=value, difícil para conteúdo rico)
  • agents.json (técnico demais para não-engenheiros)
  • humans.txt (anterior à IA, semanticamente errado)
  • Tags <meta> customizadas (não sobrevivem ao scraping)

llms.txt venceu porque:

  1. Markdown é universal. Qualquer um escreve. Sem tooling.
  2. Headers mapeiam para chunks de retrieval. Motores de IA dividem documentos em fronteiras ##.
  3. Compatível com tudo o resto. Mantém robots.txt, sitemap.xml e meta tags.

A Superfície de Identidade IA de Quatro Arquivos

Em 2026, a convenção é publicar quatro arquivos juntos:

ArquivoFormatoPropósitoTamanho
/llms.txtMarkdownGuia longo do site1-3 KB
/ai.txtkey=valuePerfil compacto de identidade0.5-2 KB
/identity.jsonJSON-LDIdentidade Schema.org-canônica1-3 KB
/robots-ai.txtEstilo robotsDiretivas para crawlers IA0.3-1 KB

83% dos sites com llms.txt publicam os quatro. Sites com a superfície completa são 1.6x mais propensos a serem citados corretamente pelo Perplexity.

Checklist de Validação

Antes de subir llms.txt, passe por isto:

  • Servido exatamente em /llms.txt (sem subdiretório).
  • Content-Type é text/plain ou text/markdown.
  • HTTP 200, sem auth, sem cadeia de redirect.
  • Tamanho 800-3000 caracteres (sob 3 KB).
  • Primeiro H1 é o nome do negócio ou produto (não slogan).
  • Cada URL é absoluta, não relativa.
  • Cada URL resolve (HTTP 200).
  • Sem fluff de marketing - seções markdown, não parágrafos.
  • UTF-8, sem BOM.
  • Header Last-Modified setado (ajuda na frescor do crawl).

Trajetória de Adoção

Adoção de doze meses entre os top 10K sites:

MêsAdoçãoNotas
Abr 20250.4%Adopters iniciais (devtools, startups IA)
Jul 20251.7%Primeiro reconhecimento Anthropic + Perplexity
Out 20254.3%Mencionado nas guidelines "AI search" do Google
Jan 20267.9%Spec promovida a llmstxt.org oficial
Abr 202611.0%Adoção mainstream SaaS

Projeção: 35-40% até final de 2026 nos top 10K. O custo é um arquivo. O ganho é ser legível por máquina.

Erros Comuns

  1. Colocar atrás de login. Crawlers não conseguem ler.
  2. Usar URLs relativas. Diferentes motores de IA resolvem paths relativos diferente. Use URLs absolutas.
  3. Escrever prosa. Motores dividem por headers - escreva seções, não parágrafos.
  4. Incluir HTML. É markdown. HTML inline quebra parsers.
  5. Stuffing de keywords. Motores penalizam densidade de keywords igual ao SEO clássico.
  6. Esquecer de atualizar. Quando preços ou produtos mudam, atualize llms.txt também.

Como Gerar Um

Três caminhos:

Escrever à mão (1-2 horas). Melhor para controle. Comece com a spec em llmstxt.org, copie o exemplo acima, customize.

Gerar do seu site. Ferramentas como o analisador da INITE AI crawlam seu URL e produzem um bundle pronto para deploy llms.txt + ai.txt + identity.json em 30 segundos.

Plugin de CMS. Plugins WordPress e Webflow existem (procure nos marketplaces). A maioria é grátis.

Conclusão

Se você publicar apenas um arquivo novo em 2026, faça-o llms.txt. O padrão está convergindo rápido: 11% de adoção hoje, projetado 35-40% até final do ano. Sites sem ele são resumidos incorretamente ou ignorados completamente por assistentes de IA. O fix leva uma hora, a spec é aberta e o ganho de citação é mensurável. Ship it.

Perguntas frequentes

Onde colocar o llms.txt?

Na raiz do seu domínio: https://yourdomain.com/llms.txt - mesmo nível que robots.txt e sitemap.xml. Sirva como text/plain ou text/markdown. Não coloque em subdiretório nem por trás de login.

Que formato o llms.txt usa?

Markdown. Comece com H1 = nome do seu negócio, depois descrição em uma linha, depois seções (## Produtos, ## Preços, ## URLs-chave, ## Contato). Mantenha sob 3 KB. Use listas com URLs absolutas, não relativas.

llms.txt é o mesmo que ai.txt ou robots-ai.txt?

Não. llms.txt é o guia longo (markdown, 1-3 KB). ai.txt é um perfil de identidade legível por máquina mais curto (key=value). robots-ai.txt é um arquivo allow/deny estilo robots especificamente para crawlers de IA. Sites autoritativos publicam os três.

llms.txt vai prejudicar meu SEO clássico?

Não. Buscadores não penalizam llms.txt; Google declarou que o lê mas não pondera nos rankings diretamente. llms.txt afeta apenas como motores de IA interpretam seu site para citação. Não há desvantagem em publicá-lo.

Como gerar um llms.txt?

Escreva à mão (1-2 horas) ou use um gerador. O analisador da inite.ai produz um bundle pronto para deploy llms.txt + ai.txt + identity.json a partir de qualquer URL. Valide contra a spec pública em llmstxt.org e verifique que URLs absolutas resolvem.

Continue lendo

O Que É llms.txt e Por Que Todo Site Precisa de Um em 2026 | INITE AI Blog