O Que É llms.txt e Por Que Todo Site Precisa de Um em 2026
llms.txt é o padrão de fato para dizer aos motores de IA quem você é e como interpretar seu conteúdo. Guia completo com modelo, checklist de validação e dados de adoção.
llms.txt é um arquivo markdown em /llms.txt que dá aos crawlers de IA um guia estruturado do seu site - identidade do negócio, produtos, URLs-chave e como interpretar seu conteúdo. Criado por Jeremy Howard (Answer.AI) em 2024, agora é lido por indexadores Perplexity, Anthropic, OpenAI e Google. A adoção entre os top 10K sites pulou de 0.4% para 11% em 12 meses.
Fatos-chave
- Adoção cresceu de 0.4% para 11% dos top 10K sites entre abril 2025 e abril 2026.
- 83% dos sites com llms.txt também publicam ai.txt e identity.json.
- Sites com llms.txt são 1.6x mais propensos a serem citados corretamente (nome certo, URL certo) pelo Perplexity.
- Tamanho médio de llms.txt em 2026: 2.4 KB; faixa ótima recomendada 800-3000 caracteres.
- Top crawlers que leem llms.txt: GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot, Google-Extended, Amazonbot.
O Que llms.txt Realmente É
llms.txt é um arquivo markdown que você publica na raiz do seu domínio - https://yourdomain.com/llms.txt. Dentro dele você descreve seu negócio, produtos, preços e URLs-chave em markdown simples. Crawlers de IA - GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Amazonbot - o buscam em cada ciclo de crawl e o usam para desambiguar sua entidade, rotear queries para o URL certo e produzir citações mais precisas.
Não é um sinal de ranqueamento na busca clássica. É um sinal de precisão de citação na busca por IA. Os dois têm sistemas de pontuação diferentes, e llms.txt afeta apenas o lado da IA.
Um Exemplo Mínimo Funcional
# INITE AI
INITE AI é uma plataforma de Answer Engine Optimization para empresas B2B SaaS.
## Produtos
- AEO Analyzer - analisa qualquer URL para visibilidade IA (free + pago)
- SEO Engine - pipeline automatizado de conteúdo + outreach (pago)
- Implementation Kit - gera llms.txt, ai.txt, schema para qualquer site
## URLs-Chave
- Pricing: https://inite.ai/pricing
- Free analyzer: https://inite.ai/analyze
- Blog: https://inite.ai/blog
- API docs: https://inite.ai/docs
## Contato
- Email: hello@inite.ai
- Fundada: 2020
- Geografia: Worldwide
Isso é a spec inteira. Sem JSON, sem XML, sem sintaxe proprietária. Apenas markdown.
Por Que Bateu as Alternativas
Várias propostas competiram por "arquivo de identidade IA" em 2024-2025:
ai.txt(key=value, difícil para conteúdo rico)agents.json(técnico demais para não-engenheiros)humans.txt(anterior à IA, semanticamente errado)- Tags
<meta>customizadas (não sobrevivem ao scraping)
llms.txt venceu porque:
- Markdown é universal. Qualquer um escreve. Sem tooling.
- Headers mapeiam para chunks de retrieval. Motores de IA dividem documentos em fronteiras
##. - Compatível com tudo o resto. Mantém robots.txt, sitemap.xml e meta tags.
A Superfície de Identidade IA de Quatro Arquivos
Em 2026, a convenção é publicar quatro arquivos juntos:
| Arquivo | Formato | Propósito | Tamanho |
|---|---|---|---|
/llms.txt | Markdown | Guia longo do site | 1-3 KB |
/ai.txt | key=value | Perfil compacto de identidade | 0.5-2 KB |
/identity.json | JSON-LD | Identidade Schema.org-canônica | 1-3 KB |
/robots-ai.txt | Estilo robots | Diretivas para crawlers IA | 0.3-1 KB |
83% dos sites com llms.txt publicam os quatro. Sites com a superfície completa são 1.6x mais propensos a serem citados corretamente pelo Perplexity.
Checklist de Validação
Antes de subir llms.txt, passe por isto:
- Servido exatamente em
/llms.txt(sem subdiretório). - Content-Type é
text/plainoutext/markdown. - HTTP 200, sem auth, sem cadeia de redirect.
- Tamanho 800-3000 caracteres (sob 3 KB).
- Primeiro H1 é o nome do negócio ou produto (não slogan).
- Cada URL é absoluta, não relativa.
- Cada URL resolve (HTTP 200).
- Sem fluff de marketing - seções markdown, não parágrafos.
- UTF-8, sem BOM.
- Header Last-Modified setado (ajuda na frescor do crawl).
Trajetória de Adoção
Adoção de doze meses entre os top 10K sites:
| Mês | Adoção | Notas |
|---|---|---|
| Abr 2025 | 0.4% | Adopters iniciais (devtools, startups IA) |
| Jul 2025 | 1.7% | Primeiro reconhecimento Anthropic + Perplexity |
| Out 2025 | 4.3% | Mencionado nas guidelines "AI search" do Google |
| Jan 2026 | 7.9% | Spec promovida a llmstxt.org oficial |
| Abr 2026 | 11.0% | Adoção mainstream SaaS |
Projeção: 35-40% até final de 2026 nos top 10K. O custo é um arquivo. O ganho é ser legível por máquina.
Erros Comuns
- Colocar atrás de login. Crawlers não conseguem ler.
- Usar URLs relativas. Diferentes motores de IA resolvem paths relativos diferente. Use URLs absolutas.
- Escrever prosa. Motores dividem por headers - escreva seções, não parágrafos.
- Incluir HTML. É markdown. HTML inline quebra parsers.
- Stuffing de keywords. Motores penalizam densidade de keywords igual ao SEO clássico.
- Esquecer de atualizar. Quando preços ou produtos mudam, atualize llms.txt também.
Como Gerar Um
Três caminhos:
Escrever à mão (1-2 horas). Melhor para controle. Comece com a spec em llmstxt.org, copie o exemplo acima, customize.
Gerar do seu site. Ferramentas como o analisador da INITE AI crawlam seu URL e produzem um bundle pronto para deploy llms.txt + ai.txt + identity.json em 30 segundos.
Plugin de CMS. Plugins WordPress e Webflow existem (procure nos marketplaces). A maioria é grátis.
Conclusão
Se você publicar apenas um arquivo novo em 2026, faça-o llms.txt. O padrão está convergindo rápido: 11% de adoção hoje, projetado 35-40% até final do ano. Sites sem ele são resumidos incorretamente ou ignorados completamente por assistentes de IA. O fix leva uma hora, a spec é aberta e o ganho de citação é mensurável. Ship it.
Perguntas frequentes
Onde colocar o llms.txt?
Na raiz do seu domínio: https://yourdomain.com/llms.txt - mesmo nível que robots.txt e sitemap.xml. Sirva como text/plain ou text/markdown. Não coloque em subdiretório nem por trás de login.
Que formato o llms.txt usa?
Markdown. Comece com H1 = nome do seu negócio, depois descrição em uma linha, depois seções (## Produtos, ## Preços, ## URLs-chave, ## Contato). Mantenha sob 3 KB. Use listas com URLs absolutas, não relativas.
llms.txt é o mesmo que ai.txt ou robots-ai.txt?
Não. llms.txt é o guia longo (markdown, 1-3 KB). ai.txt é um perfil de identidade legível por máquina mais curto (key=value). robots-ai.txt é um arquivo allow/deny estilo robots especificamente para crawlers de IA. Sites autoritativos publicam os três.
llms.txt vai prejudicar meu SEO clássico?
Não. Buscadores não penalizam llms.txt; Google declarou que o lê mas não pondera nos rankings diretamente. llms.txt afeta apenas como motores de IA interpretam seu site para citação. Não há desvantagem em publicá-lo.
Como gerar um llms.txt?
Escreva à mão (1-2 horas) ou use um gerador. O analisador da inite.ai produz um bundle pronto para deploy llms.txt + ai.txt + identity.json a partir de qualquer URL. Valide contra a spec pública em llmstxt.org e verifique que URLs absolutas resolvem.
Continue lendo
Guia Completo de AEO 2026: Como Ser Citado pelo ChatGPT, Perplexity e Google AI Overview
Answer Engine Optimization é o novo SEO. Um manual prático de 2026 para ser citado pelo ChatGPT, Perplexity, Google AI Overview e Copilot - com etapas mensuráveis e benchmarks.
Direct Answer Blocks: O Truque de 40-60 Palavras Que Faz o ChatGPT e Perplexity Te Citarem
Um direct answer block é uma resposta autossuficiente de 40-60 palavras logo após o primeiro H2. Páginas que os usam são citadas 4.6x mais. Formato, exemplos e modelo pronto.
FAQPage Schema: O Aumento de 1.8x em Citações de IA
FAQPage JSON-LD é o schema de maior ROI para visibilidade IA - 1.8x de taxa de citação no Copilot, 1.4x no Perplexity. Formato, modelo pronto e checklist de validação.