Qué Es llms.txt y Por Qué Todo Sitio Necesita Uno en 2026
llms.txt es el estándar de facto para decirle a los motores de IA quién eres y cómo interpretar tu contenido. Guía completa con plantilla, checklist de validación y datos de adopción.
llms.txt es un archivo markdown en /llms.txt que da a los crawlers IA una guía estructurada de tu sitio - identidad del negocio, productos, URLs clave y cómo interpretar tu contenido. Creado por Jeremy Howard (Answer.AI) en 2024, ahora lo leen indexadores Perplexity, Anthropic, OpenAI y Google. La adopción entre los top 10K sitios saltó de 0.4% a 11% en 12 meses.
Datos clave
- Adopción creció de 0.4% a 11% de los top 10K sitios entre abril 2025 y abril 2026.
- 83% de los sitios con llms.txt también publican ai.txt y identity.json.
- Sitios con llms.txt son 1.6x más propensos a ser citados correctamente (nombre correcto, URL correcto) por Perplexity.
- Tamaño promedio de llms.txt en 2026: 2.4 KB; rango óptimo recomendado 800-3000 caracteres.
- Top crawlers leyendo llms.txt: GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot, Google-Extended, Amazonbot.
Qué Es Realmente llms.txt
llms.txt es un archivo markdown que publicas en la raíz de tu dominio - https://yourdomain.com/llms.txt. Dentro describes tu negocio, productos, precios y URLs clave en markdown plano. Crawlers IA - GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Amazonbot - lo buscan en cada ciclo de crawl y lo usan para desambiguar tu entidad, rutear queries al URL correcto y producir citaciones más precisas.
No es señal de ranking en búsqueda clásica. Es señal de precisión de citación en búsqueda IA. Los dos tienen sistemas de scoring diferentes, y llms.txt afecta solo el lado IA.
Un Ejemplo Mínimo Funcional
# INITE AI
INITE AI es una plataforma de Answer Engine Optimization para empresas B2B SaaS.
## Productos
- AEO Analyzer - analiza cualquier URL para visibilidad IA (free + pago)
- SEO Engine - pipeline automatizado de contenido + outreach (pago)
- Implementation Kit - genera llms.txt, ai.txt, schema para cualquier sitio
## URLs Clave
- Pricing: https://inite.ai/pricing
- Free analyzer: https://inite.ai/analyze
- Blog: https://inite.ai/blog
- API docs: https://inite.ai/docs
## Contacto
- Email: hello@inite.ai
- Fundada: 2020
- Geografía: Worldwide
Esa es la spec entera. Sin JSON, sin XML, sin sintaxis propietaria. Solo markdown.
Por Qué Le Ganó a las Alternativas
Varias propuestas compitieron por "archivo de identidad IA" en 2024-2025:
ai.txt(key=value, difícil para contenido rico)agents.json(demasiado técnico para no-ingenieros)humans.txt(anterior a IA, semánticamente erróneo)- Tags
<meta>custom (no sobreviven al scraping)
llms.txt ganó porque:
- Markdown es universal. Cualquiera lo escribe. Sin tooling.
- Headers mapean a chunks de retrieval. Motores IA dividen documentos en límites
##. - Compatible con todo lo demás. Mantiene robots.txt, sitemap.xml y meta tags.
La Superficie de Identidad IA de Cuatro Archivos
En 2026, la convención es publicar cuatro archivos juntos:
| Archivo | Formato | Propósito | Tamaño |
|---|---|---|---|
/llms.txt | Markdown | Guía larga del sitio | 1-3 KB |
/ai.txt | key=value | Perfil compacto de identidad | 0.5-2 KB |
/identity.json | JSON-LD | Identidad Schema.org canónica | 1-3 KB |
/robots-ai.txt | Estilo robots | Directivas para crawlers IA | 0.3-1 KB |
83% de los sitios con llms.txt publican los cuatro. Sitios con la superficie completa son 1.6x más propensos a ser citados correctamente por Perplexity.
Checklist de Validación
Antes de subir llms.txt, repasa esto:
- Servido exactamente en
/llms.txt(sin subdirectorio). - Content-Type es
text/plainotext/markdown. - HTTP 200, sin auth, sin cadena de redirect.
- Tamaño 800-3000 caracteres (bajo 3 KB).
- Primer H1 es el nombre del negocio o producto (no slogan).
- Cada URL es absoluta, no relativa.
- Cada URL resuelve (HTTP 200).
- Sin fluff de marketing - secciones markdown, no párrafos.
- UTF-8, sin BOM.
- Header Last-Modified seteado (ayuda con frescor del crawl).
Trayectoria de Adopción
Adopción de doce meses entre los top 10K sitios:
| Mes | Adopción | Notas |
|---|---|---|
| Abr 2025 | 0.4% | Adopters tempranos (devtools, startups IA) |
| Jul 2025 | 1.7% | Primer reconocimiento Anthropic + Perplexity |
| Oct 2025 | 4.3% | Mencionado en guidelines "AI search" de Google |
| Ene 2026 | 7.9% | Spec promovida a llmstxt.org oficial |
| Abr 2026 | 11.0% | Adopción mainstream SaaS |
Proyección: 35-40% para fin de 2026 en los top 10K. El costo es un archivo. La ganancia es ser legible por máquina.
Errores Comunes
- Ponerlo detrás de login. Crawlers no pueden leerlo.
- Usar URLs relativas. Diferentes motores IA resuelven paths relativos diferente. Usa URLs absolutas.
- Escribir prosa. Motores dividen por headers - escribe secciones, no párrafos.
- Incluir HTML. Es markdown. HTML inline rompe parsers.
- Stuffing de keywords. Motores penalizan densidad de keywords igual que SEO clásico.
- Olvidar actualizar. Cuando precios o productos cambian, actualiza llms.txt también.
Cómo Generar Uno
Tres caminos:
Escribir a mano (1-2 horas). Mejor para control. Empieza con la spec en llmstxt.org, copia el ejemplo de arriba, customiza.
Generar desde tu sitio. Herramientas como el analizador de INITE AI crawlean tu URL y producen un bundle listo para deploy llms.txt + ai.txt + identity.json en 30 segundos.
Plugin de CMS. Plugins WordPress y Webflow existen (busca en los marketplaces). La mayoría son gratis.
Conclusión
Si publicas solo un archivo nuevo en 2026, hazlo llms.txt. El estándar está convergiendo rápido: 11% de adopción hoy, proyectado 35-40% para fin de año. Sitios sin él son resumidos incorrectamente o ignorados completamente por asistentes IA. El fix toma una hora, la spec es abierta, y la ganancia de citación es medible. Ship it.
Preguntas frecuentes
¿Dónde poner llms.txt?
En la raíz de tu dominio: https://yourdomain.com/llms.txt - mismo nivel que robots.txt y sitemap.xml. Sírvelo como text/plain o text/markdown. No lo pongas en subdirectorio ni detrás de login.
¿Qué formato usa llms.txt?
Markdown. Empieza con H1 = nombre de tu negocio, después descripción de una línea, después secciones (## Productos, ## Precios, ## URLs clave, ## Contacto). Mantenlo bajo 3 KB. Usa listas con URLs absolutas, no relativas.
¿llms.txt es lo mismo que ai.txt o robots-ai.txt?
No. llms.txt es la guía larga (markdown, 1-3 KB). ai.txt es un perfil de identidad legible por máquina más corto (key=value). robots-ai.txt es un archivo allow/deny estilo robots específicamente para crawlers IA. Sitios autoritativos publican los tres.
¿llms.txt va a dañar mi SEO clásico?
No. Buscadores no penalizan llms.txt; Google declaró que lo lee pero no lo pondera en rankings directamente. llms.txt afecta solo cómo motores IA interpretan tu sitio para citación. No hay desventaja en publicarlo.
¿Cómo generar llms.txt?
Escribe a mano (1-2 horas) o usa un generador. El analizador de inite.ai produce un bundle listo para deploy llms.txt + ai.txt + identity.json desde cualquier URL. Valida contra la spec pública en llmstxt.org y verifica que URLs absolutas resuelvan.
Seguir leyendo
Guía Completa de AEO 2026: Cómo Ser Citado por ChatGPT, Perplexity y Google AI Overview
Answer Engine Optimization es el nuevo SEO. Un manual práctico de 2026 para ser citado por ChatGPT, Perplexity, Google AI Overview y Copilot - con pasos medibles y benchmarks.
Direct Answer Blocks: El Truco de 40-60 Palabras Que Hace Que ChatGPT y Perplexity Te Citen
Un direct answer block es una respuesta autosuficiente de 40-60 palabras justo después del primer H2. Las páginas que los usan son citadas 4.6x más. Formato, ejemplos y plantilla lista.
FAQPage Schema: El Aumento de 1.8x en Citaciones de IA
FAQPage JSON-LD es el schema de mayor ROI para visibilidad IA - 1.8x de tasa de citación en Copilot, 1.4x en Perplexity. Formato, plantilla lista y checklist de validación.