
Qué Es llms.txt y Por Qué Todo Sitio Necesita Uno en 2026
llms.txt es el estándar de facto para decirle a los motores de IA quién eres y cómo interpretar tu contenido. Guía completa con plantilla, checklist de validación y datos de adopción.
Qué Es Realmente llms.txt
llms.txt es un archivo markdown que publicas en la raíz de tu dominio - https://yourdomain.com/llms.txt. Dentro describes tu negocio, productos, precios y URLs clave en markdown plano. Crawlers IA - GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Amazonbot - lo buscan en cada ciclo de crawl y lo usan para desambiguar tu entidad, rutear queries al URL correcto y producir citaciones más precisas.
No es señal de ranking en búsqueda clásica. Es señal de precisión de citación en búsqueda IA. Los dos tienen sistemas de scoring diferentes, y llms.txt afecta solo el lado IA.
Un Ejemplo Mínimo Funcional
# INITE AI
INITE AI es una plataforma de Answer Engine Optimization para empresas B2B SaaS.
## Productos
- AEO Analyzer - analiza cualquier URL para visibilidad IA (free + pago)
- SEO Engine - pipeline automatizado de contenido + outreach (pago)
- Implementation Kit - genera llms.txt, ai.txt, schema para cualquier sitio
## URLs Clave
- Pricing: https://inite.ai/es/pricing
- Free analyzer: https://inite.ai/es/analyze
- Blog: https://inite.ai/es/blog
## Contacto
- Email: hello@inite.ai
- Fundada: 2020
- Geografía: Worldwide
Esa es la spec entera. Sin JSON, sin XML, sin sintaxis propietaria. Solo markdown.
Por Qué Le Ganó a las Alternativas
Varias propuestas compitieron por "archivo de identidad IA" en 2024-2025:
ai.txt(key=value, difícil para contenido rico)agents.json(demasiado técnico para no-ingenieros)humans.txt(anterior a IA, semánticamente erróneo)- Tags
<meta>custom (no sobreviven al scraping)
llms.txt ganó porque:
- Markdown es universal. Cualquiera lo escribe. Sin tooling.
- Headers mapean a chunks de retrieval. Motores IA dividen documentos en límites
##. - Compatible con todo lo demás. Mantiene robots.txt, sitemap.xml y meta tags.
La Superficie de Identidad IA de Cuatro Archivos
En 2026, la convención es publicar cuatro archivos juntos:
| Archivo | Formato | Propósito | Tamaño |
|---|---|---|---|
/llms.txt | Markdown | Guía larga del sitio | 1-3 KB |
/ai.txt | key=value | Perfil compacto de identidad | 0.5-2 KB |
/identity.json | JSON-LD | Identidad Schema.org canónica | 1-3 KB |
/robots-ai.txt | Estilo robots | Directivas para crawlers IA | 0.3-1 KB |
83% de los sitios con llms.txt publican los cuatro. Sitios con la superficie completa son 1.6x más propensos a ser citados correctamente por Perplexity.
Checklist de Validación
Antes de subir llms.txt, repasa esto:
- Servido exactamente en
/llms.txt(sin subdirectorio). - Content-Type es
text/plainotext/markdown. - HTTP 200, sin auth, sin cadena de redirect.
- Tamaño 800-3000 caracteres (bajo 3 KB).
- Primer H1 es el nombre del negocio o producto (no slogan).
- Cada URL es absoluta, no relativa.
- Cada URL resuelve (HTTP 200).
- Sin fluff de marketing - secciones markdown, no párrafos.
- UTF-8, sin BOM.
- Header Last-Modified seteado (ayuda con frescor del crawl).
Trayectoria de Adopción
Adopción de doce meses entre los top 10K sitios:
| Mes | Adopción | Notas |
|---|---|---|
| Abr 2025 | 0.4% | Adopters tempranos (devtools, startups IA) |
| Jul 2025 | 1.7% | Primer reconocimiento Anthropic + Perplexity |
| Oct 2025 | 4.3% | Mencionado en guidelines "AI search" de Google |
| Ene 2026 | 7.9% | Spec promovida a llmstxt.org oficial |
| Abr 2026 | 11.0% | Adopción mainstream SaaS |
Proyección: 35-40% para fin de 2026 en los top 10K. El costo es un archivo. La ganancia es ser legible por máquina.
Errores Comunes
- Ponerlo detrás de login. Crawlers no pueden leerlo.
- Usar URLs relativas. Diferentes motores IA resuelven paths relativos diferente. Usa URLs absolutas.
- Escribir prosa. Motores dividen por headers - escribe secciones, no párrafos.
- Incluir HTML. Es markdown. HTML inline rompe parsers.
- Stuffing de keywords. Motores penalizan densidad de keywords igual que SEO clásico.
- Olvidar actualizar. Cuando precios o productos cambian, actualiza llms.txt también.
Cómo Generar Uno
Tres caminos:
Escribir a mano (1-2 horas). Mejor para control. Empieza con la spec en llmstxt.org, copia el ejemplo de arriba, customiza.
Generar desde tu sitio. Herramientas como el analizador de INITE AI crawlean tu URL y producen un bundle listo para deploy llms.txt + ai.txt + identity.json en 30 segundos.
Plugin de CMS. Plugins WordPress y Webflow existen (busca en los marketplaces). La mayoría son gratis.
Conclusión
Si publicas solo un archivo nuevo en 2026, hazlo llms.txt. El estándar está convergiendo rápido: 11% de adopción hoy, proyectado 35-40% para fin de año. Sitios sin él son resumidos incorrectamente o ignorados completamente por asistentes IA. El fix toma una hora, la spec es abierta, y la ganancia de citación es medible. Ship it.
Preguntas frecuentes
01¿Dónde poner llms.txt?+
En la raíz de tu dominio: https://yourdomain.com/llms.txt - mismo nivel que robots.txt y sitemap.xml. Sírvelo como text/plain o text/markdown. No lo pongas en subdirectorio ni detrás de login.
02¿Qué formato usa llms.txt?+
Markdown. Empieza con H1 = nombre de tu negocio, después descripción de una línea, después secciones (## Productos, ## Precios, ## URLs clave, ## Contacto). Mantenlo bajo 3 KB. Usa listas con URLs absolutas, no relativas.
03¿llms.txt es lo mismo que ai.txt o robots-ai.txt?+
No. llms.txt es la guía larga (markdown, 1-3 KB). ai.txt es un perfil de identidad legible por máquina más corto (key=value). robots-ai.txt es un archivo allow/deny estilo robots específicamente para crawlers IA. Sitios autoritativos publican los tres.
04¿llms.txt va a dañar mi SEO clásico?+
No. Buscadores no penalizan llms.txt; Google declaró que lo lee pero no lo pondera en rankings directamente. llms.txt afecta solo cómo motores IA interpretan tu sitio para citación. No hay desventaja en publicarlo.
05¿Cómo generar llms.txt?+
Escribe a mano (1-2 horas) o usa un generador. El analizador de inite.ai produce un bundle listo para deploy llms.txt + ai.txt + identity.json desde cualquier URL. Valida contra la spec pública en llmstxt.org y verifica que URLs absolutas resuelvan.
Seguir leyendo

Allowlist de crawlers de IA en 2026: qué bots dejar pasar, bloquear o ignorar

Guía Completa de AEO 2026: Cómo Ser Citado por ChatGPT, Perplexity y Google AI Overview
