
llms.txt es una propuesta de estándar emergente para que un sitio web le diga a los modelos de lenguaje cómo entender su contenido. Funciona conceptualmente parecido a robots.txt o sitemap.xml, pero pensado para LLMs. Aún no es estándar oficial y Google no lo usa, pero Anthropic, Perplexity y varios buscadores experimentales sí están empezando a leerlo. Esta guía explica qué es, cómo configurarlo y cuándo conviene implementarlo.
Tabla de contenidos
Qué es exactamente llms.txt
llms.txt es un archivo de texto plano que vive en la raíz de tu dominio (/llms.txt) y describe el sitio en formato Markdown, optimizado para que un LLM lo lea sin tener que parsear el HTML completo. La propuesta original fue planteada por Jeremy Howard en septiembre de 2024 y la documentación de referencia vive en llmstxt.org.
La idea: cuando un LLM (o un agente que use un LLM) llega a tu sitio, en vez de cargar 50 páginas y gastar contexto, lee un solo archivo que le explica qué hay, dónde y por qué.
Estructura del archivo
Es Markdown plano, con cuatro bloques recomendados:
# Nombre del sitio
> Descripción corta de 1-2 frases: qué es el sitio, a quién sirve, qué hace único.
Texto libre con contexto adicional, posicionamiento, valores, restricciones de uso si aplican.
## Sección principal
- [Título del recurso](URL): descripción de qué es y cuándo consultarlo.
- [Otro recurso](URL): descripción.
## Optional
- [Recursos secundarios](URL): cosas útiles pero no críticas.
El bloque ## Optional es opcional literalmente: indica al LLM qué puede ignorar si su contexto es limitado.
Diferencia con robots.txt y sitemap.xml
- robots.txt: dice qué bots pueden/no pueden rastrear qué URLs. Es regulatorio.
- sitemap.xml: lista todas las URLs indexables con prioridad y frecuencia. Es exhaustivo.
- llms.txt: describe el sitio de forma humana/curada para que un LLM lo entienda rápido. Es expositivo.
Los tres conviven. Ninguno reemplaza a los otros.
Quién lee llms.txt hoy
A mayo de 2026 el adopción es parcial:
- Anthropic documentó soporte experimental.
- Perplexity y varios buscadores RAG lo están integrando.
- Google y OpenAI no lo han confirmado oficialmente.
- Muchos agentes IA (Cursor, devin, code agents) lo usan para entender librerías y SaaS.
Aun sin adopción universal, ya hay sitios SaaS (Mintlify, Anthropic docs) que lo publican como práctica de futuro.
Cómo crear tu llms.txt paso a paso
1. Inventario del sitio
Lista las 10-30 URLs más importantes agrupadas por categoría: páginas core de servicio, hubs de contenido, posts pillares, política de privacidad y términos.
2. Descripción de marca
Escribe 1-2 frases que respondan: “¿qué hace este sitio y para quién?”. Sin marketing fluff. Ejemplo: “Polemicus es una agencia colombiana de SEO y publicidad digital especializada en pymes B2B”.
3. Composición del archivo
Sigue el esqueleto Markdown de arriba. Para cada URL, una línea con título descriptivo y descripción de 1 frase. Nada más. Si te tomó más de 200 líneas, simplifica.
4. Subir a la raíz
El archivo debe estar accesible en https://tudominio.com/llms.txt. En WordPress puedes subirlo vía FTP a la raíz o usar un plugin de archivos personalizados. Devuelve content-type text/plain y status 200.
5. Variante extendida (opcional)
Algunos sitios técnicos publican también /llms-full.txt con el contenido completo de las páginas en Markdown plano. Útil para librerías, docs de SaaS, APIs. Para un blog o agencia, rara vez necesario.
Ejemplo mínimo viable para una pyme
# Polemicus
> Agencia colombiana de SEO y publicidad digital para pymes B2B. Diagnóstico SEO gratis, sin contratos atados.
## Servicios
- [Consultoría SEO](https://polemicusdigital.com/consultoria-seo/): estrategia y ejecución mensual.
- [Auditoría de backlinks](https://polemicusdigital.com/auditoria-backlinks/): limpieza de perfil de enlaces.
- [Diagnóstico SEO gratis](https://polemicusdigital.com/diagnostico-seo/): análisis inicial sin costo.
## Guías
- [Qué es el SEO](https://polemicusdigital.com/que-es-el-seo-colombia/): introducción para negocios en Colombia.
- [Auditoría SEO paso a paso](https://polemicusdigital.com/auditoria-seo-que-es-como-hacerla/): cómo diagnosticar un sitio.
- [Cuánto cuesta publicidad en Google](https://polemicusdigital.com/cuanto-cuesta-publicidad-google-colombia/): presupuestos reales.
## Optional
- [Sobre nosotros](https://polemicusdigital.com/sobre-nosotros/).
- [Política de privacidad](https://polemicusdigital.com/politica-privacidad/).
Cuándo conviene implementarlo
- Sites SaaS o producto: alta prioridad. Los agentes IA cada vez consultan más docs.
- Blogs / agencias / consultoría: prioridad media. No mueve la aguja hoy, pero es preparación para futuro.
- E-commerce: baja prioridad ahora. Schema Product y feeds estructurados pesan más.
El costo de implementación es bajo (1-2 horas) y no hay downside conocido. Si tu sitio es mantenible, vale la pena.
Errores comunes
- Subir un archivo de 2.000 líneas con todo el sitemap. No es eso.
- Escribir descripciones marketinas. El LLM quiere claridad, no slogans.
- Olvidar actualizarlo cuando cambian URLs.
- Pensar que reemplaza al sitemap. No: lo complementa.
Lectura relacionada
Si vienes de cero, empieza con qué es AEO y cómo optimizar para AI Overviews. Para ver el cuadro completo, auditoría SEO paso a paso. Reserva un diagnóstico SEO gratis si quieres saber qué te falta primero.
¿llms.txt es estándar oficial?
Aún no. Es una propuesta de la comunidad con adopción parcial. Pero el costo de implementarlo es tan bajo que la mayoría de sitios serios ya lo tienen.
¿Google lo lee?
No oficialmente, a mayo de 2026. Pero su existencia no afecta negativamente a Google. Es una inversión a futuro.
¿Cuánto debe pesar el archivo?
Menos de 50 KB en la versión corta. Si lo haces más grande, los LLMs lo van a truncar o ignorar.
¿Hay plugins de WordPress para generarlo?
Empiezan a aparecer en 2026, todavía verdes. Recomendado generarlo manualmente o con un script propio: control total y archivo simple.
¿Cómo verifico que está bien?
Visita la URL directamente en navegador (debe mostrarse como texto plano), prueba abrirlo en Claude o ChatGPT y pídeles que lo resuman para verificar que se entiende.
¿Sirve para SEO clásico?
No directamente. No mueve rankings de Google. Pero sí mejora cómo los LLMs entienden tu sitio, lo que indirectamente alimenta menciones en motores de respuestas.
Por Polemicus — agencia SEO en Colombia. Actualizado mayo 2026.
