Skip to content
Volver al blog
AEO

Speakable Schema: Cómo Ganar Voz e IA Conversacional en 2026

Speakable JSON-LD dice a los asistentes IA qué partes de tu página leer en voz alta. Usado por Google Assistant, Alexa, integraciones Siri y Perplexity Voice. Formato y checklist de validación.

Costa8 de abril de 20264 min de lectura
SpeakableVoice SearchSchema.orgAEO

Speakable schema es marcación JSON-LD que apunta a motores IA a las partes de una página más adecuadas para reproducción de audio - típicamente el headline y el Direct Answer Block. Es usado por Google Assistant, Perplexity Voice e integraciones Alexa Skill para leer contenido en voz alta, y añade 1.1x de aumento en citación en queries de voz.

Datos clave

  • Participación de queries de voz en el total de queries de asistente IA: 18% en abril 2026, contra 7% en 2023.
  • Adopción de Speakable schema: 4.2% de los dominios de news, 1.1% de sitios B2B SaaS.
  • Aumento de citación por voz de Speakable: 1.1x baseline (bajo pero barato de hacer).
  • Longitud promedio de respuesta por voz: 22-28 segundos, ~70-90 palabras leídas en voz alta.
  • Top motores usando Speakable: Google Assistant, Perplexity Voice, Brave Leo Voice.

Para Qué Sirve Speakable

Speakable schema (técnicamente SpeakableSpecification) dice a motores IA qué partes de una página leer en voz alta al responder una query de voz. Google Assistant, Perplexity Voice, Brave Leo Voice e integraciones Alexa Skill emergentes - todos lo leen. El aumento en citaciones por voz es modesto (1.1x baseline) pero el costo es trivial: cinco minutos por página.

En abril 2026, la participación de voz en el total de queries de asistente IA es 18% (contra 7% en 2023, creciendo ~30-40% año a año). Longitud promedio de respuesta por voz es 22-28 segundos, o 70-90 palabras leídas en voz alta. Speakable dice al motor qué 70-90 palabras elegir.

Plantilla Lista

{
  "@context": "https://schema.org",
  "@type": "WebPage",
  "speakable": {
    "@type": "SpeakableSpecification",
    "cssSelector": [
      ".article-headline",
      ".aeo-direct-answer"
    ]
  }
}

Coloca esto en un bloque <script type="application/ld+json"> junto con Article y FAQPage schema. Los selectores CSS apuntan a:

  • El H1 (.article-headline o cuál class uses)
  • El Direct Answer Block (.aeo-direct-answer)

Eso es todo. Sin contenido adicional necesario.

Por Qué "Headline + Direct Answer" Es el Conjunto de Selectores Correcto

Motores de voz tienen presupuestos estrictos de palabras. Quieren un extracto autosuficiente que:

  1. Nombre el tema (el headline)
  2. Responda a la pregunta implicada (el Direct Answer Block)
  3. Quepa en 22-28 segundos de habla (~70-90 palabras)

Un Direct Answer Block (40-60 palabras) más un headline corto (~10 palabras) cae en 50-70 palabras - cómodamente dentro del presupuesto. Marcar artículos enteros como Speakable fuerza al motor a resumir igual, tirando el aumento de citación a ~1.0x.

Checklist de Validación

  • Selectores CSS apuntan a elementos que realmente existen en la página.
  • Texto seleccionado es 50-90 palabras totales (headline + answer block).
  • Sin HTML dentro de los elementos seleccionados (o se stripea antes de la lectura).
  • Valida en validator.schema.org.
  • Valida en Google Rich Results Test.
  • Página permite GPTBot, Google-Extended, ClaudeBot, PerplexityBot.

Pareando Con Direct Answer Blocks

Speakable es el pareo natural para Direct Answer Blocks. La respuesta de 40-60 palabras que pusiste bajo el primer H2 es exactamente el extracto de reproducción de audio que motores de voz quieren.

Si ya hiciste ship de Direct Answer Blocks y les diste una class CSS (ej.: .aeo-direct-answer), Speakable es una adición de 30 segundos: pon el JSON-LD apuntando a esa class, y listo.

Un Micro-Sprint: Speakable en 20 Páginas en 30 Minutos

  1. Elige la class. Usa .aeo-direct-answer (o cuál ya uses). Si tu headline no tiene class estable, añade una.
  2. Añade el JSON-LD a tu template/layout de blog. Aplica a cada página automáticamente.
  3. Valida con Google Rich Results Test en 3-5 páginas muestra.
  4. Ship.

Si tienes template de CMS, esto es un cambio de template aplicado a todas las páginas. Si no tienes, es copy-paste de 30 segundos por página.

Qué No Funciona

  1. Marcar el body entero del artículo. Fuerza al motor a resumir. Tira el aumento.
  2. Usar XPath. Funciona, pero añade costo de mantenimiento. Quédate con selectores CSS.
  3. Apuntar a elementos ocultos. Motores filtran display: none y visibility: hidden. El selector debe pegar en contenido visible.
  4. Usar inline styles en lugar de class names. Selectores rompen el momento que refactorizas estilo.
  5. Olvidar actualizar. Cuando cambias el nombre de class del Direct Answer Block, el selector Speakable también debe actualizar.

Cómo Medir

Citaciones por voz son más difíciles de trackear que citaciones de texto porque usuarios no clickean - escuchan la respuesta y siguen adelante. Tres enfoques:

  1. Queries de prueba. Corre tus top 20 queries informacionales en Google Assistant, Perplexity Voice, Brave Leo Voice una vez por semana. Loguea quién es citado.
  2. Search Console. Google reporta impresiones de "voice search" en algunos mercados. Chequea la pestaña Performance.
  3. Tráfico de referencia. Una pequeña fracción de usuarios de voz siguen tocando la fuente - cuéntalos en tus referrers assistant.google.com y perplexity.ai.

Conclusión

Speakable schema es la señal AEO más barata en 2026: cinco minutos por template, 1.1x de aumento en citaciones por voz, sin desventaja. Participación de queries de voz crece 30-40% año a año - añadir Speakable hoy te da una posición en una superficie que será 2-3x más grande en 18 meses. Pareja con Direct Answer Blocks y FAQPage para la fundación AEO completa.

Siguiente: Guía Completa AEO 2026 · Direct Answer Blocks.

Preguntas frecuentes

¿Qué secciones debo marcar como Speakable?

El headline y el Direct Answer Block. Motores IA usan selectores Speakable para elegir el extracto de reproducción de audio - quieren el resumen más conciso y autosuficiente de la página. Marcar artículos enteros como Speakable (selector body o main) tira el aumento de citación a ~1.0x porque el motor tiene que resumir igual.

¿Selectores CSS o XPath - cuál usar?

Selectores CSS. Son más simples, más portables y funcionan en todos los motores de voz actuales. Usa class names confiables (ej.: .aeo-direct-answer, .article-headline). XPath funciona, pero añade complejidad por ganancia marginal.

¿Vale la pena el esfuerzo si voz es solo 18% de queries?

Toma 5 minutos por página. El aumento es 1.1x baseline en queries de voz. ROI por minuto invertido es alto, aunque el tráfico absoluto de voz aún sea pequeño. El factor compuesto es que la participación de voz crece 30-40% año a año.

¿Cómo interactúa Speakable con FAQPage schema?

Sirven superficies diferentes. Speakable apunta a secciones de reproducción de audio; FAQPage marca pares Q&A para retrieval. La mayoría de páginas debe publicar ambos: Speakable para extractos de voz, FAQPage para retrieval Q&A. No conflictúan.

¿Speakable daña rankings SEO?

No. Buscadores no penalizan Speakable. Google explícitamente lo listó como tipo recomendado de datos estructurados para contenido informacional y de news. No hay desventaja en añadirlo.

Seguir leyendo

Speakable Schema: Cómo Ganar Voz e IA Conversacional en 2026 | INITE AI Blog