audio | ElevenLabs TTS

🗣️Texto a Voz

Escribe cualquier texto y escúchalo hablado en una voz natural de IA: elige entre miles de voces en más de 30 idiomas, crea diálogos de múltiples voces y controla la emoción, la velocidad y el estilo de entrega

audio Multilingual v2 Default v3 — Latest Latest Flash v2.5 Fast Turbo v2.5 ElevenLabs TTS

Empezar a crear → Guías ↓

Texto a Voz convierte palabras escritas en audio con sonido natural. Escribe lo que quieres que se diga, elige una voz de una biblioteca de miles, y la IA genera un discurso que suena como una persona real, con ritmo, pausas y expresión naturales. Soporta más de 30 idiomas.

Cuatro modos cubren diferentes necesidades. Crear Discurso genera audio a partir de texto con una sola voz, el uso más simple y común. Discurso con Tiempos añade marcas de tiempo a nivel de carácter a la salida, útil para sincronizar audio con subtítulos o animaciones. Crear Diálogo te permite asignar diferentes voces a diferentes líneas, produciendo una conversación de múltiples voces con hasta 10 hablantes únicos. Diálogo con Tiempos combina múltiples voces con datos de tiempo para flujos de trabajo de sincronización precisos.

El control de emoción y entrega hace que el discurso se sienta humano. En el último modelo v3, las etiquetas de audio te permiten insertar dirección directamente en el texto: marca una palabra como susurrada, emocionada o suspirada, y la voz responde de manera natural. Los deslizadores de velocidad y estabilidad ajustan la rapidez con que habla la voz y cuán consistente se mantiene.

El audio generado funciona de forma independiente para pódcast, voces en off y narración, o se alimenta directamente a otras herramientas: úsalo como entrada de audio para Avatar (foto a video hablante) o Lip Sync (hacer que alguien en un video hable). Así es como le das a tu personaje de IA una voz en todo su contenido.

Available Models

Multilingual v2 Default

eleven_multilingual_v2

29 languages, best quality for non-English. Default for dubbing.

v3 — Latest Latest

eleven_v3

74 languages, newest model.

Flash v2.5 Fast

eleven_flash_v2_5

Ultra-fast, cost-efficient. 32 languages.

Turbo v2.5

eleven_turbo_v2_5

Low-latency streaming. 32 languages.

Mejores resultados

🎧

Previsualiza Voces Antes de Generar

Explora la biblioteca de voces y escucha previsualizaciones antes de comprometerte. Diferentes voces destacan en diferentes contenidos: algunas suenan cálidas y conversacionales, otras suenan autoritarias y profesionales. Encuentra la que coincida con tu personaje.

✍️

Usa Puntuación para Pausas Naturales

Las comas crean pausas cortas, los puntos crean pausas más largas, y los puntos suspensivos crean una hesitación prolongada. Escribe el texto de la manera en que quieres que se hable: la puntuación es la forma más fácil de controlar el ritmo y la cadencia.

🎭

Etiquetas de Audio para Emoción (solo v3)

En el modelo v3, inserta etiquetas como [emocionado], [susurros], [suspiro] directamente en tu texto para cambiar la entrega a mitad de la frase. Haz clic en cualquier etiqueta en la página para insertarla en la posición de tu cursor.

💬

Modo Diálogo para Conversaciones

Usa Crear Diálogo cuando necesites múltiples voces: cada línea recibe su propia asignación de voz. Hasta 10 voces únicas por generación. Perfecto para contenido estilo pódcast, entrevistas o interacciones de personajes.

⚡

Flash para Velocidad, Multilingüe para Calidad

Los modelos Flash y Turbo generan más rápido y cuestan menos: geniales para borradores y pruebas. Los modelos multilingües v2 y v3 producen el discurso más natural y expresivo: úsalos para el contenido final que planeas publicar.

🔗

Alimenta Audio en Avatar o Lip Sync

Genera discurso aquí, luego usa el archivo de audio como entrada para Avatar (convierte una foto en un video hablante) o Lip Sync (haz que alguien en un video existente lo hable). Este es el flujo de voz para tu personaje de IA.

Guías

Text to Speech

🎵 Audio

🎙️ ElevenLabs 6 min read

Text to Speech — Technical Guide

Type any text and hear it spoken in a natural AI voice — choose from thousands of voices in 30+ languages, create multi-voice dialogues, and control emotion, speed, and delivery style

🗣️

Probar Texto a Voz

Sin suscripción. Paga solo por lo que creas.

Empezar a crear →