Home Outils IA Guides IA Modèles IA Créateurs IA 🛒 Acheter Commencer
🎙️ Voxtral ⏱ 4 min read 🎙️ Voxtral Text to Speech

Voxtral Text to Speech — Technical Guide

Générez une parole multilingue naturelle avec un support d'accent français natif et un clonage vocal

🎙️

Voxtral Text to Speech

mistral audio /app/voxtral-tts →
Générez une parole multilingue naturelle avec un support d'accent français natif et un clonage vocal
Voxtral Text to Speech convertit le texte écrit en parole naturelle à l'aide de Mistral AI. Tapez ou collez jusqu'à 10 000 caractères, sélectionnez une voix, et l'IA génère un audio qui ressemble à une vraie personne parlant — avec un rythme, une intonation et une respiration naturels.

Trois modes de voix vous offrent une flexibilité totale. Les voix prédéfinies sont des voix professionnellement sélectionnées disponibles pour tout le monde — parcourez et prévisualisez-les avant de choisir. Mes voix montre vos voix clonées personnellement, y compris des voix spécifiques à des personnages que vous avez créées avec Voice Clone. Le mode de téléchargement vous permet de faire un clonage instantané sans échantillon — déposez une référence audio de 2 à 60 secondes et l'IA imite cette voix pour cette génération sans l'enregistrer définitivement.

Liez un personnage pour voir automatiquement ses voix dédiées en premier. L'outil détecte automatiquement la langue de votre texte, avec un support de qualité native pour le français, l'anglais, l'espagnol, l'allemand, le portugais, l'italien, le néerlandais, l'hindi et l'arabe. La qualité de l'accent français est particulièrement forte — Mistral est un laboratoire d'IA français.

Les formats de sortie incluent MP3, WAV, FLAC et Opus. Un estimateur de coût intégré montre exactement combien de crédits la génération coûtera avant que vous ne soumettiez, en fonction du nombre de caractères. Les résultats sont enregistrés directement dans votre galerie et peuvent être utilisés comme entrée audio pour Avatar, Lip Sync ou le flux de travail de doublage du pipeline de contenu.

C'est le moteur vocal pour donner à votre personnage IA une voix cohérente et reconnaissable à travers tout son contenu — publications sociales, vidéos, podcasts et traductions doublées.
✦ Best Results Tips
🎧 Aperçu des Voix Prédéfinies d'Abord
Écoutez chaque voix prédéfinie avant de générer. Différentes voix conviennent à différents contenus — certaines sonnent chaleureuses et conversationnelles, d'autres sonnent professionnelles et claires. Trouvez celle qui correspond à la personnalité de votre personnage.
✍️ Les Ponctuations Contrôlent le Rythme
Les virgules créent de courtes pauses, les points créent des pauses plus longues, les ellipses créent une hésitation. Écrivez le texte exactement comme vous voulez qu'il soit prononcé — la ponctuation est votre principal outil pour contrôler le rythme et la livraison.
🎤 Clonez la Voix de Votre Personnage
Utilisez Voice Clone pour créer une voix permanente à partir d'un échantillon audio de 2 à 60 secondes, puis sélectionnez-la ici sous Mes Voix. Une fois clonée, votre personnage parle avec la même voix à chaque fois — à travers tous les outils et langues.
Mode de Téléchargement pour des Tests Rapides
Le mode de téléchargement vous permet de tester une référence vocale sans la cloner définitivement. Déposez n'importe quel clip audio et générez instantanément la parole. Si vous aimez le résultat, allez à Voice Clone pour enregistrer cette voix définitivement.
💰 Vérifiez l'Estimateur de Coût
L'estimateur de coût se met à jour en temps réel pendant que vous tapez. Un texte plus long coûte plus cher — si vous testez une invite, essayez d'abord un court extrait pour vérifier que la voix sonne bien avant de générer le texte complet.
🔗 Alimentez l'Audio dans d'Autres Outils
La parole générée fonctionne comme une entrée directe pour Avatar (photo en vidéo parlante), Lip Sync (faire parler quelqu'un dans une vidéo), et le système de doublage du pipeline de contenu. C'est la première étape dans le pipeline vocal.

Voxtral TTS — Available Models

Voxtral Mini TTS
MINI Default
voxtral-mini-tts-2603
Fast, high-quality TTS. Beats ElevenLabs Flash v2.5 in human evals. Native French.
Mode: tts

💰 Voxtral TTS — Pricing

Estimated cost
Failed jobs are automatically refunded

🎙️ Voxtral Text to Speech

Essayer Voxtral Text to Speech