Home Outils IA Guides IA Modèles IA Créateurs IA 🛒 Acheter Commencer
audio | Mistral AI

📝Voxtral Transcribe

Transcrire des fichiers audio et vidéo en 13 langues avec identification des locuteurs

audio Voxtral Mini Transcribe BATCH Mistral AI
Voxtral Transcribe convertit des fichiers audio et vidéo en texte écrit en utilisant Mistral AI. Téléchargez un enregistrement — podcast, interview, réunion, voix off ou tout fichier multimédia — et l'IA produit une transcription complète avec identification des locuteurs en option et horodatage au niveau des mots.

Prend en charge 13 langues : français, anglais, espagnol, arabe, russe, japonais, chinois, allemand, portugais, italien, coréen, hindi et néerlandais. Définissez la langue manuellement ou laissez l'IA la détecter automatiquement à partir du contenu audio.

L'identification des locuteurs identifie les locuteurs individuels dans les enregistrements à plusieurs personnes. Lorsqu'elle est activée, la transcription étiquette chaque segment — Locuteur 1, Locuteur 2 — afin que vous puissiez suivre qui a dit quoi dans les interviews, les réunions ou les dialogues. Les horodatages des mots ajoutent des données de timing précises à chaque mot, utiles pour la création de sous-titres ou la synchronisation du texte avec la vidéo.

Le biais contextuel vous permet de fournir à l'IA une liste de noms propres, de marques ou de termes techniques qui pourraient autrement être mal entendus. Ajoutez des noms comme Voxtral, ArtCoreAI ou du jargon spécifique à un domaine, et l'IA améliore la précision de reconnaissance pour ces mots.

Les formats acceptés incluent MP3, WAV, M4A, FLAC, OGG, MP4, MOV et WebM — jusqu'à 500 Mo et 3 heures par fichier. Une visualisation de forme d'onde montre l'audio téléchargé avec la durée et les informations sur le fichier avant que vous ne soumettiez. Les résultats s'affichent sous forme de texte formaté avec un bouton de copie en un clic, et la transcription est enregistrée pour référence ultérieure.

Le coût est basé sur la durée audio — environ /bin/bash.003 par minute — ce qui en fait l'une des options de transcription les plus abordables disponibles.

Meilleurs résultats

🎧
Un audio clair donne des transcriptions claires
Le bruit de fond, la musique et l'écho réduisent la précision de la transcription. Pour de meilleurs résultats, utilisez des enregistrements avec un discours clair et une interférence minimale. Si vous transcrivez à partir d'une vidéo, assurez-vous que la piste de dialogue est prédominante.
🗣️
Activer l'identification des locuteurs pour plusieurs intervenants
Si votre enregistrement comporte plus d'une personne parlant, activez l'identification des locuteurs. L'IA sépare et étiquette chaque locuteur, rendant la transcription facile à suivre — essentiel pour les interviews, les réunions et les podcasts.
📌
Utiliser le biais contextuel pour les noms
Ajoutez des noms propres, des marques et des termes techniques dans le champ de biais contextuel. Des mots comme Voxtral, ArtCoreAI ou du jargon industriel sont souvent mal entendus sans cet indice — le biais contextuel améliore considérablement la précision pour les mots peu courants.
🌍
Définir la langue lorsqu'elle est connue
La détection automatique fonctionne bien pour les enregistrements en langue unique, mais si vous connaissez la langue, définissez-la manuellement. Cela évite les erreurs de détection sur des clips courts ou des enregistrements avec un discours accentué.
⏱️
Horodatages des mots pour les sous-titres
Activez les horodatages des mots si vous prévoyez de créer des sous-titres ou de synchroniser le texte avec la vidéo. Chaque mot reçoit un marqueur de temps précis, facilitant l'alignement du texte avec le contenu visuel.
💰
Coût extrêmement bas
À environ /bin/bash.003 par minute, transcrire une heure complète d'audio coûte moins de /bin/bash.20 en crédits. Testez d'abord avec un court extrait pour vérifier la qualité, puis traitez des enregistrements plus longs en toute confiance.

Guides

Voxtral Transcribe
🎵 Audio
🎙️ Voxtral 3 min read

Voxtral Transcribe — Technical Guide

Transcribe audio and video files in 13 languages with speaker diarization

📝

Essayer Voxtral Transcribe

Aucun abonnement requis. Payez uniquement ce que vous créez.

Commencer à créer →

Plus d'outils Mistral AI

Explorer d'autres outils