audio | Mistral AI
Voxtral Text to Speech
ネイティブのフランス語アクセントサポートと音声クローンを使用して、自然な多言語スピーチを生成します
audio
Voxtral Mini TTS MINI
Mistral AI
Voxtral Text to Speechは、Mistral AIを使用して書かれたテキストを自然な音声に変換します。最大10,000文字を入力または貼り付け、声を選択すると、AIが実際の人間が話しているように聞こえる音声を生成します — 自然なリズム、イントネーション、呼吸を伴って。
3つの音声モードが完全な柔軟性を提供します。プリセット音声は、すべての人が利用できる専門的にキュレーションされた音声です — 選択する前にブラウズしてプレビューできます。マイボイスには、Voice Cloneで作成したキャラクター特有の音声を含む、あなたの個人的にクローンした音声が表示されます。アップロードモードでは、瞬時にゼロショットクローンを行うことができます — 2〜60秒の音声リファレンスをドロップすると、AIはその音声を模倣してこの生成を行いますが、永久に保存することはありません。
キャラクターをリンクすると、そのキャラクター専用の音声を自動的に最初に表示します。このツールは、テキストから自動的に言語を検出し、フランス語、英語、スペイン語、ドイツ語、ポルトガル語、イタリア語、オランダ語、ヒンディー語、アラビア語に対するネイティブ品質のサポートを提供します。フランス語のアクセント品質は特に強力です — MistralはフランスのAIラボです。
出力形式にはMP3、WAV、FLAC、Opusが含まれます。組み込みのコスト見積もりツールは、文字数に基づいて生成にかかるクレジット数を正確に表示します。結果は直接ギャラリーに保存され、アバター、リップシンク、またはコンテンツパイプラインの吹き替えワークフローの音声入力として使用できます。
これは、すべてのコンテンツ — ソーシャル投稿、ビデオ、ポッドキャスト、吹き替え翻訳 — にわたってAIキャラクターに一貫した認識可能な声を与えるための音声エンジンです。
3つの音声モードが完全な柔軟性を提供します。プリセット音声は、すべての人が利用できる専門的にキュレーションされた音声です — 選択する前にブラウズしてプレビューできます。マイボイスには、Voice Cloneで作成したキャラクター特有の音声を含む、あなたの個人的にクローンした音声が表示されます。アップロードモードでは、瞬時にゼロショットクローンを行うことができます — 2〜60秒の音声リファレンスをドロップすると、AIはその音声を模倣してこの生成を行いますが、永久に保存することはありません。
キャラクターをリンクすると、そのキャラクター専用の音声を自動的に最初に表示します。このツールは、テキストから自動的に言語を検出し、フランス語、英語、スペイン語、ドイツ語、ポルトガル語、イタリア語、オランダ語、ヒンディー語、アラビア語に対するネイティブ品質のサポートを提供します。フランス語のアクセント品質は特に強力です — MistralはフランスのAIラボです。
出力形式にはMP3、WAV、FLAC、Opusが含まれます。組み込みのコスト見積もりツールは、文字数に基づいて生成にかかるクレジット数を正確に表示します。結果は直接ギャラリーに保存され、アバター、リップシンク、またはコンテンツパイプラインの吹き替えワークフローの音声入力として使用できます。
これは、すべてのコンテンツ — ソーシャル投稿、ビデオ、ポッドキャスト、吹き替え翻訳 — にわたってAIキャラクターに一貫した認識可能な声を与えるための音声エンジンです。
ベストな結果
プリセット音声を最初にプレビュー
生成する前に各プリセット音声を聞いてください。異なる声は異なるコンテンツに適しています — 一部は温かく会話的に聞こえ、他はプロフェッショナルでクリアに聞こえます。キャラクターの個性に合ったものを見つけてください。
句読点がペーシングを制御
コンマは短いポーズを作り、ピリオドは長いポーズを作り、エリプシスは引きずるようなためらいを作ります。話したい通りにテキストを書いてください — 句読点はリズムと配信を制御するための主要なツールです。
キャラクターの声をクローン
Voice Cloneを使用して、2〜60秒の音声サンプルから永久的な声を作成し、ここでマイボイスの下に選択します。クローンされたら、あなたのキャラクターは毎回同じ声で話します — すべてのツールと言語にわたって。
クイックテストのためのアップロードモード
アップロードモードでは、永久にクローンすることなく音声リファレンスをテストできます。任意の音声クリップをドロップして、瞬時にスピーチを生成します。結果が気に入ったら、Voice Cloneに行ってその声を永久に保存してください。
コスト見積もりツールを確認
コスト見積もりツールは、入力中にリアルタイムで更新されます。長いテキストはより多くのコストがかかります — プロンプトをテストしている場合は、最初に短い抜粋を試して、フルテキストを生成する前に声が正しいか確認してください。
他のツールに音声を入力
生成されたスピーチは、アバター(写真から話すビデオ)、リップシンク(ビデオ内の誰かを話させる)、およびコンテンツパイプラインの吹き替えシステムへの直接入力として機能します。これは音声パイプラインの最初のステップです。
ガイド
Voxtral Text to Speech
🎵
Audio
Voxtral Text to Speech — Technical Guide
Generate natural multilingual speech with native French accent support and voice cloning