Home AIツール AIガイド AIモデル AIクリエイター 🛒 購入 始める
🎬 KLING AI ⏱ 3 min read 🔊 Video to Audio

Video to Audio — Technical Guide

動画をアップロードすると、AIが画面上で何が起こっているかを観察し、アクションに完璧に同期した効果音とバックグラウンド音楽を生成します。

🔊

Video to Audio

動画をアップロードすると、AIが画面上で何が起こっているかを観察し、アクションに完璧に同期した効果音とバックグラウンド音楽を生成します。
ほとんどのAI生成動画は無音です。Video to Audioはそれを修正します。任意の動画クリップをアップロードすると、AIが視覚的に何が起こっているかを分析します — 人が歩く、水が流れる、物が動く、シーンが変わる — そして、画面上のアクションに合った効果音とバックグラウンド音楽を生成します。

結果は2つの別々のプロンプトで導きます。1つは、欲しい効果音を説明します — 砂利の上を歩く足音、ドアが閉まる音、ガラスが触れ合う音。もう1つは、バックグラウンド音楽を説明します — アップビートな電子音楽、柔らかいピアノ、ドラマティックなオーケストラ。AIは両方を重ね合わせ、動画で見えるものに同期させます。

ASMRモードは、キーボードを打つ音、生地をブラシでなでる音、液体を注ぐ音など、親密で詳細な音を求めるクローズアップコンテンツに利用できます。視聴者がその場にいるかのように感じる、ささやきのような音声を生成します。

これは、プラットフォーム上の他のツールで無音動画を生成した後に使用するツールです。Kling VideoやMotion Controlで動画を作成し、その後Video to Audioを通してプロフェッショナルな音のレイヤーを追加します — ストックオーディオライブラリは不要で、手動編集も不要、あなたのクリップのために特別に設計されたAI生成の音だけです。
✦ Best Results Tips
🎬 明確な視覚的アクション
視覚的で認識可能なアクションを持つ動画は、最良の音声を生成します。人が歩く、水が跳ねる、または手が拍手することは、AIに正確なマッチングサウンドを生成するための明確な手がかりを与えます。
🎵 効果音と音楽のプロンプトを分ける
効果音とバックグラウンド音楽をそれぞれのフィールドで説明します。1つには木の床の足音、もう1つには柔らかいジャズピアノと言うことで、すべてを混ぜるよりもはるかに良いレイヤー結果が得られます。
📝 音の説明は具体的に
遠くの雷を伴うトタン屋根の雨音は、雨の音よりもはるかに効果的です。音の種類、質感、距離について具体的であればあるほど、結果はよりリアルになります。
🎧 クローズアップ動画にはASMRを試す
料理、クラフト、または質感の詳細など、クローズアップアクションを示す動画の場合は、ASMRモードを有効にします。視聴者がシーンにいるかのように感じる親密で詳細な音を生成します。
⏱️ 動画は20秒未満に保つ
Video to Audioは3秒から20秒のクリップで動作します。集中したアクションを持つ短いクリップは、最も正確な音の同期を生成します。
🔗 他のツールと連携する
最初にKling Video、Motion Control、またはVideo Effectsで動画を生成し、その後Video to Audioで音を追加します。この2段階のワークフローは、1枚の写真から完全な視覚音響コンテンツを生成します。

Video to Audio — Available Models

Video-to-Audio
Default
video-to-audio
Generates synchronized SFX and BGM from silent video (3-20s).
📥 You Give
🎬Source Video
AI Magic
klingai
🎵 You Get
🎵 Audio
🎙️
ASMR mode
Close-mic generation
🎥
MP4/MOV, 3-20s, max 100MB
Video input
📝
200 chars each (SFX + BGM)
Prompt limit

💰 Video to Audio — Pricing

Estimated cost
Failed jobs are automatically refunded

🔊 Video to Audio

Video to Audioを試す