🎬
ビデオからオーディオ:明確な視覚アクション
目に見える、認識可能なアクションを持つビデオは、最良の音を生成します。歩く、はねる、拍手 — AIは正確な一致するオーディオを生成するために何が起こっているかを見る必要があります。抽象的または静的なシーンは、作業するものが少なくなります。
🎵
音楽から効果音を分ける
ビデオからオーディオモードでは、効果音と背景音楽をそれぞれのフィールドで説明します。木の上の足音を1つに、柔らかいジャズピアノを別のフィールドに記入すると、すべてを1つのプロンプトで混ぜるよりもはるかに良い重ね合わせの結果が得られます。
📝
テキストからオーディオ:シーンのように説明する
音の絵を描いてください。遠くの雷と遠くで吠える犬のいるトタン屋根の雨は、ただの雨よりもはるかに効果的です。希望する音の質感、距離、層について具体的に述べてください。
🎧
クローズアップコンテンツにはASMRを試す
ビデオからオーディオのASMRモードは、クローズアップビデオのための親密で詳細な音を生成します — 料理、クラフト、質感の詳細。視聴者はシーンの中にいるように感じます。
⏱️
持続時間を集中させる
ビデオからオーディオは3〜20秒のクリップで動作します。テキストからオーディオは3〜10秒で動作します。集中したコンテンツを持つ短いクリップが最も正確な結果を生成します — 1回の生成であまり多くをカバーしないでください。
🔗
ビデオツールでオーディオを連結する
Kling Video、Motion Control、またはVideo Effectsでビデオを生成し、その後オーディオスタジオで音を追加します。この2ステップのワークフローは、無音のAI生成クリップを完全な視聴覚コンテンツに変えます。