Home Outils IA Guides IA Modèles IA Créateurs IA 🛒 Acheter Commencer
🎬 KLING AI ⏱ 4 min read 🗣️ Avatar v2

Avatar v2 — Technical Guide

Transformez n'importe quelle photo de portrait en vidéo parlante — téléchargez une photo et fournissez un audio ou tapez ce qu'ils devraient dire, et l'IA anime le visage avec un mouvement naturel et un synchronisme labial

🗣️

Avatar v2

klingai video /app/avatar →
Transformez n'importe quelle photo de portrait en vidéo parlante — téléchargez une photo et fournissez un audio ou tapez ce qu'ils devraient dire, et l'IA anime le visage avec un mouvement naturel et un synchronisme labial
Avatar v2 donne vie aux photos fixes. Téléchargez un portrait de votre personnage et fournissez un audio — soit téléchargez un enregistrement, soit tapez les mots et laissez l'IA générer la voix — et le résultat est une vidéo où la personne sur la photo semble parler naturellement avec un mouvement de tête réaliste, un clignement des yeux, et des mouvements labiaux parfaitement synchronisés.

C'est différent de Lip Sync, qui nécessite une vidéo existante. Avatar commence à partir d'une seule photographie fixe. L'IA ajoute tout le mouvement — inclinaisons de tête subtiles, clignements d'yeux naturels, changements d'expression faciale, et animation précise de la bouche — créant une vidéo convaincante de tête parlante à partir de rien d'autre qu'une image statique.

Deux modes audio couvrent tous les cas d'utilisation. Upload Audio vous permet d'utiliser n'importe quel discours préenregistré, voix off, extrait de podcast, ou narration traduite. Le mode Type Text vous permet d'écrire le dialogue, de choisir une voix dans le catalogue, de sélectionner une langue et une émotion (heureux, triste, en colère, surpris, et plus), d'ajuster la vitesse de parole, et l'IA s'occupe de tout en une seule étape.

Un prompt optionnel vous permet de guider l'humeur et le style de geste — décrivez l'expression, le niveau d'énergie, ou l'émotion et l'IA ajuste le mouvement de la tête et l'animation faciale pour correspondre. Le résultat est une vidéo complète de tête parlante prête pour les réseaux sociaux, les réponses du service client, les matériaux de formation, les annonces de produits, ou des messages vidéo personnalisés.
✦ Best Results Tips
👤 Portrait de Face avec Bonne Éclairage
Utilisez une photo bien éclairée où le visage est clairement visible de face. Tête centrée, yeux regardant la caméra, sourire neutre ou léger. Évitez les lunettes de soleil, masques, ou ombres lourdes sur le visage.
🎭 Le Prompt Contrôle l'Humeur, Pas le Discours
Le champ de prompt contrôle l'expression et le style de geste — pas ce que la personne dit. Écrivez des choses comme confiant et énergique ou calme et réfléchi. Le discours réel provient du fichier audio ou du texte tapé.
⌨️ Tapez du Texte pour les Résultats les Plus Rapides
Le mode Type Text génère la voix et synchronise les lèvres en une seule étape — pas besoin d'enregistrer ou de trouver un fichier audio. Choisissez une voix, définissez l'émotion, écrivez les mots, et l'IA s'occupe du reste.
😊 Choisissez la Bonne Émotion
Lors de l'utilisation du mode Type Text, le paramètre d'émotion change la façon dont la voix sonne et comment le visage bouge. Heureux ajoute de la chaleur et de légers sourires, en colère ajoute de l'intensité, triste ajoute de la douceur. Faites correspondre l'émotion au contenu.
⏱️ Gardez l'Audio en Dessous de 60 Secondes
Des extraits audio plus courts produisent l'animation de la plus haute qualité. Moins de 60 secondes est idéal — l'IA maintient la cohérence du mouvement naturel tout au long. Des extraits plus longs peuvent dériver en qualité d'expression.
📐 Cadre de Tête et Épaules
Les meilleurs résultats proviennent de photos cadrées de la partie supérieure de la poitrine vers le haut. Trop de corps entier réduit le détail du visage. Un recadrage trop serré ne laisse pas de place pour un mouvement naturel de la tête pendant l'animation.

Avatar v2 — Available Models

Avatar Standard
Default
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Mode: std
Avatar Pro
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Mode: pro
📥 You Give
🖼️Character Photo 🎤Audio (TTS or Upload) 🎭Expression Prompt
AI Magic
klingai
🎬 You Get
🎬 Video
Quality modes
Standard
Professional
TTS emotions
😐 Neutral 😊 Happy 😠 Angry 😢 Sad 😨 Fearful 🤢 Disgusted 😲 Surprised
⏱️
5 min
Max duration
🎤
Upload (MP3/WAV/M4A)
Audio source
🎤
TTS
Audio source
🌐
English, Chinese
TTS languages

💰 Avatar v2 — Pricing

Estimated cost
Failed jobs are automatically refunded
The Avatar 2.0 feature allows you to upload character images, add voiceovers, and describe the character’s expressions to generate lifelike dynamic avatar videos. The newly upgraded Avatar 2.0 dramatically enhances performance, offering full coverage for 5-minute-long content scenes!

Showcase Kling Avatar

Prompt Excited and joyful, the child raises her hands covered in paint, laughing and interacting with the colorful art supplies on the table, camera zooms in.
Input
Input
Output
Prompt Selfie of a young lady with a bright smile, her eyes sparkling with excitement as she sits in the driver's seat. Very Subtile handheld camera mouvement. No cars passing by. No distortions. Very natural mouvements
Input
Input
Output
Prompt With a joyful expression Santa laughs and interacts with the camera, gesturing with open hands wearing white gloves, exuding holiday cheer, surrounded by festive lights and decorations.
Input
Input
Output
Prompt While talking, they excitedly shook their heads and swayed their bodies. Finally, they clenched their fists and decided to set off, jumping and skipping happily.
Input
Input
Output
Prompt Put hands together in front of your chest, and finally hold them together and tell a story naturally.
Input
Input
Output
Prompt He raised his hand to touch his glasses and then angrily pointed at the camera with his finger.
Input
Input
Output
Prompt Patient and gentle explanations, occasionally glancing at the item in the hand, maintaining a smile, with natural movement.
Input
Input
Output
Prompt Professional explanations, natural movements, and sometimes use gestures to assist in the explanation.
Input
Input
Output
Prompt The singer sings earnestly, enjoying the stage with a smile, her body movements swaying naturally in coordination with the performance.
Input
Input
Output
Prompt The female singer sings to the audience while looking confident, occasionally smiling at the camera, hand on the microphone, natural arm movements.
Input
Input
Output
Prompt In a commercial advertisement, a person holds a product in one hand and speaks directly to the camera. The gesture is deliberate and confident.
Input
Input
Output
Prompt The expression is intoxicated, emotions high, gently shaking the head. The snake around the neck moves as light reflects off its body, gradually zooming in on the face.
Input
Input
Output
Prompt Smiling, swaying confidently while rapping, holding a microphone. Eyes focused on the audience, natural and fluid movements. Occasional head movements.
Input
Input
Output
Prompt Confidently posing with a sultry gaze, the figure exudes an aura of mystery and allure, captivating the audience with every movement.
Input
Input
Output
Prompt A teacher is speaking politely and earnestly.
Input
Input
Output
Prompt Confidently holding a smartphone, standing in an empty street, exuding a mysterious aura with a slight smile.
Input
Input
Output
Prompt The man is angry, shown in both facial expression and action.
Input
Input
Output
Prompt Smiling warmly at the camera, she gently touches her necklace, exuding confidence and grace.
Input
Input
Output

🗣️ Avatar v2

Essayer Avatar v2