Avatar v2 — Technical Guide
Transformă orice fotografie de portret într-un videoclip vorbitor — încarcă o fotografie și oferă audio sau scrie ce ar trebui să spună, iar AI-ul animează fața cu mișcare naturală și sincronizare a buzelor
Transformă orice fotografie de portret într-un videoclip vorbitor — încarcă o fotografie și oferă audio sau scrie ce ar trebui să spună, iar AI-ul animează fața cu mișcare naturală și sincronizare a buzelor
Avatar v2 aduce fotografiile statice la viață. Încarcă un portret al personajului tău și oferă audio — fie încarcă o înregistrare, fie scrie cuvintele și lasă AI-ul să genereze vocea — iar rezultatul este un videoclip în care persoana din fotografie pare să vorbească natural, cu mișcări realiste ale capului, clipiri ale ochilor și mișcări ale buzelor perfect sincronizate.
Aceasta este diferit de Lip Sync, care necesită un videoclip existent. Avatar începe de la o singură fotografie statică. AI-ul adaugă toată mișcarea — înclinări subtile ale capului, clipiri naturale ale ochilor, schimbări ale expresiilor faciale și animație precisă a buzelor — creând un videoclip convingător cu o față vorbitoare din nimic altceva decât o imagine statică.
Două moduri audio acoperă fiecare caz de utilizare. Upload Audio îți permite să folosești orice discurs preînregistrat, voiceover, clip de podcast sau narațiune tradusă. Mod Type Text îți permite să scrii dialogul, să alegi o voce din catalog, să selectezi o limbă și o emoție (fericit, trist, supărat, surprins și altele), să ajustezi viteza de vorbire, iar AI-ul se ocupă de tot într-un singur pas.
Un prompt opțional îți permite să ghidezi stilul de atmosferă și gest — descrie expresia, nivelul de energie sau emoția, iar AI-ul ajustează mișcarea capului și animația facială pentru a se potrivi. Rezultatul este un videoclip complet cu o față vorbitoare, gata pentru rețelele sociale, răspunsuri pentru suportul clienților, materiale de instruire, anunțuri de produse sau mesaje video personalizate.
✦ Best Results Tips
👤
Portret cu Fața Întreagă și Iluminare Bună
Folosește o fotografie bine iluminată în care fața este clar vizibilă din față. Cap centrat, ochii privind spre cameră, zâmbet neutru sau ușor. Evită ochelarii de soare, măștile sau umbrele puternice pe față.
🎭
Promptul Controlează Starea de Spirit, Nu Vorbirea
Câmpul de prompt controlează expresia și stilul gestului — nu ceea ce spune persoana. Scrie lucruri precum încrezător și energic sau calm și gânditor. Vorbirea efectivă provine din fișierul audio sau din textul scris.
⌨️
Scrie Text pentru Cele Mai Rapide Rezultate
Modul Type Text generează vocea și sincronizează buzele într-un singur pas — nu este nevoie să înregistrezi sau să găsești un fișier audio. Alege o voce, setează emoția, scrie cuvintele, iar AI-ul se ocupă de rest.
😊
Alege Emoția Potrivită
Când folosești modul Type Text, setarea emoției schimbă cum sună vocea și cum se mișcă fața. Fericit adaugă căldură și zâmbete ușoare, supărat adaugă intensitate, trist adaugă blândețe. Potrivește emoția cu conținutul.
⏱️
Păstrează Audio-ul Sub 60 de Secunde
Clipurile audio mai scurte produc animații de cea mai înaltă calitate. Sub 60 de secunde este ideal — AI-ul menține consistența mișcărilor naturale pe parcurs. Clipurile mai lungi pot devia în calitatea expresiei.
📐
Cadrarea Capului și Umerilor
Cele mai bune rezultate vin din fotografii cadrate de la piept în sus. Prea mult corp întreg reduce detaliile feței. O decupare prea strânsă nu lasă loc pentru mișcarea naturală a capului în timpul animației.
Avatar v2 — Available Models
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Mode: std
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Mode: pro
📥
You Give
🖼️Character Photo
🎤Audio (TTS or Upload)
🎭Expression Prompt
TTS emotions
😐 Neutral
😊 Happy
😠 Angry
😢 Sad
😨 Fearful
🤢 Disgusted
😲 Surprised
🎤
Upload (MP3/WAV/M4A)
Audio source
🌐
English, Chinese
TTS languages
💰 Avatar v2 — Pricing
Estimated cost
—
Failed jobs are automatically refunded
The Avatar 2.0 feature allows you to upload character images, add voiceovers, and describe the character’s expressions to generate lifelike dynamic avatar videos. The newly upgraded Avatar 2.0 dramatically enhances performance, offering full coverage for 5-minute-long content scenes!
✦
Showcase Kling Avatar
Prompt
Excited and joyful, the child raises her hands covered in paint, laughing and interacting with the colorful art supplies on the table, camera zooms in.
Input
Prompt
Selfie of a young lady with a bright smile, her eyes sparkling with excitement as she sits in the driver's seat. Very Subtile handheld camera mouvement. No cars passing by. No distortions. Very natural mouvements
Input
Prompt
With a joyful expression Santa laughs and interacts with the camera, gesturing with open hands wearing white gloves, exuding holiday cheer, surrounded by festive lights and decorations.
Input
Prompt
While talking, they excitedly shook their heads and swayed their bodies. Finally, they clenched their fists and decided to set off, jumping and skipping happily.
Input
Prompt
Put hands together in front of your chest, and finally hold them together and tell a story naturally.
Input
Prompt
He raised his hand to touch his glasses and then angrily pointed at the camera with his finger.
Input
Prompt
Patient and gentle explanations, occasionally glancing at the item in the hand, maintaining a smile, with natural movement.
Input
Prompt
Professional explanations, natural movements, and sometimes use gestures to assist in the explanation.
Input
Prompt
The singer sings earnestly, enjoying the stage with a smile, her body movements swaying naturally in coordination with the performance.
Input
Prompt
The female singer sings to the audience while looking confident, occasionally smiling at the camera, hand on the microphone, natural arm movements.
Input
Prompt
In a commercial advertisement, a person holds a product in one hand and speaks directly to the camera. The gesture is deliberate and confident.
Input
Prompt
The expression is intoxicated, emotions high, gently shaking the head. The snake around the neck moves as light reflects off its body, gradually zooming in on the face.
Input
Prompt
Smiling, swaying confidently while rapping, holding a microphone. Eyes focused on the audience, natural and fluid movements. Occasional head movements.
Input
Prompt
Confidently posing with a sultry gaze, the figure exudes an aura of mystery and allure, captivating the audience with every movement.
Input
Prompt
A teacher is speaking politely and earnestly.
Input
Prompt
Confidently holding a smartphone, standing in an empty street, exuding a mysterious aura with a slight smile.
Input
Prompt
The man is angry, shown in both facial expression and action.
Input
Prompt
Smiling warmly at the camera, she gently touches her necklace, exuding confidence and grace.
Input