Home DI įrankiai DI gidai DI modeliai DI kūrėjai 🛒 Pirkti Pradėti
🎬 KLING AI ⏱ 4 min read 🗣️ Avatar v2

Avatar v2 — Technical Guide

Paverskite bet kurią portretinę nuotrauką į kalbantį vaizdo įrašą — įkelkite nuotrauką ir pateikite garsą arba įrašykite, ką jie turėtų pasakyti, o dirbtinis intelektas animuoja veidą natūraliu judesiu ir lūpų sinchronizavimu

🗣️

Avatar v2

klingai video /app/avatar →
Paverskite bet kurią portretinę nuotrauką į kalbantį vaizdo įrašą — įkelkite nuotrauką ir pateikite garsą arba įrašykite, ką jie turėtų pasakyti, o dirbtinis intelektas animuoja veidą natūraliu judesiu ir lūpų sinchronizavimu
Avatar v2 prikelia statines nuotraukas gyvybei. Įkelkite savo veikėjo portretą ir pateikite garsą — arba įkelkite įrašą, arba įrašykite žodžius ir leiskite dirbtiniam intelektui sugeneruoti balsą — ir rezultatas yra vaizdo įrašas, kuriame asmuo nuotraukoje atrodo, kad kalba natūraliai su realistišku galvos judesiu, akių mirksėjimu ir puikiai sinchronizuotais lūpų judesiais.

Tai skiriasi nuo Lūpų Sinchronizavimo, kuris reikalauja esamo vaizdo įrašo. Avatar prasideda nuo vienos statinės nuotraukos. Dirbtinis intelektas prideda visus judesius — subtilius galvos pasvirimus, natūralų akių mirksėjimą, veido išraiškos pokyčius ir tikslią burnos animaciją — sukuriant įtikinamą kalbančio žmogaus vaizdo įrašą iš nieko kito, kaip tik iš statinės nuotraukos.

Du garso režimai apima kiekvieną naudojimo atvejį. Įkelti garsą leidžia naudoti bet kokį išankstinį kalbėjimą, balso įrašą, podkastą ar išverstą pasakojimą. Rašyti tekstą režimas leidžia jums rašyti dialogą, pasirinkti balsą iš katalogo, pasirinkti kalbą ir emociją (laimingas, liūdnas, piktas, nustebintas ir kt.), reguliuoti kalbėjimo greitį, o dirbtinis intelektas viską atlieka vienu žingsniu.

Pasirinktinė užklausa leidžia jums nukreipti nuotaiką ir gestų stilių — apibūdinkite išraišką, energijos lygį ar emociją, o dirbtinis intelektas pritaiko galvos judesį ir veido animaciją, kad atitiktų. Rezultatas yra visiškai paruoštas kalbančio žmogaus vaizdo įrašas, tinkamas socialinei medijai, klientų aptarnavimo atsakymams, mokymo medžiagoms, produktų pranešimams ar asmeniniams vaizdo pranešimams.
✦ Best Results Tips
👤 Priekinis portretas su gera apšvietimu
Naudokite gerai apšviestą nuotrauką, kur veidas aiškiai matomas iš priekio. Centruotas galva, akys žiūri į kamerą, neutralus arba šiek tiek šypsantis. Venkite saulės akinių, kaukių ar sunkių šešėlių ant veido.
🎭 Užklausa valdo nuotaiką, o ne kalbą
Užklausos laukas valdo išraišką ir gestų stilių — ne tai, ką sako asmuo. Rašykite tokius dalykus kaip pasitikintis ir energingas arba ramus ir apmąstantis. Tikroji kalba gaunama iš garso failo arba įrašyto teksto.
⌨️ Rašykite tekstą greičiausiems rezultatams
Rašyti tekstą režimas generuoja balsą ir sinchronizuoja lūpas vienu žingsniu — nereikia įrašyti ar ieškoti garso failo. Pasirinkite balsą, nustatykite emociją, rašykite žodžius, o dirbtinis intelektas padarys likusius dalykus.
😊 Pasirinkite tinkamą emociją
Naudojant Rašyti tekstą režimą, emocijos nustatymas keičia, kaip skamba balsas ir kaip juda veidas. Laimingas prideda šilumos ir šiek tiek šypsenų, piktas prideda intensyvumo, liūdnas prideda švelnumo. Suderinkite emociją su turiniu.
⏱️ Laikykite garsą trumpesnį nei 60 sekundžių
Trumpesni garso įrašai sukuria aukščiausios kokybės animaciją. Idealu, jei trukmė yra mažesnė nei 60 sekundžių — dirbtinis intelektas išlaiko natūralaus judesio nuoseklumą visą laiką. Ilgesni įrašai gali nukrypti nuo išraiškos kokybės.
📐 Galvos ir pečių rėminimas
Geriausi rezultatai gaunami iš nuotraukų, kad jos būtų rėminamos nuo viršutinės krūtinės. Per daug viso kūno sumažina veido detales. Per daug siauras kadras nepalieka vietos natūraliam galvos judesiui animacijos metu.

Avatar v2 — Available Models

Avatar Standard
Default
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Mode: std
Avatar Pro
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Mode: pro
📥 You Give
🖼️Character Photo 🎤Audio (TTS or Upload) 🎭Expression Prompt
AI Magic
klingai
🎬 You Get
🎬 Video
Quality modes
Standard
Professional
TTS emotions
😐 Neutral 😊 Happy 😠 Angry 😢 Sad 😨 Fearful 🤢 Disgusted 😲 Surprised
⏱️
5 min
Max duration
🎤
Upload (MP3/WAV/M4A)
Audio source
🎤
TTS
Audio source
🌐
English, Chinese
TTS languages

💰 Avatar v2 — Pricing

Estimated cost
Failed jobs are automatically refunded
The Avatar 2.0 feature allows you to upload character images, add voiceovers, and describe the character’s expressions to generate lifelike dynamic avatar videos. The newly upgraded Avatar 2.0 dramatically enhances performance, offering full coverage for 5-minute-long content scenes!

Showcase Kling Avatar

Prompt Excited and joyful, the child raises her hands covered in paint, laughing and interacting with the colorful art supplies on the table, camera zooms in.
Input
Input
Output
Prompt Selfie of a young lady with a bright smile, her eyes sparkling with excitement as she sits in the driver's seat. Very Subtile handheld camera mouvement. No cars passing by. No distortions. Very natural mouvements
Input
Input
Output
Prompt With a joyful expression Santa laughs and interacts with the camera, gesturing with open hands wearing white gloves, exuding holiday cheer, surrounded by festive lights and decorations.
Input
Input
Output
Prompt While talking, they excitedly shook their heads and swayed their bodies. Finally, they clenched their fists and decided to set off, jumping and skipping happily.
Input
Input
Output
Prompt Put hands together in front of your chest, and finally hold them together and tell a story naturally.
Input
Input
Output
Prompt He raised his hand to touch his glasses and then angrily pointed at the camera with his finger.
Input
Input
Output
Prompt Patient and gentle explanations, occasionally glancing at the item in the hand, maintaining a smile, with natural movement.
Input
Input
Output
Prompt Professional explanations, natural movements, and sometimes use gestures to assist in the explanation.
Input
Input
Output
Prompt The singer sings earnestly, enjoying the stage with a smile, her body movements swaying naturally in coordination with the performance.
Input
Input
Output
Prompt The female singer sings to the audience while looking confident, occasionally smiling at the camera, hand on the microphone, natural arm movements.
Input
Input
Output
Prompt In a commercial advertisement, a person holds a product in one hand and speaks directly to the camera. The gesture is deliberate and confident.
Input
Input
Output
Prompt The expression is intoxicated, emotions high, gently shaking the head. The snake around the neck moves as light reflects off its body, gradually zooming in on the face.
Input
Input
Output
Prompt Smiling, swaying confidently while rapping, holding a microphone. Eyes focused on the audience, natural and fluid movements. Occasional head movements.
Input
Input
Output
Prompt Confidently posing with a sultry gaze, the figure exudes an aura of mystery and allure, captivating the audience with every movement.
Input
Input
Output
Prompt A teacher is speaking politely and earnestly.
Input
Input
Output
Prompt Confidently holding a smartphone, standing in an empty street, exuding a mysterious aura with a slight smile.
Input
Input
Output
Prompt The man is angry, shown in both facial expression and action.
Input
Input
Output
Prompt Smiling warmly at the camera, she gently touches her necklace, exuding confidence and grace.
Input
Input
Output

🗣️ Avatar v2

Išbandyti Avatar v2