Home ИИ-инструменты ИИ-гайды ИИ-модели ИИ-создатели 🛒 Купить Начать
🎬 KLING AI ⏱ 4 min read 🗣️ Avatar v2

Avatar v2 — Technical Guide

Преобразуйте любое портретное фото в говорящее видео — загрузите фото и предоставьте аудио или напишите, что они должны сказать, и ИИ анимирует лицо с естественным движением и синхронизацией губ

🗣️

Avatar v2

klingai video /app/avatar →
Преобразуйте любое портретное фото в говорящее видео — загрузите фото и предоставьте аудио или напишите, что они должны сказать, и ИИ анимирует лицо с естественным движением и синхронизацией губ
Avatar v2 оживляет статические фотографии. Загрузите портрет вашего персонажа и предоставьте аудио — либо загрузите запись, либо напишите слова и позвольте ИИ сгенерировать голос — и результатом будет видео, где человек на фотографии, кажется, говорит естественно с реалистичным движением головы, морганием глаз и идеально синхронизированными движениями губ.

Это отличается от Lip Sync, который требует существующего видео. Avatar начинается с одной статической фотографии. ИИ добавляет все движения — тонкие наклоны головы, естественное моргание глаз, изменения выражения лица и точную анимацию рта — создавая убедительное видео с говорящей головой из ничего, кроме статического изображения.

Два аудиорежима охватывают все случаи использования. Загрузка аудио позволяет использовать любую заранее записанную речь, закадровый голос, фрагмент подкаста или переведенное повествование. Режим ввода текста позволяет вам написать диалог, выбрать голос из каталога, выбрать язык и эмоцию (счастливый, грустный, сердитый, удивленный и другие), настроить скорость речи, и ИИ обрабатывает все в одном шаге.

Дополнительный запрос позволяет вам управлять настроением и стилем жестов — опишите выражение, уровень энергии или эмоцию, и ИИ подстраивает движение головы и анимацию лица под это. Результат — полное видео с говорящей головой, готовое для социальных сетей, ответов службы поддержки, учебных материалов, анонсов продуктов или персонализированных видеосообщений.
✦ Best Results Tips
👤 Портрет анфас с хорошим освещением
Используйте хорошо освещенное фото, где лицо четко видно спереди. Центрированная голова, глаза смотрят в камеру, нейтральная или легкая улыбка. Избегайте солнцезащитных очков, масок или сильных теней на лице.
🎭 Запрос управляет настроением, а не речью
Поле запроса управляет выражением и стилем жестов — не тем, что говорит человек. Пишите такие вещи, как уверенный и энергичный или спокойный и задумчивый. Фактическая речь поступает из аудиофайла или набранного текста.
⌨️ Введите текст для самых быстрых результатов
Режим ввода текста генерирует голос и синхронизирует губы за один шаг — нет необходимости записывать или искать аудиофайл. Выберите голос, установите эмоцию, напишите слова, и ИИ сделает остальное.
😊 Выберите правильную эмоцию
При использовании режима ввода текста настройка эмоции изменяет, как звучит голос и как движется лицо. Счастливый добавляет теплоту и легкие улыбки, сердитый добавляет интенсивность, грустный добавляет мягкость. Соответствуйте эмоцию содержанию.
⏱️ Держите аудио менее 60 секунд
Короткие аудиофрагменты обеспечивают наивысшее качество анимации. Менее 60 секунд — идеальный вариант — ИИ поддерживает естественную последовательность движений на протяжении всего времени. Более длинные фрагменты могут ухудшить качество выражения.
📐 Кадрирование головы и плеч
Лучшие результаты получаются от фотографий, обрезанных от верхней части груди и выше. Слишком много полного тела уменьшает детали лица. Слишком узкое обрезание не оставляет места для естественного движения головы во время анимации.

Avatar v2 — Available Models

Avatar Standard
Default
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Mode: std
Avatar Pro
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Mode: pro
📥 You Give
🖼️Character Photo 🎤Audio (TTS or Upload) 🎭Expression Prompt
AI Magic
klingai
🎬 You Get
🎬 Video
Quality modes
Standard
Professional
TTS emotions
😐 Neutral 😊 Happy 😠 Angry 😢 Sad 😨 Fearful 🤢 Disgusted 😲 Surprised
⏱️
5 min
Max duration
🎤
Upload (MP3/WAV/M4A)
Audio source
🎤
TTS
Audio source
🌐
English, Chinese
TTS languages

💰 Avatar v2 — Pricing

Estimated cost
Failed jobs are automatically refunded
The Avatar 2.0 feature allows you to upload character images, add voiceovers, and describe the character’s expressions to generate lifelike dynamic avatar videos. The newly upgraded Avatar 2.0 dramatically enhances performance, offering full coverage for 5-minute-long content scenes!

Showcase Kling Avatar

Prompt Excited and joyful, the child raises her hands covered in paint, laughing and interacting with the colorful art supplies on the table, camera zooms in.
Input
Input
Output
Prompt Selfie of a young lady with a bright smile, her eyes sparkling with excitement as she sits in the driver's seat. Very Subtile handheld camera mouvement. No cars passing by. No distortions. Very natural mouvements
Input
Input
Output
Prompt With a joyful expression Santa laughs and interacts with the camera, gesturing with open hands wearing white gloves, exuding holiday cheer, surrounded by festive lights and decorations.
Input
Input
Output
Prompt While talking, they excitedly shook their heads and swayed their bodies. Finally, they clenched their fists and decided to set off, jumping and skipping happily.
Input
Input
Output
Prompt Put hands together in front of your chest, and finally hold them together and tell a story naturally.
Input
Input
Output
Prompt He raised his hand to touch his glasses and then angrily pointed at the camera with his finger.
Input
Input
Output
Prompt Patient and gentle explanations, occasionally glancing at the item in the hand, maintaining a smile, with natural movement.
Input
Input
Output
Prompt Professional explanations, natural movements, and sometimes use gestures to assist in the explanation.
Input
Input
Output
Prompt The singer sings earnestly, enjoying the stage with a smile, her body movements swaying naturally in coordination with the performance.
Input
Input
Output
Prompt The female singer sings to the audience while looking confident, occasionally smiling at the camera, hand on the microphone, natural arm movements.
Input
Input
Output
Prompt In a commercial advertisement, a person holds a product in one hand and speaks directly to the camera. The gesture is deliberate and confident.
Input
Input
Output
Prompt The expression is intoxicated, emotions high, gently shaking the head. The snake around the neck moves as light reflects off its body, gradually zooming in on the face.
Input
Input
Output
Prompt Smiling, swaying confidently while rapping, holding a microphone. Eyes focused on the audience, natural and fluid movements. Occasional head movements.
Input
Input
Output
Prompt Confidently posing with a sultry gaze, the figure exudes an aura of mystery and allure, captivating the audience with every movement.
Input
Input
Output
Prompt A teacher is speaking politely and earnestly.
Input
Input
Output
Prompt Confidently holding a smartphone, standing in an empty street, exuding a mysterious aura with a slight smile.
Input
Input
Output
Prompt The man is angry, shown in both facial expression and action.
Input
Input
Output
Prompt Smiling warmly at the camera, she gently touches her necklace, exuding confidence and grace.
Input
Input
Output

🗣️ Avatar v2

Попробовать Avatar v2