видео | Kling AI
Avatar v2
Преобразуйте любое портретное фото в говорящее видео — загрузите фото и предоставьте аудио или напишите, что они должны сказать, и ИИ анимирует лицо с естественным движением и синхронизацией губ
видео
Avatar Standard
Avatar Pro
Kling AI
Avatar v2 оживляет статические фотографии. Загрузите портрет вашего персонажа и предоставьте аудио — либо загрузите запись, либо напишите слова и позвольте ИИ сгенерировать голос — и результатом будет видео, где человек на фотографии, кажется, говорит естественно с реалистичным движением головы, морганием глаз и идеально синхронизированными движениями губ.
Это отличается от Lip Sync, который требует существующего видео. Avatar начинается с одной статической фотографии. ИИ добавляет все движения — тонкие наклоны головы, естественное моргание глаз, изменения выражения лица и точную анимацию рта — создавая убедительное видео с говорящей головой из ничего, кроме статического изображения.
Два аудиорежима охватывают все случаи использования. Загрузка аудио позволяет использовать любую заранее записанную речь, закадровый голос, фрагмент подкаста или переведенное повествование. Режим ввода текста позволяет вам написать диалог, выбрать голос из каталога, выбрать язык и эмоцию (счастливый, грустный, сердитый, удивленный и другие), настроить скорость речи, и ИИ обрабатывает все в одном шаге.
Дополнительный запрос позволяет вам управлять настроением и стилем жестов — опишите выражение, уровень энергии или эмоцию, и ИИ подстраивает движение головы и анимацию лица под это. Результат — полное видео с говорящей головой, готовое для социальных сетей, ответов службы поддержки, учебных материалов, анонсов продуктов или персонализированных видеосообщений.
Это отличается от Lip Sync, который требует существующего видео. Avatar начинается с одной статической фотографии. ИИ добавляет все движения — тонкие наклоны головы, естественное моргание глаз, изменения выражения лица и точную анимацию рта — создавая убедительное видео с говорящей головой из ничего, кроме статического изображения.
Два аудиорежима охватывают все случаи использования. Загрузка аудио позволяет использовать любую заранее записанную речь, закадровый голос, фрагмент подкаста или переведенное повествование. Режим ввода текста позволяет вам написать диалог, выбрать голос из каталога, выбрать язык и эмоцию (счастливый, грустный, сердитый, удивленный и другие), настроить скорость речи, и ИИ обрабатывает все в одном шаге.
Дополнительный запрос позволяет вам управлять настроением и стилем жестов — опишите выражение, уровень энергии или эмоцию, и ИИ подстраивает движение головы и анимацию лица под это. Результат — полное видео с говорящей головой, готовое для социальных сетей, ответов службы поддержки, учебных материалов, анонсов продуктов или персонализированных видеосообщений.
Available Models
Avatar Standard Std
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Avatar Pro Pro
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Лучшие результаты
Портрет анфас с хорошим освещением
Используйте хорошо освещенное фото, где лицо четко видно спереди. Центрированная голова, глаза смотрят в камеру, нейтральная или легкая улыбка. Избегайте солнцезащитных очков, масок или сильных теней на лице.
Запрос управляет настроением, а не речью
Поле запроса управляет выражением и стилем жестов — не тем, что говорит человек. Пишите такие вещи, как уверенный и энергичный или спокойный и задумчивый. Фактическая речь поступает из аудиофайла или набранного текста.
Введите текст для самых быстрых результатов
Режим ввода текста генерирует голос и синхронизирует губы за один шаг — нет необходимости записывать или искать аудиофайл. Выберите голос, установите эмоцию, напишите слова, и ИИ сделает остальное.
Выберите правильную эмоцию
При использовании режима ввода текста настройка эмоции изменяет, как звучит голос и как движется лицо. Счастливый добавляет теплоту и легкие улыбки, сердитый добавляет интенсивность, грустный добавляет мягкость. Соответствуйте эмоцию содержанию.
Держите аудио менее 60 секунд
Короткие аудиофрагменты обеспечивают наивысшее качество анимации. Менее 60 секунд — идеальный вариант — ИИ поддерживает естественную последовательность движений на протяжении всего времени. Более длинные фрагменты могут ухудшить качество выражения.
Кадрирование головы и плеч
Лучшие результаты получаются от фотографий, обрезанных от верхней части груди и выше. Слишком много полного тела уменьшает детали лица. Слишком узкое обрезание не оставляет места для естественного движения головы во время анимации.
Руководства
Avatar v2
🎬
Video
Avatar v2 — Technical Guide
Turn any portrait photo into a talking video — upload a photo and provide audio or type what they should say, and the AI animates the face with natural movement and lip sync