video | Kling AI
Avatar v2
Paverskite bet kurią portretinę nuotrauką į kalbantį vaizdo įrašą — įkelkite nuotrauką ir pateikite garsą arba įrašykite, ką jie turėtų pasakyti, o dirbtinis intelektas animuoja veidą natūraliu judesiu ir lūpų sinchronizavimu
video
Avatar Standard
Avatar Pro
Kling AI
Avatar v2 prikelia statines nuotraukas gyvybei. Įkelkite savo veikėjo portretą ir pateikite garsą — arba įkelkite įrašą, arba įrašykite žodžius ir leiskite dirbtiniam intelektui sugeneruoti balsą — ir rezultatas yra vaizdo įrašas, kuriame asmuo nuotraukoje atrodo, kad kalba natūraliai su realistišku galvos judesiu, akių mirksėjimu ir puikiai sinchronizuotais lūpų judesiais.
Tai skiriasi nuo Lūpų Sinchronizavimo, kuris reikalauja esamo vaizdo įrašo. Avatar prasideda nuo vienos statinės nuotraukos. Dirbtinis intelektas prideda visus judesius — subtilius galvos pasvirimus, natūralų akių mirksėjimą, veido išraiškos pokyčius ir tikslią burnos animaciją — sukuriant įtikinamą kalbančio žmogaus vaizdo įrašą iš nieko kito, kaip tik iš statinės nuotraukos.
Du garso režimai apima kiekvieną naudojimo atvejį. Įkelti garsą leidžia naudoti bet kokį išankstinį kalbėjimą, balso įrašą, podkastą ar išverstą pasakojimą. Rašyti tekstą režimas leidžia jums rašyti dialogą, pasirinkti balsą iš katalogo, pasirinkti kalbą ir emociją (laimingas, liūdnas, piktas, nustebintas ir kt.), reguliuoti kalbėjimo greitį, o dirbtinis intelektas viską atlieka vienu žingsniu.
Pasirinktinė užklausa leidžia jums nukreipti nuotaiką ir gestų stilių — apibūdinkite išraišką, energijos lygį ar emociją, o dirbtinis intelektas pritaiko galvos judesį ir veido animaciją, kad atitiktų. Rezultatas yra visiškai paruoštas kalbančio žmogaus vaizdo įrašas, tinkamas socialinei medijai, klientų aptarnavimo atsakymams, mokymo medžiagoms, produktų pranešimams ar asmeniniams vaizdo pranešimams.
Tai skiriasi nuo Lūpų Sinchronizavimo, kuris reikalauja esamo vaizdo įrašo. Avatar prasideda nuo vienos statinės nuotraukos. Dirbtinis intelektas prideda visus judesius — subtilius galvos pasvirimus, natūralų akių mirksėjimą, veido išraiškos pokyčius ir tikslią burnos animaciją — sukuriant įtikinamą kalbančio žmogaus vaizdo įrašą iš nieko kito, kaip tik iš statinės nuotraukos.
Du garso režimai apima kiekvieną naudojimo atvejį. Įkelti garsą leidžia naudoti bet kokį išankstinį kalbėjimą, balso įrašą, podkastą ar išverstą pasakojimą. Rašyti tekstą režimas leidžia jums rašyti dialogą, pasirinkti balsą iš katalogo, pasirinkti kalbą ir emociją (laimingas, liūdnas, piktas, nustebintas ir kt.), reguliuoti kalbėjimo greitį, o dirbtinis intelektas viską atlieka vienu žingsniu.
Pasirinktinė užklausa leidžia jums nukreipti nuotaiką ir gestų stilių — apibūdinkite išraišką, energijos lygį ar emociją, o dirbtinis intelektas pritaiko galvos judesį ir veido animaciją, kad atitiktų. Rezultatas yra visiškai paruoštas kalbančio žmogaus vaizdo įrašas, tinkamas socialinei medijai, klientų aptarnavimo atsakymams, mokymo medžiagoms, produktų pranešimams ar asmeniniams vaizdo pranešimams.
Available Models
Avatar Standard Std
kling-v2-avatar
Natural lip-sync and expressive motion from portrait + audio.
Avatar Pro Pro
kling-v2-avatar
Higher fidelity, smoother motion, improved expressivity.
Geriausi rezultatai
Priekinis portretas su gera apšvietimu
Naudokite gerai apšviestą nuotrauką, kur veidas aiškiai matomas iš priekio. Centruotas galva, akys žiūri į kamerą, neutralus arba šiek tiek šypsantis. Venkite saulės akinių, kaukių ar sunkių šešėlių ant veido.
Užklausa valdo nuotaiką, o ne kalbą
Užklausos laukas valdo išraišką ir gestų stilių — ne tai, ką sako asmuo. Rašykite tokius dalykus kaip pasitikintis ir energingas arba ramus ir apmąstantis. Tikroji kalba gaunama iš garso failo arba įrašyto teksto.
Rašykite tekstą greičiausiems rezultatams
Rašyti tekstą režimas generuoja balsą ir sinchronizuoja lūpas vienu žingsniu — nereikia įrašyti ar ieškoti garso failo. Pasirinkite balsą, nustatykite emociją, rašykite žodžius, o dirbtinis intelektas padarys likusius dalykus.
Pasirinkite tinkamą emociją
Naudojant Rašyti tekstą režimą, emocijos nustatymas keičia, kaip skamba balsas ir kaip juda veidas. Laimingas prideda šilumos ir šiek tiek šypsenų, piktas prideda intensyvumo, liūdnas prideda švelnumo. Suderinkite emociją su turiniu.
Laikykite garsą trumpesnį nei 60 sekundžių
Trumpesni garso įrašai sukuria aukščiausios kokybės animaciją. Idealu, jei trukmė yra mažesnė nei 60 sekundžių — dirbtinis intelektas išlaiko natūralaus judesio nuoseklumą visą laiką. Ilgesni įrašai gali nukrypti nuo išraiškos kokybės.
Galvos ir pečių rėminimas
Geriausi rezultatai gaunami iš nuotraukų, kad jos būtų rėminamos nuo viršutinės krūtinės. Per daug viso kūno sumažina veido detales. Per daug siauras kadras nepalieka vietos natūraliam galvos judesiui animacijos metu.
Vadovai
Avatar v2
🎬
Video
Avatar v2 — Technical Guide
Turn any portrait photo into a talking video — upload a photo and provide audio or type what they should say, and the AI animates the face with natural movement and lip sync