Kling Video
Gere vídeos de IA a partir de texto ou fotos — com diálogo falado embutido, storyboards de múltiplas cenas, controle de câmera e elementos de personagem para identidade consistente entre as cenas
O que diferencia isso de ferramentas de vídeo mais simples é o áudio nativo embutido. Escreva diálogos em seu prompt usando referências de voz, e os personagens realmente falam no vídeo gerado com seus lábios perfeitamente sincronizados. Nenhuma etapa separada de sincronização labial é necessária — o vídeo sai com voz, som e visuais juntos.
O modo de múltiplas cenas permite que você construa sequências de storyboard de até 6 cenas em uma única geração. Cada cena recebe seu próprio prompt e duração, criando uma mini narrativa — uma cena de abertura, uma reação, uma mudança de cena, um close, uma revelação. Você pode escrever cada cena você mesmo ou deixar a IA dividir seu prompt em tomadas ótimas automaticamente.
Elementos permitem que você faça referência a personagens pré-treinados para que a IA saiba exatamente como eles se parecem. Referências de voz permitem que você atribua vozes específicas a personagens no diálogo. Controles de câmera oferecem aproximações, panorâmicas, inclinações, órbitas e tomadas de grua. O modo de quadro inicial e final permite que você defina o primeiro e o último quadro do vídeo, e a IA gera a transição entre eles.
Seis versões de modelo oferecem opções desde rascunhos rápidos até qualidade cinematográfica máxima, com a v3 oferecendo as capacidades mais recentes e a maior fidelidade.
Available Models
Top-tier cinematic video with native multilingual audio and lip-sync. Multi-shot storyboards up to 6 scenes with AI Director. Physics-aware motion, 3+ character consistency, flexible 3-15s duration. Best quality available for prompt-driven creative work.
Industrial-grade character and voice consistency using Elements 3.0 references. Native audio with voice binding and cloning, perfect lip-sync across shots. Multi-shot via references. The model you choose when your character must look identical in every frame.
Advanced multimodal reasoning model with excellent start/end frame transitions and motion transfer. Strong visual consistency in single-shot mode. Precursor to v3 Omni architecture.
Advanced motion engine with fluid actions and stable camera. First model with native audio support and voice control — characters can speak with assigned voices. Strong temporal coherence for cinematic final clips.
Speed-optimized model for rapid iteration. Decent cinematic motion at significantly lower cost and faster generation. Ideal for testing prompt ideas before committing to a higher-tier model.
Master quality tier with improved character motion stability. Professional mode only — designed for polished output rather than quick drafts.
Original master quality tier. Professional mode only. Superseded by v2.1 Master with better stability, but still available for existing workflows.
Reliable mid-generation model at lower cost. Supports Element references for character consistency and camera controls. Good balance of features and affordability.
Original Kling model. Lowest cost for quick experiments and testing basic concepts. Simple text-to-video and image-to-video at minimal credit cost.
Melhores resultados
Galeria
Guias
Kling Video — Technical Guide
Generate AI videos from text or photos — with built-in spoken dialogue, multi-shot storyboards, camera control, and character elements for consistent identity across scenes