Introducción

El 7 de junio de 2024 marca un hito importante en la industria tecnológica con el lanzamiento de KLing, una innovadora herramienta de inteligencia artificial procedente de China desarrollada por Kuaishou. Este nuevo lanzamiento pretende revolucionar la creación de contenido audiovisual mediante sus avanzadas capacidades en modelado de movimiento, generación de videos y combinación de conceptos creativos. La aparición de KLing está destinada a ser una competencia feroz para otros modelos de IA, como SORA de OpenAI y VEO de Google, forzando a estas compañías a acelerar el desarrollo y disponibilidad de sus propias herramientas avanzadas al público.

Principales características

1. Movimiento Razonable a Gran Escala: KLing adopta un mecanismo de atención conjunta espacio-tiempo 3D, lo que le permite modelar mejor el movimiento complejo en el espacio y el tiempo. Esta tecnología genera contenido de video de movimiento a gran escala que se ajusta a las leyes del movimiento físico.

2. Generación de Video Hasta 2 Minutos: Gracias a su infraestructura de entrenamiento eficiente, optimización del razonamiento extremo y escalabilidad, KLing puede generar videos de hasta 2 minutos con una velocidad de fotogramas de 30 fps. Esto es ideal para crear videos detallados y continuos.

3. Simulación de Características del Mundo Físico: KLing puede simular las características físicas del mundo real gracias a su arquitectura de modelo autodesarrollada y su capacidad de modelado inspirada en la Ley de Escalado. Esto permite generar videos que respetan las leyes de la física.

4. Fuerte Capacidad de Combinación de Conceptos: Basado en una profunda comprensión de la semántica de texto y video y la arquitectura del transformador de difusión, KLing puede transformar la imaginación del usuario en imágenes específicas y escenas de ficción que no existen en el mundo real.

5. Generación de Imágenes de Grado Cinematográfico: Utilizando un 3D VAE autodesarrollado, KLing puede generar videos cinematográficos en resolución 1080p, presentando vívidamente tanto escenas vastas y magníficas como primeros planos detallados.

6. Relación de Aspecto de Video de Salida Gratuita: KLing adopta una estrategia de entrenamiento de resolución variable, permitiendo generar videos en diversas relaciones de aspecto para satisfacer diferentes necesidades. Esto es útil para producir contenido adaptable.

7. Tecnología de Reconstrucción de Cara y Cuerpo en 3D: KLing combina la tecnología de reconstrucción de cara y cuerpo humano en 3D con un módulo de estabilidad de fondo y redirección, logrando animaciones realistas con solo una foto de cuerpo completo. Esto permite experiencias interactivas únicas, como «cantar y bailar» basadas en imágenes estáticas.

Conclusión

KLing de Kuaishou representa un avance significativo en la inteligencia artificial aplicada a la creación de contenido visual. Sus capacidades avanzadas en el modelado de movimiento, generación de videos de alta calidad y combinación de conceptos creativos ofrecen una herramienta poderosa para creadores y empresas. A medida que KLing se integra en más aplicaciones, es probable que veamos una mejora significativa en la eficiencia y calidad del contenido digital. Además, KLing será una dura competencia para otros modelos como SORA de OpenAI o VEO de Google, lo que obligará a estas compañías a poner a disposición del público, cuanto antes, sus herramientas.

Para ver KLing en acción, puedes revisar los videos de demostración en su página web:

https://kling.kuaishou.com/


Deja un comentario

También te podría Interesar :