Estamos presenciando una era de rápido crecimiento en el campo de la inteligencia artificial (IA), un periodo que, aunque está lleno de controversia y cierta incertidumbre por las implicaciones éticas y morales, es indudablemente emocionante si tenemos la visión correcta sobre las cosas. Las IA han demostrado su valor y su potencial para mejorar nuestras vidas, facilitar nuestros trabajos o ayudar en otras labores, siempre y cuando se utilicen de manera adecuada y responsable.
Una de las últimas incorporaciones a este panorama en constante evolución es Sora, la nueva IA de generación de vídeo desarrollada por OpenAI, la compañía de Sam Altman creadora de ChatGPT.
¿Qué es Sora?
Sora es una nueva Inteligencia Artificial capaz de producir vídeos de altísima calidad y acabado profesional, como se puede apreciar en su página web oficial. Aunque los resultados son impresionantes y las calidades son increíbles, por supuesto sigue habiendo margen para mejoras. Echa un vistazo a este vídeo de Sora.
Como ves Sora es capaz de momento de crear vídeos de hasta 60 segundos generando escenas altamente detalladas con complejos movimientos de cámara e incluir diferentes personajes.
Hace apenas un año, fuimos testigos de un vídeo humorístico de Will Smith comiendo, generado por IA , el vídeo dejaba mucho que desear en términos de calidad y realismo. Sin embargo, Sora ha superado estas limitaciones, ofreciendo una solución más profesional y completa para la creación de vídeos del tipo “text to image”, como podemos ver el avance tan radical en tal poco tiempo es vertiginoso.
Sora se ha posicionado como una de las IA más avanzadas en el campo de la generación de vídeo, demostrando el enorme potencial de esta tecnología para transformar la forma en que creamos y consumimos contenido multimedia. Con la mejora continua y el enfoque correcto, las IA como Sora pueden desempeñar un papel crucial en la configuración de nuestro futuro digital.
¿Cómo funciona? ¿Qué es text to image?
Habiendo tanta oferta actualmente y tantas opciones diferentes, es normal que ya nos perdamos con la terminología, por eso vamos a explicar brevemente los conceptos básicos.
Las inteligencias artificiales necesitan siempre de un prompt o petición de usuario, es decir, tenemos que comunicarnos con ellas de alguna manera. La opción actualmente más utilizada es la de introducción de texto, es decir, nosotros escribimos lo que queremos y la inteligencia artificial nos devuelve algo, ya sea imagen, música, vídeo, etc. Todo este sistema de trabajo se denomina como «text to», por lo tanto si decimos que Sora es una IA de tipo text to video nos estamos refiriendo precisamente a esto, que puede generar vídeo en función del texto que introduzcamos. Por ejemplo, los vídeos que se pueden ver en la página web oficial de Sora, incluyen a modo de pie de imagen, el prompt o texto que se le ha pedido, como por ejemplo el vídeo de los mamuts, se ha generado con: «Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow»
¿Cuándo se podrá utilizar Sora?
OpenAi todavía no se ha pronunciado con respecto a cuándo estará Sora disponible para su uso, la realidad es que aún sigue en desarrollo y tendremos que esperar aún un poco más para poder probarla. El hype que se ha generado en torno a esta inteligencia artificial es enorme debido a los vídeos que se han generado y las posibilidades que ofrece, pero como decimos aún está en fase muy temprana.
A pesar de todo esto Sora no es pionera en su campo sino que ha sido precedida por otras inteligencias artificiales como por ejemplo Stability Diffusion Video que básicamente era una IA de código abierto que se puede ejecutar en local, pero obviamente los resultados no son similares a los de Sora y normalmente para ejecutar una IA de generación de vídeo en local se suele necesitar un equipo potente. Por otro lado, Google está trabajando a ritmo vertiginoso en el competidor directo de Sora, Lumiere, una IA que además de generar vídeo, sería capaz de editar y modificar vídeos ya existentes, como vemos el ambiente está caldeado con las IAs de generación de vídeo.
¿Cuánto cuesta Sora?
Como mencionábamos, Sora aún está en una fase temprana de desarrollo y ni siquiera tenemos información de su lanzamiento, aunque es probable que pueda venir incluida en el paquete que ofrece OpenAi de GPT4 y DALL-E3, en cualquier caso, actualmente el sistema de pagos de las inteligencias artificiales que no son gratuitas funcionan con un sistema de tokens, como es el caso de ChatGPT. Por otro lado tenemos el sistema de APIs de la IA, es decir, que si queremos incluir una inteligencia artificial dentro de nuestra aplicación tendríamos que pagar por su uso con este sistema de tokens.
Conclusión y reflexión
Sora, DallE, Midjourney, ChatGPT, Bing, Copilot, Gemini, Lumiere, Stable Diffusion, y así un largo etcétera están presentes y van evolucionando, tenemos inteligencias artificiales actualmente para casi todo, ¿quieres generar música? puedes hacerlo con IA también, hasta incluso Adobe aporta una IA que es capaz de transformar cualquier pista de audio que le pasemos, en una grabación profesional como si de un podcast se tratase. Las posibilidades son infinitas y pero el rápido crecimiento de estas herramientas está haciendo que su regulación sea cada vez más complicada. Es importante la educación con respecto al uso de estas herramientas, (que es lo que son, herramientas) y sus implicaciones, para no temerlas irracionalmente sino para saber adaptarse a ellas y ejercer un uso responsable sobre las mismas. El futuro está sobre la mesa y es nuestra responsabilidad saber escoger correctamente las rutas y caminos.