Meta, la empresa propietaria de Facebook, Instagram y WhatsApp, ha presentado este pasado fin de semana su última gran novedad en el campo de la inteligencia artificial generativa: CM3leon, que promete transformar el mundo de la creación de contenido visual y textual.
¿Y cómo pretende lograr eso en un ámbito en el que ChatGPT lidera la generación de textos y Midjourney hace lo propio en la de imágenes? Pues fácil: siendo un modelo de lenguaje multimodal que permite la generación de texto a partir de imágenes y viceversa.
Esto abre un nuevo abanico de posibilidades en la creación de contenido y permite una mayor personalización y adaptabilidad en el proceso creativo. Por ejemplo:
Puede interpretar la estructura y el aspecto de una imagen, lo que garantiza modificaciones coherentes con el contexto general.
Puede describir imágenes mediante texto y responder preguntas sobre el contenido de una imagen.
Puede editar imágenes preexistentes a partir de indicaciones de texto. Por ejemplo, se puede solicitar al sistema que cambie el color del cielo de una imagen o que agregue elementos específicos.
Puede realizar todas esas modificaciones logrando acabados de alta resolución.
Preguntando a la IA sobre una imagen
Más eficiente, sin problemas legales
Pero ése no es su único punto fuerte: CM3leon destaca por su capacidad para ofrecer resultados de alta calidad utilizando cinco veces menos recursos …