Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 18/04/2023 13:50

Escrito por: Marcos Merino

"Sólo tengo una foto de este plato, dime la receta". Lanzan un 'ChatGPT para imágenes', que habla con nosotros sobre su contenido

Cuando OpenAI anunció el lanzamiento de GPT-4, afirmó que su chatbot de última generación incluiría también capacidades visuales; esto es, que podríamos subir fotos a la plataforma de igual manera que pegamos textos, y que GPT-4 reconocería su contenido y nos aportaría información sobre dichas imágenes.

Lo cierto es que las nuevas funcionalidades de GPT-4 se han ido activando poco a poco: aún no todos los usuarios tienen acceso a su función de plugins, y a nadie se le han activado por ahora las capacidades visuales, aunque hayamos podido verlas en acción en la presentación de OpenAI.

¿Qué han conseguido con esa tardanza en su lanzamiento? Que un proyecto 'open source' se les adelante. ¿Su nombre? MiniGPT-4. Empiezan mal, porque es un nombre tramposo (MiniGPT-4 no hace uso de la tecnología de OpenAI), sin embargo, a nivel técnico, luce por méritos propios. 'MiniGPT-4' consiste en crear un combo lenguaje-visión, conectando:

un chatbot cuyos creadores afirman que se equipara en rendimiento a GPT-3.5 (Vicuna, una versión mejorada de Alpaca, que a su vez es una versión opensource de LLaMA de Meta)…
con otra IA de reconocimiento de imágenes, capaz de describir con palabras cualquier imagen que le presentemos (concretamente BLIP-2, también opensource, y que ya fue usado por Microsoft para integrarlo en su 'VisualGPT').

Su versión web es insoportablemente lenta, pero permite su ejecución en local en el PC

En Genbeta

Así es Auto-GPT, una nueva …

Lee toda la nota original aquí

Top noticias del 18 de Abril de 2023

Notasbit

Las mejores noticias de tecnología en un sólo lugar

"Sólo tengo una foto de este plato, dime la receta". Lanzan un 'ChatGPT para imágenes', que habla con nosotros sobre su contenido

Top noticias del 18 de Abril de 2023

Todo sobre el sismo de la noche de hoy en México: magnitud de 5.8 con epicentro en Técpan, Guerrero

Una de las mejores grabadoras de voz para Android se puede descargar gratis durante unas horas

Ahora puedes agendar tu cita para pasaporte en México a través de WhatsApp

Intel detiene el soporte de su chip especializado en criptomonedas

Instagram permite agregar múltiples enlaces en la biografía

YouTube toma nuevas medidas para proteger la salud mental de los usuarios

Mira la nueva generación de Porsche Cayenne, más lujo y mejor rendimiento

Elon Musk acaba de fundar X.AI Corp, su nueva empresa de Inteligencia Artificial