Google tiene una demo de Cloud Vision y su API en la nube, uno de los servicios que ofrecen a desarrolladores, con la que se pueden fácilmente arrastrar-y-soltar fotos a ver qué es lo que «adivina». Abre la demo, arrastra una foto, demuestra que no eres un robot haciendo un clic (¡oh, la ironía!), y listo.
Básicamente la demo de Cloud Vision muestra un resumen rápido de toda la información que puede extraer de una imagen, organizada en varias pestañas: rostros, objetos, textos, etcétera. De este modo se puede ver si reconoce personas en la fotografía o no, y si los rostros son identificables, cuáles son sus gestos y características: disfrutando, tristes, enfadados, sorpresa… Con algoritmos como este funcionan las cámaras de fotos y también los sistemas de seguimiento que hay en algunas tiendas para estudiar el comportamiento de los clientes, entre otros.
El algoritmo también puede identificar objetos y situar la imagen en su contexto y categorizarla: ¿es una estación de metro? ¿hay coches? ¿árboles? En el ejemplo [véase completo en alta resolución] clasifica la imagen dentro de la categoría transporte, sabe que es una estación de metro y que en algún lugar aparece carteles publicitarios (en este caso se equivoca, son meramente informativos). A cada característica se le asigna un porcentaje entre 0% y 100% (certeza). También utiliza una clasificación similar llamada Entidades Web, en este caso de 0 a 1 (transporte rápido, anuncios, estación intercambiadora).
Otra cosa que calcula son los colores dominantes y también hay información …