• Tres estudiantes de Stanford desarrollan una IA para saber dónde se ha tomado una foto con una tasa de éxito tan alta que supera incluso al mejor jugador de GeoGuessr.
  • Entrenado con imágenes de Google Street View, el sistema PIGEON acierta casi todos los países donde fue hecha la imagen, y es capaz de situar más del 40% de sus estimaciones a menos de 25 kilómetros del lugar donde fue fotografiado.
  • Sus creadores ya trabajan en una evolución: PIGEOTTO, entrenada con imágenes de Flickr y Wikipedia.

Todos hemos visto la escena en un sinfín de películas del estilo Mission Impossible: un peligroso terrorista tiene al mundo en vilo, hasta que a alguien del departamento de informática (por lo general un tipo barbudo y con gafas) se le ocurre escanear una fotografía del terrorista en un software mágico para, ¡zas!, dar con su ubicación, mandar un par de helicópteros y bombardearlo todo durante la boda de su hija favorita.

Pues bien, es posible que ese software mágico pronto sea una realidad.

PIGEON, la herramienta con inteligencia artificial para saber dónde se ha tomado una imagen

Tres estudiantes de la Universidad de Stanford (bendita institución de la que salieron, entre muchos otros, Larry Page y Marck Zuckerberg -Elon Musk aguantó dos días-) han desarrollado una inteligencia artificial que, bajo el nombre de Predicting Image Geolocations (PIGEON, paloma en inglés) ha sido entrenada con imágenes de Google Street View para acertar con un 92% de fiabilidad el país donde fue tomada una imagen, aspirando en un futuro cercano a poder identificar la ubicación exacta de cualquier fotografía.

Relacionado: Stable Diffusion fue entrenado con imágenes de abusos infantiles

Ilustración sacada de la investigación PIGEON: Predicting Image Geolocations.
Ilustración sacada de la investigación PIGEON: Predicting Image Geolocations.

Como no podía ser de otro modo, los tres desarrolladores (Michal Skreta, Silas Alberti y Lukas Haas) son fanáticos jugadores de GeoGuesser, un juego online que consiste en adivinar ubicaciones a partir de fotos de Google Street View.

Esta IA para identificar la ubicación de una fotografía puede señalar un lugar con una precisión de 25 kilómetros en más del 40% de los casos.

El desarrollo de esta IA para adivinar dónde ha sido tomada una foto tiene mucho que ver con el hecho de que, en los últimos años, Geoguessr haya alcanzado tremendas cotas de popularidad, gracias en parte a unos cuantos youtubers con estátus de dioses bendecidos con el don de reconocer una aldea albanesa con una simple ojeada a un cubo de basura.

Ha sido precisamente ese juego online la clave para confirmar que el invento funciona: las capacidades de PIGEON se evidenciaron cuando se las arregló para clasificarse entre el 0,01% de los mejores jugadores del mundo  de GeoGuessr, llegando a derrotar a uno de los mejores jugadores profesionales, Trevor Rainbolt.

Para desarrollar esta inteligencia artificial, los estudiantes usaron CLIP, una red neuronal desarrollada por OpenAI que puede conectar texto e imágenes entrenándola con los nombres de las categorías visuales que debía reconocer.

A continuación, inspirándose en GeoGuessr, entrenaron a PIGEON con un conjunto de datos de 100.000 ubicaciones originales muestreadas aleatoriamente a partir del juego (que usa imágenes tomadas por el coche de Google Street View) y un conjunto de descarga de cuatro imágenes para abarcar un «panorama» completo en una ubicación determinada, lo que hace un total de 400.000 imágenes.

Relacionado: Cómo Crear Imágenes con IA Gratis [GUÍA DEFINITIVA 2024]

Como adivinar con IA donde se ha hecho una foto

PIGEOTTO, un modelo de reconocimiento geográfico entrenado con fotos de Flickr y Wikipedia

Los investigadores ya tienen en marcha un segundo modelo, PIGEOTTO (nombre que recuerda a la evolución de un Pokémon volador). Esta IA destaca por su entrenamiento basado en un conjunto de cuatro millones de imágenes de Flickr y Wikipedia para tratar de precisar el lugar donde fueron tomadas.

«Evolucionamos nuestro modelo a PIGEOTTO, que se diferencia de PIGEON en que toma una sola imagen como entrada y se entrena con un conjunto de datos más amplio y diverso, con más de 4 millones de fotos procedentes de Flickr y Wikipedia, y sin datos de Street View. Street View. PIGEOTTO obtiene los mejores resultados en una amplia gama de conjuntos de datos de referencia».

PIGEOTTO funciona incluso mejor, «alcanzando un rendimiento SOTA (state of the art) en todas las métricas excepto en el nivel de calle, con una impresionante mejora de 11,4 puntos porcentuales en el nivel de país», según leemos en el estudio.

Los resultados sugieren que PIGEOTTO se convertiría en el primer modelo de geolocalización de imágenes capaz de identificar eficazmente ubicaciones desconocidas, allanando el camino para sistemas de geolocalización de imágenes de alta precisión a escala mundial.

Como tantas otras aplicaciones de la IA, es probable que este nuevo poder sea un arma de doble filo: puede ayudar a la gente a identificar la ubicación de viejas instantáneas de familiares, o ayudar a que un biólogo realice estudios rápidos de regiones enteras en busca de especies vegetales invasoras, pero también puede poner en aprietos nuestra intimidad. Las implicaciones para nuestra privacidad son más que evidentes.

Por desgracia, aún no podemos usar esta herramienta, pero estaremos al tanto sobre cualquier fecha de publicación. Puedes leer la investigación completa de la IA PIGEON para identificar la ubicación de una fotografía en este enlace.