PlaNet, la nuova intelligenza Google che sa dov'è stata fatta una foto
Il sapere assoluto, la conoscenza capillare del mondo non è più un miraggio. I paesaggi del nostro pianeta sono ormai catalogati, quasi completamente; questo sapere è conservato al sicuro nei server di Google. Non un sapere universale, questo no, ma comunque davvero molto vasto. La notizia è che ora il colosso dell’informatica ha creato un sistema intelligente che può geolocalizzare quasi qualsiasi foto: un algoritmo che analizza l’immagine e indica il luogo in cui è stata scattata, anche se sono presenti pochi dettagli significativi.
Clicca sull'immagine per cercare di indovinare i luoghi del mondo dalle foto di Google.
PlaNet. A svolgere quella che sembra una magia è PlaNet, non un programma qualunque, ma una potentissima rete neurale, che sfrutta il deep learning, cioè l’apprendimento profondo, possibile grazie a tecnologie di intelligenza artificiale. Il funzionamento dell’algoritmo è stato spiegato in un articolo scientifico caricato sul server ArXiv. L’efficienza è migliore rispetto agli altri programmi simili di circa il 50 percento. Su 2,3 milioni di immagini prese Flickr e sottoposte a PlaNet, il 3,6 percento di esse è stato geolocalizzato con precisione assoluta, cioè individuando addirittura la strada. Per il 10,1 percento invece è stata invece indicata la città; di un altro 28,4 percento è stata trovata la nazione, mentre di circa il 48 si è trovato il continente.
Più bravo dell’uomo. Se pensate che siano risultati mediocri, sappiate che non è così. L’algoritmo è stato messo in competizione con gli umani, 10 esperti viaggiatori, giocando al quiz del sito Geoguessr. Il gioco consiste nell’individuare il luogo in cui è stata scattata una certa foto di Google Maps. La precisione della macchina si è dimostrata migliore del doppio rispetto a quella delle persone. Se la distanza media tra le coordinate esatte e quelle delle risposte degli utenti si è attestata sui 2.320,75 chilometri, PlaNet ha dimezzato l’imprecisione, con 1131,7 chilometri. Su 50 domande, hanno fatto centro in 28 casi.
Come funziona. Gli sviluppatori hanno diviso la mappa del pianeta in 26mila quadrati di diverse dimensioni, più o meno grandi a seconda della quantità di fotografie a disposizione. Se un luogo è molto fotografato, il quadratino è di dimensioni minori; se scarsamente fotografato, più ampio. La mappa in questo modo è più dettagliata nei luoghi più fotografati (e quindi frequentati e cercati) e darà risposte più precise nelle zone più interessanti. È stata quindi caricata la memoria di PlaNet, fatta di 128 milioni di immagini prese dal web; per una parte di esse, 37 milioni, è stata impostata manualmente la localizzazione sulla mappa, mentre le restanti (91 milioni di immagini) sono state usate come test. PlaNet in sostanza funziona secondo calcoli probabilistici. Quando riceve un’immagine, calcola il valore di possibilità per ogni quadratino e infine decreta quale sia la zona più probabile.
Come se avesse fatto milioni di viaggi. PlaNet è stato creato da Tobias Weyand, computer vision specialist presso Google, insieme ad alcuni colleghi. Ha spiegato perché funziona così bene: «PlaNet ha un vantaggio sugli esseri umani, perché ha potuto visitare molti più posti di quanto qualsiasi essere umano potrà mai fare, imparando così a distinguere anche dettagli minuti di scene differenti, che sono molto difficili da notare invece anche per un essere umano che abbia viaggiato molto».