Er det mange elbiler i nabolaget ditt? Eller er det flest stasjonsvogner? Det sier mer om naboene dine enn du kanskje tror.

Big Data gjør det stadig enklere og billigere å hente ut og analysere informasjon om oss. Noen ganger skremmende enkelt. Det er en ny studie et godt eksempel på.

Bak studien står Stanford-forskeren Fei-Fei Li. Hun er ekspert på den revolusjonerende datateknologien dyp læring, en form for kunstig intelligens som blant annet står bak selvkjørende biler, talegjenkjenning og diagnoser av farlige svulster.

Det siste året har teknologien også blitt svært god til å lære opp seg selv i å gjenkjenne og kategorisere tredimensjonale objekter i todimensjonale bilder.

Li med kolleger har derfor klart å lage algoritmer som deretter har trent seg selv i å gjenkjenne bilmodellen og produksjonsåret til alle biler som er produsert siden 1990. Datasettet? Mer enn 50 millioner Google Street View bilder fra 200 amerikanske byer.

Det Li og kollegene fant, er en slående sammenheng mellom hvilke biler folk kjører og hva folk stemmer. Resultatet er oppsummert i en artikkel i tidsskriftet Proceedings of the National Academy of Sciences.

Foto: Google Street View fra et nabolag i San Francisco (Via Standford)

For eksempel: Dersom et nabolag har flere sedaner enn pickuper er det en 88 prosent sjanse at nabolaget stemmer på demokratene. Motsatt er det en 82 prosent sannsynlighet at området vil stemme på republikanerne.

Et annet eksempel: Algoritmene klarte å komme med presise estimater av utdanningsnivået til innbyggerne i byen Milwaukee i delstaten Wisconsin.

Algoritmen jobber også lynraskt. På bare to uker hadde den sortert alle bilene den fant i 2.657 kategorier etter produsent, modell og årstall. Til sammenligning ville en person brukt 15 år på den samme oppgave, dersom han eller hun sorterte seks bilder i minuttet, ifølge hjemmesidene til Stanford.

– Dette kan hjelpe oss med å forstå hvordan samfunnene våre fungerer, hvilke behov folk har og hvordan vi kan forbedre livene våre, sier Fei-Fei Li.