Google er kommet målet om at gøre al information i verden tilgængelig et lille men vigtigt skridt nærmere.
Søgemaskinen har nemlig fået sin billedgenkendelse forbedret. Det betyder, at Google nu kan genkende ord i billeder. For eksempel vil skannede dokumenter, der bliver lagret som billedfiler, nu optræde langt hyppigere i søgeresultaterne. Det samme gælder pdf-filer.
»Tidligere var skannede dokumenter kun sjældent med i søgeresultaterne,« skriver Evin Levey, der er Google Product Manager i sin blog.
»Ind i mellem var der spor i dokumentet, som vi kunne gå efter. For eksempel i dokumentets navn, men nu kan vi søge direkte i alle pdf-filer. Optical Character Recognition ændrer billeder til ord som kan blive indekseret og søgt i,« skriver han.
Den nye teknik kan få stor betydning for blandt andet undersøgende journalistik og forskning, da især offentlige myndigheder og forskere har en tendens til at skanne dokumenter.