Artikel top billede

(Foto: Solen Feyissa/Unsplash)

2.500 siders lækkede dokumenter afslører, hvordan Googles søgemaskine fungerer

Et datalæk af flere tusinde siders interne dokumenter fra Google kaster lys over, hvordan selskabets sagnomspundne søgealgoritme fungerer.

Mere end 2.500 siders lækkede dokumenter, som påstås at være interne Google-dokumenter, der giver et sjældent indblik i selskabets søgealgoritme, er blevet lækket.

Det er denne søgealgoritme, der bestemmer, hvilke sider, der bliver set, og hvilket indhold, der dominerer internettet.

Mange har igennem tiden forsøgt at løse mysteriet om, hvordan søgealgoritmen fungerer. Og nu giver disse dokumenter altså et vink med en vognstang om, hvordan det hele går til.

Og ifølge de lækkede dokumenter, så har Google ikke været ærlige om deres praksis i årevis.

Det skriver The Verge.

Et kig ind i Googles 'blackbox'

Sagen tager sin begyndelse en søndag. Det er 5. maj, og Rand Fishkin, der har arbejdet med SEO i mere end årti, modtager en mail fra en person.

Personen påstår, at vedkommende har adgang til et massivt læk bestående af Googles søge-API, skriver Rand Fishkin på sin virksomheds blog.

Personen påstår også, at de lækkede dokumenter er blevet autentificeret af tidligere Google-ansatte, og at disse tidligere Google-ansatte har delt yderligere oplysninger omkring måden, hvorpå Google opererer sine søgninger.

Ifølge Rand Fishkin håbede kilden, som delte de 2.500 sider med dokumenter med ham, at modbevise de "løgne", som Google-medarbejdere angiveligt har delt om, hvordan søgealgoritmen fungerer og giver et overblik over 14.000 påståede nøglefeatures, når det kommer til rangering af søgeresultater.

Detaljerne, som Fishkin har delt, er komplekse og tekniske, er sandsynligvis mere forståelige for udviklere og SEO-eksperter end for den almindelige bruger.

Indholdet af lækket beviser ikke nødvendigvis, at Google bruger de nævnte data og signaler til rangering.

Snarere viser lækket, hvilke data Google indsamler fra websider, hjemmesider og brugere, og giver indirekte hints til SEO-eksperter om, hvad Google synes at vægte, som SEO-ekspert Mike King skriver i sin oversigt over dokumenterne.

Modstridende oplysninger

De lækkede dokumenter berører emner, som hvilken slags data Google indsamler og bruger, hvilke sider Google fremhæver i følsomme emner som valg, hvordan Google håndterer små hjemmesider og meget mere.

Nogle af oplysningerne i dokumenterne ser ud til at være i modstrid med offentlige udtalelser fra Google-repræsentanter, lyder det blandt andet fra Fishkin.

Mike King, som er en anden SEO-ekspert, der har set på dokumenterne, siger, at ordet "løgn" er hårdt, men at det er det eneste præcise ord at bruge i denne sammenhæng.

"Selvom jeg ikke nødvendigvis bebrejder Googles offentlige repræsentanter for at beskytte deres hemmelige informationer, har jeg et problem med deres indsats for aktivt at miskreditere folk i marketing-, teknologi- og journalistikverdenen, som har præsenteret opdagelser, der kan gentages og bevises," lyder det videre i Mike Kings kommentar til de lækkede dokumenter.

Google har ikke svaret på The Verges anmodninger om kommentarer vedrørende dokumenterne, herunder en direkte anmodning om at afvise deres ægthed.

Søgealgoritmen og SEO

Googles hemmelighedsfulde søgealgoritme har skabt en industri af marketingfolk, der følger Googles retningslinjer nøje og anvender dem for millioner af virksomheder.

Men de lækkede dokumenter rejser tvivl om Googles offentlige udtalelser om, hvordan søgning fungerer.

De lækkede dokumenter får SEO-eksperterne Rand Fishkin og Mike King til at spørge, om Google Chrome-data bruges i rangeringer.

Google-repræsentanter har gentagne gange sagt, at de ikke bruger Chrome-data til rangering, men i flere afsnit i de lækkede dokumenter bliver Chrome specifikt nævnt i forhold til, hvordan websites vises i søgninger.

Mike King beskriver også, hvordan Google indsamler forfatterdata fra sider og har et felt for, om en enhed på siden er forfatteren.

I en del af dokumenterne, som Mike King har delt, lyder det, at feltet "hovedsageligt er udviklet og justeret til nyhedsartikler... men også udfyldes for andet indhold (for eksempel videnskabelige artikler)."

Dette bekræfter ikke, at forfatterbylines er en eksplicit rangeringsmetrik, men viser, at Google holder øje med denne attribut, lyder det.

Google har ellers tidligere insisteret på, at forfatterbylines er til for læsernes skyld, ikke for Google, da det ikke påvirker rangeringen.

Ud over de lækkede dokumenter har den amerikanske regerings antitrust-sag mod Google har også afsløret interne dokumenter, hvilket giver yderligere indsigt i, hvordan Googles hovedprodukt fungerer.

Google advarer

Google selv har bekræftet lækket af dokumenter og advarer mod at drage konklusioner på baggrund af oplysningerne.

"Vi vil advare mod at komme med unøjagtige antagelser om søgning baseret på out-of-context, forældede eller ufuldstændige oplysninger," sagde Google-talsmand Davis Thompson til The Verge i en e-mail og fortsætter:

"Vi har delt omfattende information om, hvordan Search fungerer, og de typer faktorer, som vores systemer vægter, samtidig med at vi arbejder på at beskytte integriteten af ​​vores resultater mod manipulation."