Artikel top billede

Sådan rangordner Google verdens nyhedsartikler

Google har for tredje gang siden 2003 indsendt en patentansøgning, der skal raffinere selskabets algoritme til rangordning af nyhedsartikler. Se nogle af de nye parametre her.

Computerworld News Service: En patentansøgning, indsendt af Google sidste år, giver et detaljeret indblik i nogle af de parametre, selskabet vægter i rangordningen af nyhedshistorier, der afgør, i hvilken rækkefølge de vises på Google News.

Patentansøgningen, der blev indsendt i februar 2012 og offentliggjort fem måneder senere, er en videreudvikling af et patent, Google fik tildelt i 2009 med titlen Systems and Methods for Improving the Ranking of News Articles.

Computerworlds amerikanske søstermedie faldt over dokumentet ved søgning på den amerikanske patentstyrelses website i anden sammenhæng.

En talsmand fra Google har ingen kommentarer til detaljerne i patentansøgningen.

"Vi indsender patentansøgninger om mange forskellige ideer, vores medarbejdere får," kommenterer han via e-mail.

Modnes til faktiske produkter

"Nogle af de ideer modnes senere til faktiske produkter, mens andre ikke gør. Man kan ikke nødvendigvis udlede fremtidige produktlanceringer fra vores patentansøgninger."

Patentansøgningen fra sidste år giver dog et indblik i en række forskellige parametre, som selskabet bruger til at rangordne nyhedshistorier på nettet.

Hvordan Google bedømmer og behandler nyhedshistorier har været kritiseret af forskellige medievirksomheder, som for eksempel har hævdet, at selskabet krænker deres ophavsrettigheder.

Mange har også påtalt, at Google i praksis kan åbne eller lukke for en strøm af besøgende til nyhedswebsites, alt efter hvordan deres nyhedshistorier rangordnes.

Google rangordning påvirker, hvilke nyhedshistorier folk bliver præsenteret for, hvilket potentielt er med til at forme deres opfattelse af begivenhederne.

Siden lanceringen i 2002 er Google News blevet en af de største aggregatorer af nyhedshistorier på nettet.

Websitet, hvis indhold sammensættes helt automatisk, indsamler og viser overskrifter fra tusindvis af nyhedskilder fra hele verden.

Her er parametrene

I patentansøgningen beskrives parametre såsom antallet af nyhedsartikler produceret af en nyhedskilde i en given periode, den gennemsnitlige længde af en artikel fra en nyhedskilde og hvor vigtig dækningen fra en nyhedskilde er.

Af andre parametre nævnes en vurdering af nyhedskilders aktualitet samt faktorer som brugsmønstre, menneskelige holdninger, oplagsstatistik og antallet af medarbejdere hos en given nyhedskilde.

Desuden tages der højde for, hvor mange nyhedsbureauer en given nyhedskilde er associeret med, andelen af originale nyhedsartikler i nyhedskildens samlede mængde af nyhedsartikler, nyhedskildens bredde i sin generelle dækning, mængden og diversiteten af international trafik til nyhedskildens website og endda nyhedskildens skrivestil.

Ligner redaktørernes parametre

Patentansøgningen giver således et indblik i, hvordan selskaber som Google rangordner indhold på nettet, kommenterer Sree Sreenivasan, der underviser i faglig praksis ved Columbia Universitys Journalism School. Han er desuden universitets første chief digital officer.

"I den teknologiske verden er mange ting uigennemskuelige. Det er rart at få lidt klarhed om det her," siger Sreenivasan.

Han bemærker, at nogle af de parametre, Google tilsyneladende anvender til at bedømme kvaliteten af en nyhedskilde, er meget lig de parametre, redaktører selv bruger til at bedømme nyhedskilders troværdighed.

Her fremhæver han parametre såsom medarbejderantal og målgruppens mangfoldighed.

Også Googles anvendelse af nyhedshistoriers længde er et godt parameter, vurderer Sreenivasan.

Ved første øjekast ser det ud som om, Google lægger vægt på kvantitet fremfor kvalitet, siger han.

Men i dag er det sådan, at mange medievirksomheder, der producerer indhold af høj kvalitet, producerer mere, end de gjorde tidligere.

Derfor kan det forsvares at bruge nyhedshistoriers længde og antal ord som parameter, forklarer han.

"Det afspejler virkeligheden i journalistikken i dag," siger Sreenivasan.

Google: Sådan udvælger vi artiklerne

I en artikel fra The Atlantic fra sidste september udtalte chefer fra Google News, at websitet "algoritmisk" indsamler nyhedshistorier fra flere end 50.000 nyhedskilder og har flere end en milliard unikke brugere hver uge.

Kritikken fra mange især i den europæiske mediebranche lyder, at Google snylter læsere og annoncekroner ved hjælp af Google News.

Men kun få har indtil videre blokeret for, at deres indhold kan vises på Googles website, selvom Google tilbyder en ret nem måde at gøre det.

Google selv giver ikke mange oplysninger om de algoritmer, der bruges til at opdage og rangordne nyhedshistorier.

Sådan udvælges artikler

Selskabet oplyser blot, at nyhedsartikler udvælges og rangordnes på baggrund af parametre såsom hvor mange og på hvilke websites, de vises; indholdets aktualitet; geografisk område; relevans og diversitet.

Google har tidligere udtalt, at selskabet konstant justerer i sin rangordning af nyheder, for at sikre at der vises indhold af høj kvalitet.

Patentansøgningen ser ud til at være det seneste tiltag i denne raffineringsproces og giver et sjældent indblik i nogle af vigtigste parametre, som Google vægter:

Historiestørrelsen bedømmes

- For at afgøre kvaliteten af en nyhedskilde kan Google enten se på antallet af producerede originale ("ikke-genbrugte") nyhedsartikler eller ligefrem tælle antallet af originale sætninger produceret af en given nyhedskilde.

- For at afgøre hvor væsentlig en given dækning er, bedømmer Google en "historiestørrelse" for alle originale nyhedsartikler produceret af en medievirksomhed i løbet af en uge, en måned eller en længere periode. "For eksempel ... hvis D er en artikel om ulykken med rumfærgen Columbia og der var 500 andre separate artikler om emnet, så ville historiestørrelsen være 500."

- For at beregne en "breaking news-karakter" for en given medievirksomhed kan Google "måle nyhedskildens evne til at udgive en historie hurtigt efter en vigtig begivenhed har fundet sted."

- For at vurdere en nyhedskildes evne til at producere originalt indhold af høj kvalitet benyttes antallet af personer, der nævnes i nyhedshistorierne med særlig vægt på personer, der ikke i udbredt grad citeres andre steder. "Dette kan indikere, at nyhedskilden er i stand til at producere original journalistik."

Google holder også øje med links fra søgemaskiner til individuelle nyhedsartikler. "Velkendte websites såsom CNN foretrækkes ofte fremfor mindre populære websites med for eksempel ukendte lokalnyheder, som brugerne kan tænkes at gå uden om," står der i patentansøgningen.

Oversat af Thomas Bøndergaard




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
EG Danmark A/S
Udvikling, salg, implementering og support af software og it-løsninger til ERP, CRM, BA, BI, e-handel og portaler. Infrastrukturløsninger og hardware. Fokus på brancheløsninger.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere