Avatar billede DKentoy Novice
21. maj 2023 - 20:21 Der er 6 kommentarer

Hjælp til at hente metadata fra hjemmeside.

Jeg er lidt af en n00b til det her, men jeg vil sætte pris på hvis nogen kunne hjælpe.
https://www.sas.dk/api/offers/flights?to=NYC&from=CPH&outDate=%2020230703&adt=1&chd=0&inf=0&yth=0&bookingFlow=points&pos=dk&channel=web&displayType=upsell

Kan nogen hjælpe mig med at hente data fra dette link så jeg kan søge efter de oplysninger jeg har brug for?
Hvordan er det muligt at kunne hente disse metadata?
Avatar billede valby Ekspert
21. maj 2023 - 21:09 #1
Du har vel fået denne meddelelse?
Pardon Our Interruption
Har du fjernet det de skrive er årsagen til dit problem?
Avatar billede DKentoy Novice
21. maj 2023 - 21:59 #2
Jeg er ikke bekendt hvordan jeg skal slippe af med det.

Jeg har ikke noget problem med at bare at copy og paste det i en browser. Så kan jeg sagtens se de data jeg skal bruge, men jeg vil jo gerne have det i en python kode.
Avatar billede valby Ekspert
21. maj 2023 - 23:22 #3
Du må nok have lidt tålmodighed, og vente på en som ved mere om det emne end jeg.
Avatar billede arne_v Ekspert
22. maj 2023 - 15:55 #4
Du installerer requests pakken og bruger requests.get med den URL og bruger den indbyggede json pakke til at parse resultat med.
Avatar billede DKentoy Novice
24. maj 2023 - 09:40 #5
Hej Arne.

Jeg har forsøgt mig nedenstående kode, men det har ikke lykkedes mig at hente det metadata. Hvis du har en ide til hvad jeg skal gøre hører jeg gerne fra dig.

import requests

url = 'https://www.sas.dk/api/offers/flights?to=NYC&from=CPH&outDate=20230617&adt=1&chd=0&inf=0&yth=0&bookingFlow=points&pos=dk&channel=web&displayType=upsell'

response = requests.head(url)

if response.status_code == 200:
    print("URL:", response.url)
    print("Content Type:", response.headers['Content-Type'])
    print("Content Length:", response.headers['Content-Length'])
    print("Last Modified:", response.headers['Last-Modified'])
else:
    print("Failed to retrieve metadata. Status code:", response.status_code)
Avatar billede arne_v Ekspert
24. maj 2023 - 19:42 #6
Jeg får kode 403 på den URL både med Python og med browser.

Der må være et problem med den URL.

Med en normal URL så virker python koden.

Bortset fra at mange sider ikke har en Content-Length header.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester