Avatar billede tri Nybegynder
14. april 2003 - 14:02 Der er 5 kommentarer og
2 løsninger

HttpURLConnection: Find filer på et website?

Kan det vha. HttpURLConnection lade sig gøre at finde alle filer med en bestem endelse på et website?

F.eks. www.eksperten.dk/ <-- find alle .html filer
Avatar billede carstenknudsen Nybegynder
14. april 2003 - 14:08 #1
Nej, det kan det ikke.
Avatar billede tri Nybegynder
14. april 2003 - 14:10 #2
kan det lade sig gøre på andre måder i Java?
Avatar billede arne_v Ekspert
14. april 2003 - 14:11 #3
Ikke direkte. HttpURLConnection henter kun een URL.

Men du kan hente http://www.eksperten.dk/ og så parse den HTML for
alle links. Så henter du dem og parser den HTML for links etc..

Under forudsætning af at alle sider på siten kan nåes fra
start-siden så får du faktisk alle sider.

Det hedder crawling.

Og der findes en del eksisterende programmer der kan gøre det.

(jeg kender dog ikke nogen i Java)
Avatar billede backside Nybegynder
14. april 2003 - 14:12 #4
Du skal have server adgang for at kunne gøre det.
Ellers ville password beskyttede sider også miste en del af ideen.  ;)
Avatar billede arne_v Ekspert
14. april 2003 - 14:23 #6
(og det er natruligvis ikek noget problem at sortere URL'er fra baseret
på om det er .html eller noget andet)
Avatar billede tri Nybegynder
16. april 2003 - 18:45 #7
takker
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester