Avatar billede andersb Nybegynder
17. december 1999 - 16:10 Der er 1 kommentar og
1 løsning

HTML-parser søges

Jeg er ved at lave en web cravler, dvs. et program der "kravler" rundt på web og finder web-sider og gemmer sidernes meta-information til senere opslag. Jeg laver det for sjov, men måske kan jeg senere "berige" mine studerende med denne opgave.

Jeg savner en HTML-parser, dvs. en klasse / metode, der kan parse HTML-kode og finde referencer til andre sider <a href="...">.

Jeg har kigget på javax.swing.text.html.parser http://java.sun.com/products/jdk/1.2/docs/api/javax/swing/text/html/parser/package-summary.html men dokumentationen er meget sparsom, og jeg har ikke fundet nogen eksempler på anvendelse.

Kan I henvise til bedre dokumentation eller eksempler på parsing af HTML-filer.
- Anders
Avatar billede njha Nybegynder
10. marts 2000 - 13:23 #1
Hej
Du kan finde en html-parser udviklet under GNU her: http://www.quiotix.com/downloads/html-parser

Niels J.


Avatar billede andersb Nybegynder
17. marts 2000 - 14:39 #2
Tak for svaret
- og undskyld jeg var så længe om at acceptere svaret.
- Anders
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester