Notifikationer

Markér alle som læst Log ud

sushiboy Nybegynder

03. maj 2006 - 15:38 Der er 1 kommentar

Parsing af bestemte dele af en HTML-side.

Hej med jer.

Jeg er påbegyndt at lære om Perl og hvorledes man parser dele af en HTML-fil. Specifikt omhandler det én af mine gamle sider (http://home.tiscali.dk/taiwan/myworld.html), hvor jeg ønsker at smide linksene (<a href="www.link.com">), samt den associerende tekst (.com">associerende tekst</a>) ind i to felter i en database, ergo skal de øvrige HTML-tags fjernes.

Jeg har fundet ud af at forbinde til MySQL med Perl, og eksperimenteret lidt med HTML::Parser, men er stadig i tvivl om hvordan man griber situationen an.

Jeg har bemærket at en så simpel kode som nedenstående returnerer dele af HTML-tags og den associerende tekst.

sub text {
my ($self, $text) = @_;
print "$text\n";
}

Det samme vil nedenstående kode gøre. Derfor undrer jeg mig over, hvordan man får fat på <a href="">, når ingen af de to returnerer den del af HTML-koden.

sub start {
my ($self, $start) = @_;
print "$start\n";
}

Desuden har jeg i et online-eksempel set at start kan modtage en hel del parametre:

my ($self, $tag, $attr, $attrseq, $origtext) = @_;

Er det via $tag som man kan bruge til at finde 'a href'? Eller sagt på en anden måde: Hvordan skal Perl-scriptet være opbygget for at jeg kan opnå mit mål?

Synes godt om

ranko Nybegynder

11. juni 2006 - 20:26 #1

Du kan også gøre det via HTML::Treebuilder hvis du har adgang til det modul.
extract_links (og eksemplet) findes beskrevet i HTML::Element dokumentationen

use HTML::TreeBuilder;
$root = HTML::TreeBuilder->new_from_content("some content...");
for (@{$root->extract_links('a') }) {
my($link, $element, $attr, $tag) = @$_;
print $link," ",$element->as_text(), "\n";
}

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Andet programmering kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
burgermenu til hjemmeside - hjælp! Af SabrinaL i Andet programmering	2	12/11/202514:10	02/12/202520:42
Hjælp til programmering af website Af hamdenlange i Andet programmering	16	17/08/202522:26	19/08/202515:53
Kan man registrere hvis folk lukker en side ned Af KurtG i Andet programmering	8	24/07/202513:06	28/07/202517:03
hta - powershell eller lign. Af tjodense i Andet programmering	2	28/04/202515:22	29/04/202512:00
Bat-fil / vbs til ændre af filnavn udfra mappe-navn Af tjodense i Andet programmering	3	10/04/202511:18	11/04/202513:49

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

12/12

Netværkstest: Denne ekstreme WiFi 7-router brillerer i test og er lige nu sat ned til kup-pris

12/12

Nordisk Google-chef: Her er vores største fordel over konkurrenterne

12/12

En ny ChatGPT er sluppet løs: Derfor er den så meget bedre

12/12

Nørgaard: Tving dem over i clouden, hæv prisen voldsomt… og, vent! Satans! EU har nogle regler! Øv!

12/12

Regeringen skrottede skattefradrag på software: Nu vil den lave reglerne om igen - med tilbagevirkende kraft

12/12

Fra finanssektoren til politiet: Her er 10 ledige ti-stillinger, som du kan søge nu

12/12

Krypto-iværksætter får 15 års fængsel for bedrageri: Snød kunderne for milliarder

12/12

Her er Danmarks dygtigste konsulenthuse 2025: Specialisterne dominerer

12/12

Portalen genåbnes: Stargate vender tilbage

12/12

Stress, sygemeldinger og “frygt for mentalt helbred” var hverdag i dansk it-kæmpe: Direktør stoppede for få uger siden

12/12

Netcompany udvider ledelsen med ny direktør og deler afdeling op i to

Vis flere artikler

IT-JOB

Geodatastyrelsen

IT-udvikler til driftsplatform for hydrografiske systemer

Statens IT

VMware-specialist til Statens It

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Softwareudviklere til Cyberdivisionens HR-systemer og Applikationer i Ballerup

Politiets Efterretningstjeneste

Teknisk IT-sikkerhedsspecialist - Beskyt Danmark med os i PET

Forsvaret

Projektleder til digitalisering af Forsvaret

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I dag 19:12	Sært problem med 5G netværk Af indicator72 i Wifi
I går 21:05	Klokkeslætsformat kort/langt Af ErikHg i Windows
I går 11:53	Fjernelse af irriterende pop up vindue Af ErikHg i Windows
I går 11:28	Sortering i mapper Af Malm i Windows
I går 10:42	Der opstod en fejl Af Wombat i Windows

White papers

IT i front: Sådan bliver netværk en strategisk driver
TDC Erhverv
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta
Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta
Udnyt Genesys Cloud CX optimalt og styrk kundeoplevelsen
Sabio

Flere white papers »