Notifikationer

Markér alle som læst Log ud

olinuxo Nybegynder

11. maj 2014 - 20:56 Der er 3 kommentarer

Hjælp til preg_match_all

Hej,

jeg ønsker at finde alle URL i en tekst, ved brug af file_get_contents.

Jeg har pt. denne preg_match_all:

preg_match_all ('/(http|https)\:\/\/[a-zA-Z0-9\-\.]\.[a-zA-Z]{2,3}(\/\S*)?/', $url, &$matches);

Jeg mangler dog, hvis indholdets "a href" kun indeholder undersider (eksempel "/index.php" og ikke "domæne.dk/index.php"). Kan man på nogen måde få flettet ind, at den ligeledes finder det der står i href samtidigt alle andre domæner, som evt. blot står skrevet i sidens tekst-indhold?

Synes godt om

jakobdo Ekspert

11. maj 2014 - 21:27 #1

Jeg ville nok gøre det på følgende måde...

Din preg_match_all du har der, vil finde alle "fulde" url'er på siden.

Dem smider du ind i et array eller lign.

Herefter laver du en preg_match_all der finder alle href="...." og så må du "smage" på om der er tale om fuld url eller ej.
Starter den ikke med http / ftp eller lign, så kan du smide den "url" du crawler ind og herefter smide den "fulde-url" ind i dit array fra før.

Så kan du lave en unique på det array og du har alle urls.

Synes godt om

olinuxo Nybegynder

13. maj 2014 - 21:38 #2

Arrhh.. den var for nem - den lå jo lige til højrebenet. Tak Jakob..

Kvitter da lige med et svar, tak.. :-)

Synes godt om

jakobdo Ekspert

13. maj 2014 - 22:16 #3

Svar!

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Webudvikling kurser

Vi tilbyder markedets bedste kurser inden for webudvikling

Se alle Webudvikling kurser

Flere spørgsmål fra PHP kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Bruge PHP til at hente hjemmeside med fsockopen Af Strawberry i PHP	18	29/01/202613:08	02/02/202610:29
Hjemmeside der virker både på mobil og computer Af Strawberry i PHP	6	25/01/202620:06	30/01/202618:53
Hvordan får jeg reCAPTCHA på min hjemmeside? Af Strawberry i PHP	1	20/01/202621:11	23/01/202618:04
MS Graph vis kalenderaftaler Af dane022 i PHP	0	06/11/202508:43	-
Hente data fra DEVICE via websocket Af nemlig i PHP	6	25/06/202512:37	25/06/202519:17

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS