Jeg bruger dette regex til at hente oplysninger om en href i et html dokument: <a[\s]+[^>]*?href[\s]?=[\s\"\']+(.*?)[\"\']+.*?>([^<]+|.*?)?<\/a>
det fungerer ganske udemärket indtil at der ikke er anförselstegn omkring stien i a href tag'et, er der nogen der kan modificere det så det også äder href's uden anförselstegn?
Jeg testede dit bud, og den fandt href'en, men den returnerede: images/9.jpg><img Er det muligt at justere udtrykket, så den ikke tager ><img med i href'en så blir jeg rigtigt glad
Ahhh... så ser ud til at virke, bortset fra at href'en kommer til at indeholde " eller '. Dem skal man til at fjerne bagefter så? Hvad med (.*) til sidst? er det en fejl?
Ok, jeg medgiver at løsningen 15/08-2006 17:04:31 ser noget mere kompliceret ud end 15/08-2006 13:14:22. Faktisk ser 15/08-2006 13:14:22 også ud til at løse det konkrete problem. :^)
Imidlertid vil jeg vove at påstå at 15/08-2006 17:04:31 er mere generel, og at denne også kan bruges på andre attributter end kun en href.
Tja, desværre er det system jeg afprøver PHP på desværre nede lige i øjebliket, så jeg må ty til at lave det i C#. Men der får jeg altså ikke "- eller '-tegnene med i det matchede. Nu er det lidt svært (!) at argumentere imod hvad du ligefrem selv kan observere, men der er nu ingen som helst grund til at de skulle komme med.
Kan du ikke lige give nogle eksempler á la den form du gav dem på i 15/08-2006 16:27:48?
- kan håndtere et '-tegn rundt om href-værdien korrekt. For vi er vel enige om at [\"'] burde matche både " og '? Det går den ihvertfald i C# og det burde den altså også gøre i PHP.
Uanset, så er det det tætteste jeg kan komme på "den rigtige" løsning.
Der er mange indlæg og mange forbi'ere, men de to vigtigste er 15/08-2006 13:14:22 og 15/08-2006 21:21:36.
Du har ikke fortalt hvilket sprog du programmere i? Vi er af en eller anden grund gået ud fra PHP. Imidlertid er det en vigtig oplysning, for syntaksen og mulighederne variere faktisk med programmeringssproget.
"Eksperten.dk, nu også i Thailand!" Det må vist være Eksperten.th ;^)
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.