relative urls til absolutte
HejJeg forsøger at grabbe en htmlside på en anden webserver, men har lidt bøvl med links og billedreferencer mv.
Jeg skal konverter relative urls til absolutte urls, men programmører har en tendens til, at skrive den samme ting på 50 forskellige måder!!
Eks.
<A HREF="/test.html">test</A>
<A HREF='/test.html'>test</A>
<A HREF=/test.html>test</A>
<A HREF="test.html">test</A>
<A HREF='test.html'>test</A>
<A HREF=test.html>test</A>
Fik jeg dem alle med?
Og det samme med "IMG SRC"
Jeg vil gerne parse en helt html-dokument og konverter alle urls til
<A HREF=test.html>test</A> (eks. for href´s)
Er der nogle af jer der ligger inde med et stykke kode, der kan konverterer fra relative urls til absolutte?
Husk at i toppen af et html-dok kan linket være skrevet som <A HREF=test.html>test</A>, og lidt længere
nede, kan programmøren have valgt at skrive <A HREF="test.html">test</A> !!