Parse html-fil ved hjælp af PHP DOM
I forbindelse med at skulle lave en ny hjemmeside til en bekendt har jeg noget frygteligt dårligt WYSIWYG HTML som jeg skal have hentet nogle strenge ud af så de kan blive puttet i en database til den nye side. Det drejer sig om billed URL'en/fil navnet i første TD i koden herunder og teksten i den anden sidste TD (i eksemplet herunder "ST*-91").Er der en der kan give mig en hånd? Der er et pænt stykke over 1000 styk af nedenstående TD'er der skal hentes ud fra -fordelt på en masse html filer- så det ville være en stor hjælp at kunne gøre det en smule automatisk. Det er kun selve PHP DOM delen jeg er ude efter hjælp til (der skal også være lidt arbejde til mig selv jo...)
<TR>
<TD vAlign=top align=left>
<IMG src="/015.JPG-for-web-normal-1349797983.jpg">
</TD>
<TD vAlign=top align=left>
<P> </P>
<P> </P>
<P> Stanwell 51</P>
<P> </P>
<P> Flame Grain</P>
<P> </P>
<P> Made in Denmark</P>
<P> </P>
<P> L: 14,8 cm</P>
<P> </P>
<P> W: 38 g</P>
<P> </P>
<P> As new</P>
</TD>
<TD vAlign=top align=left>
ST*-91
</TD>
<TD vAlign=top align=left>
41
</TD>
</TR>
En komplet html kan ses her: http://tweaks.dk/parsertest.html (kildekoden er dog ikke for sarte sjæle) (;
