transformer xml/html til plain text
HejJeg har en xml fil, hvori der er en node, der indeholder data i form af tekst og html-tags. Jeg skal have dette transformeret over til plain text, så det kan sendes ud på mail(det skal kunne forståes af alle uanset opsætning af mailklient - derfor plain text).
XML ser således ud
<Content>
- <span class="norm">
gh gfh gfh gfh gfh gfh gfh gfh gh grwefds gf f g
<br />
<strong>
<br />
bgfhghgh
</strong>
<br />
<br />
<ul>
<li>Hospitaler</li>
<li>trytrytyty</li>
<li>f fg f g dfsdfdfli>
<li> f gf gf gd</li>
<li>fg dfg f gf fd f </li>
<li> gfgf f fdg li>
<li>dvfd ffg </li>
</ul>
</span>
<ul>
<li />
</ul>
</Content>
der skal ske en transformation, således at nogle af formatteringerne bevares i plain text, f.eks mellemrum. Resten fjernes, dvs man skal ind og replace visse html tags og så fjerne resten. XML-dokumentet har altid en rodnode, der hedder Content, men al teksten og html'en inde i den er vilkårlig fra gang til gang, man sender ud(det sker via CMS).
Det skal gøres ved hjælp af xslt. Jeg har kopieret al indholdet fra noden ind i en xslt:variable er derefter forsøgt at replace ved hjælp af substring-before og substring-after. Den ser blot bort fra alle html-tags, som den vel opfatter som xml.
Men hvordan griber jeg det så an?