Word generer en skod-kode, som kun for alvor forstås af andre dele af M$-suiten ...
-- det er (sidste gang, jeg konverterede et Word-genereret html-dokument til rigtig html !-) ca. 92% af den kode, som er genereret, som er overflødig eller noget vrøvl, men det forstås selvfølgelig glimrende af en browser, som er beregnet på at bruge 95% af sine kræfter (og sin kode !-) til at finde, rette og kompensere for fejl ...
Heldigvis er de fleste browsere indrettet til ikke at gøre noget ved ting, de ikke forstår, men xhtml kræver en meget formfuldendt kode, så et word-html-udgangspunkt er på forhånd dødsdømt !-)
Men kig engang på w3schools, der er en rimelig simpel gennemgang af den fornødne, når man har almindeliog html, som skal laves til xhtml ...
Jeg tror ikke på, at man for alvor kan lave en automatisk konvertering, men det kan godt være, at man kan komme langt med HtmlTidy:
http://www.w3.org/People/Raggett/tidy/