Avatar billede vange_inet Nybegynder
15. august 2000 - 15:53 Der er 8 kommentarer

XML og Word

Er det muligt at tilgå Word-dokumenter programmatisk vha XML? Jeg har læst noget om, at Word2000 dokumenter er XML-dokumenter.
Avatar billede lbhansen Nybegynder
23. august 2000 - 09:37 #1
Der er en del programmer der kan lave konverteringen, men jeg har dog ikke stødt på nogle nemme løsninger til problemet
Avatar billede janegil Nybegynder
11. september 2000 - 09:56 #2
Det ville være for godt til å være sant?

Det ville åpne for at folk som ikke har Word, kunne redigere i Word-dokumenter. Det ville også åpne for at 3.partsprogrammer konne utføre begrensa spesialfunksjoner i dokumentene, bedre enn Word selv kan. Den slags ville ikke ligne Bills forretningsstrategi. Det er 4 år siden færøyske ordlista ble innlevert, fortsatt finnes det ingen færøysk stavekontroll til Word. Hvis Word er XML, kan vi lett lage den selv.

Du kan prøve: Døp et word2000-dokument om til xxx.xml og legg det på en webserver. Om du så åpner det i IE5.5, ser du om det er et gyldig XML-dokumnet eller ikke. Du skulle også kunne se det med Notepad: et XML-dokument starter med noe som
<?xml version=\"1.0\"?>
Avatar billede davsclaus Nybegynder
27. september 2000 - 22:04 #3
Jeg mener at MS for flere år siden gemte deres Word dokumenter i et format de kaldt Compound et eller andet. Det var nemlig sådan at dokumentet er et træstruktur ala XML hvor der kan være forskellige typer af objekter i.

Det mener om DOM objekter som er en træ container til XML. Det er i dette format at man regner med at computerne internt arbejdet med dokumenterne, og udadtil kan dettet DOM træ så skrives som et XML dokument og læses ind som et DOM træ igen.

Men at forvente at dine Word dokumenter bliver gemt som 100% xml i rent læsebart format, det tror jeg dog ikke på, da du så blot ville kunne se det ved at åbne dine word dokumenter i en text editor.

Så svar på dit spørgsmål. Ja du kan tilgå dine Word dokumenter, da det ligger i et MS format Compound et eller andet. Der er bla. komponenter til Delphi5 så du kan styre Word, og derved faktisk også styre dokumenterne.
Avatar billede janegil Nybegynder
12. oktober 2000 - 17:01 #4
Men Staroffice?

Sitat fra
http://www.sun.com/software/white-papers/wp-staroffice/

«XML (coming soon as a native file format)»

Det bør da bety at planen er at alle Starofficedokumenter skal lagres som XML? Altså at den skal bruke XML i stedet for det nåværende \'native\' format?
Avatar billede janegil Nybegynder
13. november 2000 - 10:41 #5
Eureka! Jeg ser at \'Save as HTML\' i Word 2000 gjemmer dokumentet i HTML-kode som bruker XML-namespace, og prefikser mange av elementene, fx. <o:p>.

Det er sikkert forklaringen på at du har hørt om w2000 og XML.

Men koden er ikke gyldig XML. Det skriver <br> uten å matche den med </br>, og den setter ikke gåsøyne rundt attributtverdier.

Du kan prøve selv: Gjem et dokument som HTML fra W2000, omdøp det til .xml, og åpne det i Internet Explorer. Jeg er temmelig sikker på at du vil få en XML-feilmelding.

Så W2000-dokumenter ER ikke XML, de kan GJEMMES som XML. Men det er som ugyldig XML, så det er ikke så veldig nyttig. (Faktisk er det også ugyldig HTML...)
Avatar billede grabit Nybegynder
13. november 2000 - 21:57 #6
Nu ved jeg ikke rigtigt hvad du skal bruge det til men der findes et program på www.7step.com som man kan downloade og benytte gratis. Det er muligt at paste fra word og HTMLconfig gemmer i XML format. Desuden kan HTMLconfig gemme til HTML og Flash.txt fil.
Jan Mikael
Avatar billede janegil Nybegynder
14. november 2000 - 09:50 #7
http://www.infinity-loop.de/en/products.html har et produkt som kan konvertere Word-genererte RTF-filer til XML. Det blir vel nødvendigvis en XML som gjengir den typografiske strukturen i Word-dokumentet, ikke den logiske?

HTML Transit fra http://www.infoaccess.com/Products/HTML%20Transit/default.htm er god til å generere HTML, eventuelt også basert på typografier som jo (helst?) avspeiler dokumentets logiske struktur. Tror nok den kan generere XML også. Men den er blitt ufyselig dyr etterhvert.

Det verktøyet jeg ikke har funnet, er ett som kan konvertere XML til Word. (Det måtte vel så være XML basert på en DTD som er skreddersydd for konvertering til Word?)
Avatar billede kedde65 Praktikant
29. maj 2001 - 10:40 #8
Det er rigtigt at hvis du gemmer dit word dokument som html, så vil du se at det bliver næsten til xml.
Det er dog som tidligere nævnt ikke fuldstændigt gyldigt xml.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester