Avatar billede CarlPutz Nybegynder
16. juni 2010 - 23:01 Der er 7 kommentarer

Copy/paste fra PDF til Word

Hej, jeg ville høre om der er nogen der har en ide til hvordan man copy/paster fra et indscannet PDF dokument til Word eller et andet tekstprogram og samtidig får det korrekte tegnsæt med (danske bogstaver). Når jeg gør det, får jeg nemlig erstattet æ,ø og å med andre mærkelige tegn, oftest med e og z.

Her er et eksempel på hvordan det ser ud efter jeg har pastet ind i Word:

Fra henfarne Dage os mangt et Frasagn led
om .Helte uden Mage, om svar Fortraed og Ned,
om Fryd og Bryllupsgilde, om Graad og Trzengselsfzrd,
om Strid blandt Kemper vilde, det skal I here her.

Hvorfor kan den ikke genkende danske bogstaver og hvad kan jeg gøre for et løse problemet. Jeg har også prøvet med andre programmer end Adobe, f.eks. Foxit og Nitro - samme problem.
Avatar billede Slettet bruger
17. juni 2010 - 00:53 #1
Har du prøvet med noget konvertering ?

som fx...
http://www.pdftoword.com/
Avatar billede Slettet bruger
17. juni 2010 - 00:56 #2
hmm skal vidst lige lære at huske hvad jeg læser.....

for det er jo lige som prøvet ;-)
Avatar billede CarlPutz Nybegynder
17. juni 2010 - 12:58 #3
Tak for svaret, men det hjalp ikke.

Kan man måske prøve at indsnævre problemet ved at bruge udelukkelsesmetoden? Det kan jo ikke være hverken Adobe eller Word, der er noget i vejen med, da disse programmer begge genkender danske bogstaver? Så må det jo være i selve kopieringsprocessen at problemet opstår, hvor jeg henter teksten over i udklipsholderen. Det vil sige at det er selve Windows Vista, der er noget i vejen med eller hvad? Men ville det give mening, for det er jo også dansk Vista jeg har?
Avatar billede ole_madsen Ekspert
17. juni 2010 - 13:17 #4
Det program du bruger til at scanne med, har givetvis indbygget et OCR scannerprogram (Ellers ville du slet ikke kunne kopiere). De billigste af disse er rettet mod det engelske marked, og forstår derfor ikke specialtegn som æøå.

Så du skal have undersøgt om dit Scanner-OCR program understøtter dansk, og hvis ikke må du finde et andet.
Avatar billede CarlPutz Nybegynder
17. juni 2010 - 14:10 #5
Ok, jeg har også engelsk udgave af Nitro, det må være derfor.

Men er der et scanner-program med udvidet OCR, som helt sikkert kan gøre det og genkende de danske tegn?
Avatar billede ole_madsen Ekspert
17. juni 2010 - 14:46 #6
Der findes masser... - jeg kender desværre kun med sikkerhed to - desværre fordi det er professionelle udgaver til betaling:

Omnipage: http://www.nuance.com/imaging/products/omnipage.asp
Abbyy Finereader: http://finereader.abbyy.com/

Men en hurtig søgning gav også f.eks. http://www.free-ocr.com/ hvis det blot er få dokumenter...
Avatar billede CarlPutz Nybegynder
17. juni 2010 - 15:22 #7
Ok, tak for det. Det sidste link så i hvert fald ud til at virke.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Computerworld tilbyder specialiserede kurser i database-management

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester