Avatar billede icecube Nybegynder
25. september 2012 - 13:24 Der er 9 kommentarer

Fjerne "kode" tegn fra text fil.

Hej.

Jeg har hevet en masse tekst ud af en gammel MS-dos spoolfil, men tilbage i dokumentet er stadig hvad jeg går ud fra er print codes - Er der nogen af jer kloge mennesker der ved om det er muligt at fjerne disse automatisk? Evt. encode filen i et format der ikke viser disse?

Dette screenshot burde illustrere hvad jeg mener:
http://i47.tinypic.com/25zjdwn.jpg

Åbnes filen i notepad++ ser tegnene således ud:
http://i45.tinypic.com/2nv8hoj.jpg

Det skal siges, at jeg selv har forsøgt mig med utallige timers google. Jeg er heller ikke helt 100 på at der nu er print-codes der figurerer i dokumentet, så hvis nogen kan kaste bedre lys over hvad de er, er i også meget velkomne :)

På forhånd tak.
Avatar billede scootergrisen Nybegynder
25. september 2012 - 13:40 #1
Du kan søge og erstatte hvert tegn.

I notepad++ kan du marker et tegn trykke CTRL+H også i replace with skal der ikke stå noget, også replace all.
Avatar billede icecube Nybegynder
25. september 2012 - 14:01 #2
Hej du - jo jeg har brugt erstat funktion i notepad++ flittigt, problemet ligger i, at jeg kan ikke søge efter disse tegn.. Kopierer jeg det ind i søgefeltet bliver det blot et "tomt" tegn. Dette gælder for tegnene "NUL" - tegnet "FF" er det muligt at søge og erstatte.

Jeg har på screenshottet her copy/pasted hele med tegn, men kun "FF" kommer med markeret som en firkant.

http://i48.tinypic.com/35m0f1x.jpg
Avatar billede supertekst Ekspert
25. september 2012 - 14:14 #3
Hvor ofte optræder de særlige tegn?
Avatar billede icecube Nybegynder
25. september 2012 - 15:01 #4
"FF" tegnet optræder i starten af hver side.

Linjen med "FF" og en masse "NUL" optræder hver 5 side.
Avatar billede finb Ekspert
25. september 2012 - 15:40 #5
I stedet for at udelade
kan du tillade,
hvis du kan lidt vba,
kan du nøjes med at tillade disse tegn:

(a,b,c...  og  A,B,C  og  1,2,3...)
og komma, punktum osv...

Mvh finb
Avatar billede scootergrisen Nybegynder
25. september 2012 - 15:51 #6
Jeg skrev heller ikke du skulle kopi paste man marker også tryk CTRL+H.

De tegn der ikke kan komme ind der kan du bruge search mode exteneded også skrive \xFF eller \x00 vil jeg gå ud fra.
Avatar billede jensenjs Juniormester
25. september 2012 - 16:38 #7
Kan du ikke åbne dem i word og gemme dem som us ASCII der har du muligheden for at filtrerer kontrol karakterene fra
Avatar billede jensenjs Juniormester
25. september 2012 - 16:48 #8
Jeg glemte lige at skrive, det er ASCII kode, de du ser er kontrol karaktererne, jeg har brugt det meget da jeg programmerede og skulle indsætte forskellige breaks og andet.
en liste over ASCII tabellen her
http://www.asciitable.com/
Avatar billede RogerWilco Seniormester
25. september 2012 - 19:42 #9
Der er ganske rigtigt styrekoder til en printer.

Med et lille script kan man ved gennemløb af filen checke, om der er FF (denne er nok ikke værdien FF, men formfeed-koden 0C) i en linje, og i så fald fjerne alle tegn indtil det første mellemrum.

Prøv at gemme teksten i kursiv i filen "spoolfilter.vbs". Du skal lige selv sætte navnet på filen ind i linjen med "rfn=" og resulatfilnavnet i linjen med "wfn=". Dobbeltklik på filen for at køre scriptet, og se så i resultatfilen, om det virker.

Dim fso,rf,rfn,wf,wfn,s

rfn="c:\spoolfil.txt"
wfn="c:\resultat.txt"

Set fso = CreateObject("Scripting.FileSystemObject")
Set rf = fso.OpenTextFile(rfn, 1)
Set wf = fso.OpenTextFile(wfn, 2, True)

Do While Not rf.AtEndOfStream
  s=rf.ReadLine
  If InStr(s,chr(12))>0 Then s=Mid(s,InStr(1,s," "))
  wf.WriteLine s
Loop

rf.Close
wf.Close
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester