17. september 2009 - 12:45Der er
13 kommentarer og 1 løsning
Problemer med unicode tegnsæt på hjemmesider
Jeg har fået til opgave, at vedligeholde en hjemmeside, men som nybegynder er jeg løbet ind i et problem, som jeg hidtil ikke har kunnet løse. Jeg har downloaded hele hjemmesiden til en mappe i min PC (Windows XP) og arbejder nu med siderne for ændring og opdatering. Mit problem er, at æ,ø og å bliver vist som firkanter i teksterne. Det sker fordi tegnsættet er sat til unicode (neddæmpet grå farve). Det kan jeg dog let ændre ved at vælge Vesteuropæisk Windows eller ISO og så er problemet løst så længe jeg er på siden, men lige så snart jeg forlader siden er det straks galt igen når jeg vender tilbage. Det mærkelige er, at det kun er galt med fem af de seks sider hjemmesiden består af, den sjette side er ok. Selve hjemmesiden på nettet er der ingen problemer med. Kan nogen give mig en løsning på dette problem?
html entiteter vil selvfølgelig visuelt løse problemet - men det oprindelige problem vil stadig være til stede og man risikerer dermed fortsat problemer fremover.
Tak for forslaget, jeg er jo ikke så meget inde i tingene endnu, men har nu været inde på kilden og kan se, at der står "charset-unicode" på alle siderne. Efter din beskrivelse går jeg ud fra, at det er der problemet er. Jeg kan også sagtens ændre det til UTF-8, men ikke gemme det, så det bliver accepteret. Jeg har tydeligvis meget at lære endnu og må til at studere noget mere. Det mærkelige er bare, at på den originale hjemmeside står der charset windows-1252 på 3 af siderne og charset iso-8859-1 på de tre andre. Hvorfor blev det ændret ved at jeg downloaded siderne???
Til mcb2001 Det kan måske nok klares på denne måde, men jeg synes det virker lidt utilfredsstillende og vil prøve, at finde en bedre måde. Først skal jeg dog have lært noget mere, det er nok det der er galt.
filer bliver ikke ændret fordi du downloader dem - de bliver kun ændret hvis du gør noget ved dem og overskriver originalen. Som artiklen kort kommer ind på (og vi taler alm HTML) er de primære punkter du skal være opmærksom på altså meta content-type og hvordan filen er gemt (og det kan du se i fx notepad).
Jeg fik PC nedbrud for et års tid siden og har ikke været på denne side siden da. Nu da jeg set, at spørgsmålet stadig er åbent kan jeg fortælle, at jeg nu har fået lært, at åbne siderne i notepad og ændre charset koden i head til ISO-8859-1. Derefter er alle problemer løst.
Det er nok muligt, men det er den nemmeste måde at klare problemet i første omgang. At ISO-8859-1 er så godt som ubrugeligt forstår jeg ikke, da et meget stort antal af de sider der er på nettet i dag bruger det, incl. den side vi er på nu. Prøv lige at forklare, hvorfor det er så godt som ubrugeligt?
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.