Kan du ikke prøve at aflæse response-headeren i det resultat du få tilbage, for at se om der evt. skulle være en indikation af hvilken encoding resultatet er?
Der kunne jo også være noget i vejen med den encoding du bruger til at præsentere data, dvs. hvis din side er encoded som Windows-1252 og dit resultat fra eb.dk er encoded i UTF-8, så vil der opstå sære tegn - det skal helst passe sammen... :)
Hvordan bruger du det resultat du henter? Jeg tænker på hvordan præsenterer du data og dermed konstaterer at der er noget galt med encoding... Hvis det er på en webside, kan du så evt. linke til denne side?
Du skal holde samme tegnsæt (og utf-8 det, der bør bruges i dag) gennem _hele_ kæden:
*) Din databases kollationer skal være utf-8. *) Din server skal sende dokumenterne som utf-8 (eller du må manuelt sætte en korrekt http-header) *) Du skal bruge en utf-8 meta *) Du skal gemme dokumenterne med korrekt encoding
- men hvorfor kontakter du ikke bare EkstraBladet og spørger, om de vil levere et feed med resultater. Dem, du henter ved screenscraping, må du jo alligevel ikke bruge til noget ;o)
Du har jo i øvrigt det problem, at bold.dk og eb.dk kører iso-8859-1 - som er temmelig outdated. Det er ikke så smart, hvis dit eget setup er mere tidsvarende (= bruger utf-8). Så _skal_ der komme konflikter :o|
Det kommer anpå, hvad du vil. Både eb.dk og bold.dk bruger begge iso-8859-1. Så kunne du selvfølgelig vælge at gøre det samme, men det giver let problemer, da utf-8 er ved at være international standard. Derfor kan iso-8859-1 løse dit problem ligenu - men det kan let give problemer på længere sigt. Hvis du på et tidspunkt vil kommunikere med resten af verden - eller med danskere, som gerne vil (og derfor bruger utf-8) - så vil du få tilsvarende problemer.
I PHP findes native funktioner til at 'oversætte' frem og tilbage mellem ANSI (iso-8859-1) og Unicode (utf-8), men det findes mig bekendt ikke i VBScript. Var det mig, ville jeg nok bruge utf-8 og gøre, som jeg skrev i kommentaren (01/04-2008 16:34:34) - samt på én eller anden måde strikke en funktion sammen, der kan 'oversætte' fra iso til utf ... eller måske finde en færdig på nettet :)
Har blot et webhotel så kan ikke ændre så meget på server opsætningen.
Jeg kunne leve med bare at skulle lave et find and replace kald, men det virker heller ikke. Det er som om at ? ikke bliver set som ?, men det er måske også pga. encoding?
Virker ikke: Replace(DataString, "FC K?avn", "FC Købenavn", 1, -1, 0)
Kan man her gøre noget?
Synes godt om
Ny brugerNybegynder
Din løsning...
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.