23. april 2010 - 11:36Der er
11 kommentarer og 1 løsning
Encode decode problem
Hej
Jeg har fået en sql fil fra et gammel forum som vi er ved at konvertere til phpbb.
I den forbindelse har jeg lavet et lille C# program som læser den sql fil, deler den op i tråde og poste, og derefter genererer sqlfiler som jeg kan smide i den nye database, så den vil have de gamle tråde med der.
Mit problem er, at denne tekst i den oprindelige sql fil "Hermed tråd til brug for diskussionen om, hvorvidt vi skal indgå samarbejde med ZYX.\r\n\r\nNår I har læst det udleverede materiale igennem, byder I bare ind hér med jeres holdning og kommentarer."
Bliver til dette efter at have været igennem mit program "Hermed tr�d til brug for diskussionen om, hvorvidt vi skal indg� samarbejde med XYZ.\r\n\r\nN�r I har l�st det udleverede materiale igennem, byder I bare ind h�r med jeres holdning og kommentarer."
Som i kan se, så bliver alle æ ø og å, og sikkert også andre special karakterer lavet om til Nï¿
Nogen der har et godt råd til hvordan koden til at læse den oprindelige sql fil skal se ud, så det bliver korrekt?
"Hermed tr�d til brug for diskussionen om, hvorvidt vi skal indg� samarbejde med XYZ.\r\n\r\nN�r I har l�st det udleverede materiale igennem, byder I bare ind h�r med jeres holdning og kommentarer."
Kan det være når jeg gemmer det går galt? Jeg gemmer bare som standard.
public static void WriteFile(string filename, string text) { TextWriter tw = new StreamWriter(filename); tw.WriteLine(text); tw.Close(); }
Jeg siger mange tak for din tålmodighed, men nu får jeg bare dette som output.
"Hermed tr�d til brug for diskussionen om, hvorvidt vi skal indg� samarbejde med XYZ.\r\n\r\nN�r I har l�st det udleverede materiale igennem, byder I bare ind h�r med jeres holdning og kommentarer."
Hov.. Det er ikke � som der står ovenover, men derimod en lille firkant med spørgsmålstegn inde i, som nu står der hvor der skulle stå æ, ø eller å
Jeg får sommetider noget i UTF-16 som vistnok kommer fra SQL Server Management Studio.
Hvis jeg lige må vende tilbage til #2: "Hvad for et tegnsæt jeg skal bruge? øhh.... det er underordnet" - det er faktisk et ret vigtigt valg. Groft sagt kan man altid vælge UTF-8, i nogle tilfælde kan man "nøjes" med ISO-8859-1 - men det er en længere historie.
Hvordan er det nu man siger: Ingen er blevet fyret for at vælge UTF-9. :D
Og det "9" tal skal vist være "8" - ellers må jeg igang med at opfinde en ny standard.
Synes godt om
Ny brugerNybegynder
Din løsning...
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.