Notifikationer

Markér alle som læst Log ud

orthanc Nybegynder

14. august 2001 - 09:49 Der er 13 kommentarer og
1 løsning

Æ,ø og å i Java.

Jeg har efterhånden stødt på nogen iriterende problemer med Javas behandling af æ, ø og å. Hvis man f.eks skriver: System.out.println(\"Lærke\"); bliver det i en dos-prompt udskrevet som L?rke (?=my men jeg kunne ikke skrive my i indlægget).

I et andet tilfælde har jeg lagt navnet Lærke ind i en MySQL database [1, Lærke] via MySQL’s egen dos-baserede kommando promt.
Når det gennem JDBC (resultSet.getString(2);) hentes ud igen til den Dos-prompt hvor jeg kører javaprogammet, bliver det skrevet rigtigt nok. Hvis jeg derimod søger efter ’æ’ i den levereder streng med: streng.indexOf(\'æ\'); kan Java ikke finde bogstavet. Der ledes efter ’my’.

Er der nogen der har en ide til at komme ud af forviklingerne ?

Synes godt om

alexbp Nybegynder

14. august 2001 - 09:54 #1

Her er enn liste over de ESCAPE-koder man kan bruge i Java lagt ind i en klasse - prøv at bruge dem, det kan være du får success ad den vej ....

import java.applet.*;

public class UnescapeHtml extends Applet{
// <HTML>
// <TABLE><TR><TD>
// <APPLET CODE=UnescapeHtml.class WIDTH=400 HEIGHT=100>
// </APPLET>
// </HMTL>

public void init(){
add(new java.awt.Label
(unescapeHTML(\" © 2000 Réal Gagnon <real@rgagnon.com>\")));
}

public static final String unescapeHTML(String s){
String [][] escape =
{{ \"<\" , \"<\" } ,
{ \">\" , \">\" } ,
{ \"&\" , \"&\" } ,
{ \""\" , \"\\\"\" } ,
{ \"à\" , \"à\" } ,
{ \"À\" , \"À\" } ,
{ \"â\" , \"â\" } ,
{ \"ä\" , \"ä\" } ,
{ \"Ä\" , \"Ä\" } ,
{ \"Â\" , \"Â\" } ,
{ \"å\" , \"å\" } ,
{ \"Å\" , \"Å\" } ,
{ \"æ\" , \"æ\" } ,
{ \"Æ\" , \"Æ\" } ,
{ \"ç\" , \"ç\" } ,
{ \"Ç\" , \"Ç\" } ,
{ \"é\" , \"é\" } ,
{ \"É\" , \"É\" } ,
{ \"è\" , \"è\" } ,
{ \"È\" , \"È\" } ,
{ \"ê\" , \"ê\" } ,
{ \"Ê\" , \"Ê\" } ,
{ \"ë\" , \"ë\" } ,
{ \"Ë\" , \"Ë\" } ,
{ \"ï\" , \"ï\" } ,
{ \"Ï\" , \"Ï\" } ,
{ \"ô\" , \"ô\" } ,
{ \"Ô\" , \"Ô\" } ,
{ \"ö\" , \"ö\" } ,
{ \"Ö\" , \"Ö\" } ,
{ \"ø\" , \"ø\" } ,
{ \"Ø\" , \"Ø\" } ,
{ \"ß\" , \"ß\" } ,
{ \"ù\" , \"ù\" } ,
{ \"Ù\" , \"Ù\" } ,
{ \"û\" , \"û\" } ,
{ \"Û\" , \"Û\" } ,
{ \"ü\" , \"ü\" } ,
{ \"Ü\" , \"Ü\" } ,
{ \" \" , \" \" } ,
{ \"®\" , \"\\u00a9\" } ,
{ \"©\" , \"\\u00ae\" } ,
{ \"€\" , \"\\u20a0\" } };
int i, j, k, l ;

i = s.indexOf(\"&\");
if (i > -1) {
j = s.indexOf(\";\");
if (j > i) {
// ok this is not most optimized way to
// do it, a StringBuffer would be better,
// this is left as an exercise to the reader!
String temp = s.substring(i , j + 1);
// search in escape[][] if temp is there
k = 0;
while (k < escape.length) {
if (escape[k][0].equals(temp)) break;
else k++;
}
if (k < escape.length) {
s = s.substring(0 , i) + escape[k][1] + s.substring(j + 1);
return unescapeHTML(s); // recursive call
}
}
}
return s;
}
}

/Alexbp - alexbp@post.tele.dk

Synes godt om

cyberzed Nybegynder

14. august 2001 - 09:55 #2

I dit dos tilfælde kan det vel være et opsætningsmæssigt problem. MODE CON .......

Synes godt om

disky Nybegynder

14. august 2001 - 09:56 #3

Hvis jeg husker rigtigt, er det et problem med Command Prompten som ikke er glad for æøå.

Forresten er det en dumt ting at bruge kolonne nummeret til at hente fra et ResultSet, brug hellere kolonne navnet. For ellers fucker dit program totalt up, hvis der bliver lavet om på din tabel.

Synes godt om

disky Nybegynder

14. august 2001 - 09:57 #4

alexbp: den er fin men det er html koder.

Synes godt om

alexbp Nybegynder

14. august 2001 - 10:04 #5

-> \'disky\' - Du har ret ... jeg var måske lidt for hurtig på atrækkeen med CTRL-C & CTRL-V ...

Synes godt om

disky Nybegynder

14. august 2001 - 10:06 #6

:-) Kender jeg godt

Synes godt om

orthanc Nybegynder

14. august 2001 - 10:48 #7

Selvom alexbp\'s forslag ikke kunne bruges \'gafler\' jeg det aligevel. Men jeg vil lige minde om at jeg jo netop ikke kunne søge efter f.eks \'æ\' i en String. Det går fint nok med f.eks \'c\' eller \'h\', men æ,ø og å finder den ikke.

Synes godt om

logical Nybegynder

14. august 2001 - 10:58 #8

Tegnsæt :-)

Java arbejder internt med 16-bit unicode (Har vi hørt!), men skal selvfølgelig konverteres frem og tilbage til platforme, der ikke anvender 16-bit unicode.

afhængig af hvor du efterfølgende vil have resultatet henaf, skal det konverteres derefter. Hvis du f.eks. vil have det ud i en dos prompt, skal du selvfølgelig bruge det tegnsæt, der hører sig til der (Mode Con kommandoen vil fortælle hvilken code page du anvender, standard er vist 850).

Her er en eksempel på konvertering mellem unicode og 850:

public void println(String s) throws UnsupportedEncodingException {
String converted = new String(s.getBytes(\"CP850\"));
System.out.println(converted);
}

CP850 er ikke supporteret direkte i rt.jar, men kræver at du har i18n.jar i brug også. Det er vist nok standard idag (ihvertfald j2se1.3). Til almindelige filer i windows anbefales cp1252, som er windows\' udvidede latin-1 karakterset.

Listen over tegnsæt ligger iøvrigt her under java docs biblioteket:

docs\\guide\\intl\\encoding.doc.html

Kig også på opsætningen af mysql. mht til databaser kan du vælge en af følgende ting:
1 Lave databasens tegnsæt om til unicode
2 Lade javaklasserne konveretere mellem unicode og db tegnsæt
3 Ignorere problemet.

Den sidste kan se lidt barsk ud, men hvis det kun er java, der læser og skriver til DB bliver karakterene korrekt i den sidste ende.

Synes godt om

disky Nybegynder

14. august 2001 - 11:00 #9

hej Logical:

Fed forklaring :)

Synes godt om

logical Nybegynder

14. august 2001 - 11:00 #10

disky>> Man er jo selv blevet træt af det tidligere :-)

Synes godt om

disky Nybegynder

14. august 2001 - 11:20 #11

hehe, det har du bestemt helt ret i

Synes godt om

erk Nybegynder

15. august 2001 - 18:47 #12

Skriv i din kode følgende erstatninger for æøå
for at få dit ønskede output:

oversætelse af tegn:

’ = Æ
? = Ø
? = Å
‘ = æ
› = ø
† = å

-Så let er det! :o)

-ERK

Synes godt om

erk Nybegynder

15. august 2001 - 18:48 #13

ok surt - det kunne eksperten.dk ikke klare...
skriv din mail-adresse og så kan jeg sende dig tegnene!

Synes godt om

orthanc Nybegynder

21. august 2001 - 13:11 #14

Jeg takker for bidragende og giver pointene til ’logical’, for han meget gennemarbejde svar, og fordi hans sidste forslag viste sig at være løsningen på mit problem.
Mvh orthanc

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Java kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Programmering: Produktmixoptimering Af OBS i Java	34	23/05/202513:55	27/05/202518:32
Seleniumspørgsmål vedr. getText() Af mergelspir i Java	11	08/05/202516:32	08/05/202522:16
eclipse Af OBS i Java	0	02/05/202512:51	-
eclipse Af OBS i Java	14	27/04/202521:14	28/04/202521:28
eclipse Af OBS i Java	2	18/04/202517:14	18/04/202519:52

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

27/03

Test: Lenovo sover i timen med sin lille og vågne kontorkriger

27/03

Martin er brændt ud efter mange år i den danske it-branche: Nu sælger han huset og kører ud i det blå med hunden Murphy

27/03

Nørgaard: Jeg vil ikke have sådan noget svineri

27/03

Nyt kæmpe datacenter på vej i Esbjerg: Klar til at investere 15 milliarder

27/03

Sådan ser fremtidens arbejdsplads ud ifølge Microsoft: Snart slipper du helt for at læse e-mails og gå til møder

27/03

EU udskyder centrale dele af AI Act: Men it-chefer bør arbejde, som om den stadig træder i kraft

27/03

Finland dropper AWS til centralt it-system: Ministerium trækker i nødbremsen

27/03

Lønnen stiger stabilt: Så meget får de danske it-driftfolk i månedsløn

27/03

Han har tjent millioner på at skabe AI-musik - og få sin egen hær af bots til afspille den på streaming-tjenester: Nu er han dømt

27/03

Science fiction-thrilleren Paradise bliver forlænget med en tredje sæson

27/03

Sådan vil nyuddannede Rune Gram Sand undgå at blive gjort overflødig af AI - her er hans plan

Vis flere artikler

IT-JOB

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Netværksteknikere til design, drift og vedligehold ved Cyberdivisionen

TV2

Software Engineer – CRM & Marketing Automation, TV 2 Teknologi

Unik System Design A/S

DevOps Engineer

Jyske Bank

Senior Forretningsudvikler til Wealth Selvbetjening

Evida

Løsningsarkitekt

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 12:08	Problemer med replay af købte kursusvideoer Af annam i Browsere
28/0311:18	DENVER DVB-tMPEG-4 HD TUNER Af ole falsted i Fjernsyn & projektorer
28/0310:03	Låst D-drev skal genoprettes Af barth i Andet software
27/0313:51	Vest Tysk film - fra 1955 ? - Søges - Navn på film og forfatter har jeg glemt Af Ikke-ekspert i Fri debat
27/0305:41	Messenger kræver kode. Af Per i PC

White papers

Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta
Erfaringer fra frontlinjen: Sådan ændrer trusselsbilledet sig
Arctic Wolf
Arctic Wolf Security Operations Report 2025: Indblik i moderne sikkerhedsdrift
Arctic Wolf
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta

Flere white papers »