Notifikationer

Markér alle som læst Log ud

dsj Nybegynder

10. september 2003 - 11:51 Der er 15 kommentarer og
1 løsning

Hvilket charset følger RFC 1738

Jeg skal med...

URLEncoder.encode(String s, String enc);

... have encodet jf RFC1738-standarden, men hvad hedder det charset, der følger den? F.eks. følger UTF-8 RFC2279...

Synes godt om

zogu Nybegynder

10. september 2003 - 12:01 #1

Kig her :
http://www.faqs.org/rfcs/rfc1738.html

Umiddel bart læser jeg at den bruger US-ASCII.

Synes godt om

arne_v Ekspert

10. september 2003 - 12:11 #2

Encodingen selv hedder bare URL encoding.

Output fra den encoding er US-ASCII.

Det andet argument angiver hvilket encoding der bruges som "midlertidig
tilstand".

Altså:

1 tegn --(ISO-8859-1 encoding)--> 1 byte --(URL encoding)--> %nn

1 tegn --(UTF-8 encoding)--> 2 bytes --(URL encoding)--> %nn%mm

Synes godt om

dsj Nybegynder

10. september 2003 - 12:20 #3

Problemet med UTF-8 er, at spaces erstattes med '+' jf. RF2279, men jeg skal bruge '%20' i stedet, jf. RFC1738....

Synes godt om

arne_v Ekspert

10. september 2003 - 12:36 #4

Øh.

Håndteringen af space har næppe noget med UTF-8 versus ISO-8859-1 at
gøre. Det er kun >=128 tegnene det påvirker.

Hvis jeg husker rigtigt så skal man bruge %20 før ? og + efter ?.

Men jeg har lige testet og du har ret URLEncoder er meget glad for + !

Synes godt om

dsj Nybegynder

10. september 2003 - 13:08 #5

Det er fordi + erstatter space jf. RFC 2279.

Men jf. RFC1738 erstatter %20 space... Hvilket charset er det så man skal bruge for at gøre dette?

Synes godt om

arne_v Ekspert

10. september 2003 - 13:20 #6

Det har intet med karakter sæt at gøre.

Og jeg forstår ikke det med RFC'erne. RFC 2279 er en generel beskrivelse
af UTF-8 og har mig bekendt intet med URL'er at gøre. RFC 1738 bruger
%20 men går ikke ind i detaljer om før og efter ? i HTTP.

Synes godt om

arne_v Ekspert

10. september 2003 - 13:31 #7

Men da URLEncode encode tilsyneladende er lavet til brug
for form data, så er det vel ike andet for end at du laver
din egen lille replaceAll !?

Synes godt om

dsj Nybegynder

10. september 2003 - 13:50 #8

Du tænker altså på med String.replaceAll erstatte alle + med %20 - men hvordan ved jeg at RFC2279 udover space gør det samme som RFC1738 ?

Og hvordan skriver man det egentlig ?

String myString = "...";
myString = myString.replaceAll("+", "%20");

Sidste linie smider nemlig en PatternSyntaxException...

Synes godt om

arne_v Ekspert

10. september 2003 - 19:47 #9

Jeg ville kalde replaceALl først.

Eksempel:

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;

public class Enc {
public static void main(String[] args) throws Exception {
System.out.println(URLEncoder.encode("Æ Ø Å", "UTF-8"));
System.out.println(specialEncode("Æ Ø Å"));
}
public static String specialEncode(String s) throws UnsupportedEncodingException {
return URLEncoder.encode(s.replaceAll(" ", "%20"), "UTF-8");
}
}

Synes godt om

arne_v Ekspert

10. september 2003 - 19:48 #10

I modsætning til hvad man umiddelbart tror så er det første argument
til replaceAll ig en normal søge-streng men en regular expression.

Og + har en speciel betydning i regular expressions.

Synes godt om

dsj Nybegynder

10. september 2003 - 22:23 #11

specialEncode vil vel ikke virke i praksis, da strengen vil blive dobbelt-encodet. Space vil først blive erstattet af %20, og derefter vil '%' igen blive encodet...

Synes godt om

arne_v Ekspert

10. september 2003 - 22:27 #12

Det har du ret i. Men så vender vi den bare om og escaper plus:

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;

public class Enc {
public static void main(String[] args) throws Exception {
System.out.println(URLEncoder.encode("Æ Ø Å", "UTF-8"));
System.out.println(specialEncode("Æ Ø Å"));
}
public static String specialEncode(String s) throws UnsupportedEncodingException {
return URLEncoder.encode(s, "UTF-8").replaceAll("\\+", "%20");
}
}

Synes godt om

dsj Nybegynder

10. september 2003 - 23:13 #13

Ahhh det er "\\+" man skal skrive, kunne nemlig ikke få det til at virke med "+" :)

Synes godt om

dsj Nybegynder

10. september 2003 - 23:14 #14

Fordi det har en betydning ja...

Synes godt om

arne_v Ekspert

27. september 2003 - 13:45 #15

Ja.

replaceAll bruger regex.

Tid at lukke ?

Synes godt om

dsj Nybegynder

27. september 2003 - 18:48 #16

Jep, det må det være. Forskellen på 2279 og 1738 er meget mere end '+' og '%20'. Jeg tyvstjal 1738-encoderen fra Netscape :)

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Java kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Programmering: Produktmixoptimering Af OBS i Java	34	23/05/202513:55	27/05/202518:32
Seleniumspørgsmål vedr. getText() Af mergelspir i Java	11	08/05/202516:32	08/05/202522:16
eclipse Af OBS i Java	0	02/05/202512:51	-
eclipse Af OBS i Java	14	27/04/202521:14	28/04/202521:28
eclipse Af OBS i Java	2	18/04/202517:14	18/04/202519:52

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

22/05

Sådan får du din egen AI-maskine til rimelige penge

22/05

Thorborg dropper omstridt AI-funktion: "Jeg skal ikke nyde noget af, at de kommer på besøg igen"

22/05

Nørgaard: Først gik Nets ned, så gik EU i stå, og nu må hobbyavlere ikke engang lave vin i fred

22/05

Finanstilsynet kræver svar fra Nets: Nedbrud for anden gang på blot ti måneder

22/05

AI-topchefer var på vej til Det Hvide Hus, men efter telefonsamtaler med Musk og Zuckerberg skiftede Trump pludselig holdning

22/05

Salget af Lenovo-pc'er eksploderer: Kunder køber ind med arme og ben af frygt for stigende priser

22/05

Sci-fi: Brutal bogserie om overmagt og underkastelse

22/05

USA pumper milliarder i kvantekapløbet - IBM er den store vinder

22/05

Myndighed stopper AI-satsning fra Thorborg: Dinero trækker AI-assistent tilbage

22/05

Computerworld går helt tæt på kampen om ERP og CRM: Sådan påvirker AI de vigtigste systemer, som du har

22/05

Rapport fra dansk tænketank: Vibe-coding har en overraskende - amerikansk - skjult slagside

Vis flere artikler

IT-JOB

Everllence

Software Engineer – Build the toolchain behind the engines that move the world

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Specialister (flere roller) til Datacenter Infrastruktur and Compute til opbygning af Forsvarets nye Digitale Backbone

LB Forsikring

Digital Performance & CRO Manager

Datatilsynet

Datatilsynet søger IT-medarbejder til support og drift

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Specialister (flere roller) til Cloud og Platform Operations til opbygning af Forsvarets nye Digital Backbone

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 18:29	Beregning af flextid - formler Af Slettet bruger i Excel
I går 10:05	Sætte flere billeder sammen til et billede - IPad seneste version Af nu_igen i Billedbehandling
24/0514:56	Udseende af datoer Af ErikHg i Excel
23/0509:37	hvilken AI synes I er bedst? Af jcr18 i Andre onlineløsninger
22/0518:51	Pausepil på youtube i chrome Af valby i Browsere

White papers

Find den SOC-model, der virker i praksis
SecureDevice
E-fakturering bliver et krav – er din forretning klar?
Tabellae
Arctic Wolf Security Operations Report 2025: Indblik i moderne sikkerhedsdrift
Arctic Wolf
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta

Flere white papers »