hkb-x Nybegynder
20. juli 2009 - 16:49 Der er 6 kommentarer og
1 løsning

HTTP request data til unicode i python

HTTP requests encoder unicode efter tabellem beskrevet her: http://jrgraphix.net/research/unicode_blocks.php?block=1 hvilket vil sige at æ representeres ved %E6 og å ved %E5 osv. Jeg vil gerne kunne konverteres sådanne ASCII strenge til unicode i python men hvordan gør jeg. Jeg kan ikke finde nogle python libs der kan oversætte fra den encoding hvilket jeg finder meget mærkeligt.
erikjacobsen Seniormester
20. juli 2009 - 17:08 #1
Ikke helt som du beskriver. Hvis siden du kommer fra har tegnsæt iso8859-1, så kommer det som %E6 osv. Det har ikke noget med unicode at gøre. Hvis siden har tegnsæt utf-8 så kommer æ som %C3%A6

Ikke fordi det løser dit problem, selvfølgelig.
arne_v Ekspert
20. juli 2009 - 17:11 #2
hkb-x Nybegynder
20. juli 2009 - 17:34 #3
Yes jeg fik løst det med urllib.unquote()  men den oversætter ret fuceked til unicode. tegn som er i ASCII bliver decodet til byteværdier langt over 1000 istedet for < 128 som de burde så nu kan jeg få input ind men kan så bare ikke vise det?!?
hkb-x Nybegynder
20. juli 2009 - 17:42 #4
ahh, det er æøå den tyrer helt der op. det giver jo ingen mening
hkb-x Nybegynder
20. juli 2009 - 17:42 #5
de burde jo ligge under 255
hkb-x Nybegynder
20. juli 2009 - 17:49 #6
fandt løsningen. Den streng der bliver returneret af urllib indeholder bytes med en værdi over 128 mens dens encoding er ASCII. AV!

men det kan løses således:

urllib.unquote_plus(HTTP_VAR).decode('raw_unicode_escape')

hvor HTTP_VAR er den HTTP encodede variabel/input
arne_v Ekspert
20. juli 2009 - 18:37 #7
Er det sådan et princip du har at bruge de forslag du får og selv tage point ??
Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links

Opret Preview

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester





Computerworld
Hackerne kaster sig over de fire største browsere: Her er den mest usikre browser
I en hackerdyst mellem Chrome, Firefox, Safari og Edge Chrome blev en af browserne lagt ned fem gange, mens hackerne ikke kunne få hul på en af de andre browsere i konkurrencen.
CIO
TDC mister CIO - skifter til it-topstilling i Nordea
Charlotte Hersdorf, der har været CIO i TDC, skifter telegiganten ud med Nordea, hvor hun har fået en ny it-topstilling.
Comon
Top 5: De bedste spil baserede på film
Film, der bliver til spil, bliver enten fantastisk eller en fadæse. Her er de fem bedste spil baseret på en spillefilm
Channelworld
Ny EG-direktør har en plan: Sådan skal EG vokse sig større og endnu mere profitabel
Interview: Mikkel Bardram er ny administrerende direktør i EG. Selvom EG nu har 2.000 ansatte og en omsætning på 1,8 milliarder kroner, er der potentiale for endnu mere, mener den nye direktør.
White paper
Hyperconverged infrastructure - Sådan optimeres datacentret på den enkleste og mest fremtidssikrede måde
Mere integration betyder mindre arbejde for datacenteradministratorer - Læs hvordan i dette white paper. Dette white paper er skrevet af Computerworld for SEC Datacom