03. marts 2003 - 20:55Der er
3 kommentarer og 2 løsninger
ANSI vs. ASCII
Tidligere når jeg skulle lave en hjemmeside, har jeg blot oprettet at tekstdokument i Windows via Ny(t) -> Tekstdokument, omdøbt filen til .htm og har så arbejdet med den i Notesblok. Nu er jeg gået i gang med at lære PHP og i begynderhæftet "Start på PHP" fra IDG står der at man skal bruge en ASCII-editor til redigering af PHP-dokumenter.
Jeg ser så til min store overraskelse at Notesblok i Windows slet ikke understøtter ASCII, men kun ANSI, Unicode og UTF-8. Derfor har jeg fået fat en ASCII-editor der hedder Emacs.
1. Men hvad er forskellene mellem ANSI, Unicode, ASCII og UTF-8? Og er der nogen situationer hvor man skal bruge det ene frem for det andet?
2. Kan man f.eks. forestille sig at en Unix-bruger kan have problemer med at læse ANSI eller at Windows ikke kan læse en bestemt type kodning?
3. Hvad med æ, ø og å: Understøttes disse og lignende specialtegn i alle de forskellige "formater"?
4. Skal man angive i sit PHP-/HTML-dokument hvilken kodning man bruger? Der er jo noget der hedder noget i retning af <meta http-equiv="Content-Type" content="text/html; encoding=ISO-8859-1"> som jeg altid bare har skrevet uden at tænke over hvorfor det skal stå der. Afhænger "ISO-8859-1" af kodningen (ANSI, ASCII ...)?
Ja, jeg har også selv fundet mange sider som beskriver hhv. ASCII og ANSI, men problemet er at jeg ikek forstår det der står og derfor spørger jeg her!
Er der ingen der kan svare på mine specifikke spørgsmål?
1. Forskellen på de forskellige tegnsæt ligger i at en del karakterer, specielt "nationale" karakterer ligger på forskellige positioner i tegnsætter. Fx (grebet ud af luften) er ß (tysk dobbelt S) placeret på position 225 i ansi-tegnsættet og 223 i windows 1251/Ansi og 8859-1 Unicode er et udvidet tegnsæt. Hvor de "normale" tegnsæt som fx ascii og ansi kun har 255 tegn, har unicode mulighed for at indeholde 256*256-1 = 65535 tegn.
2. Ja - det kan man sagtens. En bruger kan godt bruge fx et østeuropæisk tegnsæt, som ikke indeholder fx de danske æøå. Hvis ens side ikke indeholder informationer om hvilket tegnsæt der bruges, vil tegnene blive vist som de tilsvarende i hans standard-tegnsæt.
3. Nej. ø understøttes såmænd ikke engang i ASCII. Det findes på danske computere, men i amerikanske vises ø som ¢ og Ø som ¥. Og der er en del "moderne" tegnsæt hvor det ikke er med.
4. Ja afgjort. ISO-8859-1 er det mest brugte tegnsæt ti internet-brug, så hold dig bare til det.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.