Avatar billede viciodk Praktikant
03. marts 2003 - 20:55 Der er 3 kommentarer og
2 løsninger

ANSI vs. ASCII

Tidligere når jeg skulle lave en hjemmeside, har jeg blot oprettet at tekstdokument i Windows via Ny(t) -> Tekstdokument, omdøbt filen til .htm og har så arbejdet med den i Notesblok. Nu er jeg gået i gang med at lære PHP og i begynderhæftet "Start på PHP" fra IDG står der at man skal bruge en ASCII-editor til redigering af PHP-dokumenter.

Jeg ser så til min store overraskelse at Notesblok i Windows slet ikke understøtter ASCII, men kun ANSI, Unicode og UTF-8. Derfor har jeg fået fat en ASCII-editor der hedder Emacs.

1. Men hvad er forskellene mellem ANSI, Unicode, ASCII og UTF-8? Og er der nogen situationer hvor man skal bruge det ene frem for det andet?

2. Kan man f.eks. forestille sig at en Unix-bruger kan have problemer med at læse ANSI eller at Windows ikke kan læse en bestemt type kodning?

3. Hvad med æ, ø og å: Understøttes disse og lignende specialtegn i alle de forskellige "formater"?

4. Skal man angive i sit PHP-/HTML-dokument hvilken kodning man bruger? Der er jo noget der hedder noget i retning af <meta http-equiv="Content-Type" content="text/html; encoding=ISO-8859-1"> som jeg altid bare har skrevet uden at tænke over hvorfor det skal stå der. Afhænger "ISO-8859-1" af kodningen (ANSI, ASCII ...)?
Avatar billede cautoo Nybegynder
03. marts 2003 - 20:58 #1
...du kan godt skrive PHP kode i Notepad, og så vidt jeg ved, tilbyder den vist også ascii, mange af tegnene bliver bare vist som firkanter
Avatar billede terry Ekspert
03. marts 2003 - 21:05 #2
Avatar billede viciodk Praktikant
04. marts 2003 - 17:47 #3
Ja, jeg har også selv fundet mange sider som beskriver hhv. ASCII og ANSI, men problemet er at jeg ikek forstår det der står og derfor spørger jeg her!

Er der ingen der kan svare på mine specifikke spørgsmål?
Avatar billede mortrr Praktikant
04. marts 2003 - 19:26 #4
Det er et meget vidtgående spørgsmål.

1. Forskellen på de forskellige tegnsæt ligger i at en del karakterer, specielt "nationale" karakterer ligger på forskellige positioner i tegnsætter.
Fx (grebet ud af luften) er ß (tysk dobbelt S) placeret på position 225 i ansi-tegnsættet og 223 i windows 1251/Ansi og 8859-1
Unicode er et udvidet tegnsæt. Hvor de "normale" tegnsæt som fx ascii og ansi kun har 255 tegn, har unicode mulighed for at indeholde 256*256-1 = 65535 tegn.

2. Ja - det kan man sagtens. En bruger kan godt bruge fx et østeuropæisk tegnsæt, som ikke indeholder fx de danske æøå. Hvis ens side ikke indeholder informationer om hvilket tegnsæt der bruges, vil tegnene blive vist som de tilsvarende i hans standard-tegnsæt.

3. Nej. ø understøttes såmænd ikke engang i ASCII. Det findes på danske computere, men i amerikanske vises ø som ¢ og Ø som ¥. Og der er en del "moderne" tegnsæt hvor det ikke er med.

4. Ja afgjort. ISO-8859-1 er det mest brugte tegnsæt ti internet-brug, så hold dig bare til det.
Avatar billede viciodk Praktikant
04. marts 2003 - 19:47 #5
Tak for svarene :)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester