Avatar billede Slettet bruger
16. december 2005 - 01:53 Der er 6 kommentarer og
1 løsning

ANSI vs. Unicode? Hvad bevirker forskellen?

Når jeg skal gemme et JavaScript eller en HTML-side i Notesblok kan jeg vælge mellem følgende kodning:

ANSI
Unicode
Unicode big endian
UTF-8

Hvad i alverden betyder dette? Og hvad er forskellen?

OG... kan der være tale om, at kodningen "Unicode" bevirker at HTML-siden efterfølgende åbnes/loades anderledes end ANSI kodningen - måske hurtigere??

En nem forståelig forklaring fortrækkes, - jeg behøver ikke de tekniske detaljer ;-)
Avatar billede jakoba Nybegynder
16. december 2005 - 03:19 #1
ord som  tal, bogstaver, osv fatter en computer ikke. det er altsammen bit. så når vi skriver et bogstav bliver det lagret som en sekvens af bit som VI ved betyder det bogstav.

Desværre er VI ikke altid enige. og de 4 navne du nævner are navnene på forskellige konventioner for hvilke sekvenser af bit der betyder jvilke bogstaver

ANSI er fra de gode gamle dage da vi troede vi kunne nøjes med wores sædvanlige alfabet. Hvert bogstav har kun 8 bit, og det viste sig hurtig at være alt for lidt. dansk æ. ø og å var ikke med og så er det spaniolerne med omvedte spørgsmålstegn, franskmændende med 3 slags accenter over diverse vokaler, osv osv. Og ovenit det kom japanere og kinesere med helt forskellige alfabeter der også burde være med i systemet

det blev så til 'unicode' med 16 bit til hvert bogstav og mulighed for at lave bitsekvenser der var endnu længere til et enkelt bogstav.

i filer lagres alting i byte (8 bit) så når der skal lagres fx en 16 bit værdi skal vi være enige om hvilke å bit der lagres forrest. Og det er vi naturligvis heller ikke enige om. 'big endian' betyder at mest betydene 8-bit sektion skal lagres først.

UTF-8 er en tredie måde at gemme unikode i en fil. Den bruges mest her i vesten, for det smarte ved UTF-8 er at alle de 'sædvanlige' tegn vi bruger skrives med korte bitsekvenser, og kun de specielle tegn bruger 16 bit eller mere. Det kan der spares en del diskplads med (selvom det er ret ligegyldigt nu hvor diskplads er så billig).

mvh JakobA
Avatar billede jakoba Nybegynder
16. december 2005 - 03:34 #2
"Og hvad er forskellen ?"

For det meste er det pølseligemeget. Hvis det du skriver inderholder en masse specialtegn (fx matematiske tegn eller arabiske bogstaver) eller hvis det skal sendes til nogen i udlandet kunne det være en fordel at gemme i unikode (en af de 3 slags).
Avatar billede simonvalter Praktikant
16. december 2005 - 09:17 #3
joel siger en masse interessant om det her i: "The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)"

http://www.joelonsoftware.com/articles/Unicode.html
Avatar billede Slettet bruger
18. december 2005 - 04:16 #4
Okay! Tror jeg blev lidt kloger nu...

Det lade jo umiddelbart til at være "smartest" at bruge unicode eller utf-8.

Men en ting der forvirre mig lidt, er Joel's (http://www.joelonsoftware.com/articles/Unicode.html) forslag ang. Content-Type charset=utf-8.
Jeg bruger jo charset=ISO-8859-1, hvilket selvf. virker fint nok. Men hvorfor bruger man ikke bare Content-Type charset=unicode, og så gemmer i unicode kodning?? Så skulle alle problemer vel være løst??
Og/eller hvilken forbindelse er der mellem ISO-8859-1 og kodningen??

Eller er jeg bare helt og aldeles på afveje nu??

Anyway, i kan begge roligt smide et svar til point.
Avatar billede jakoba Nybegynder
19. december 2005 - 20:02 #5
fordi 'unikode' ikke er nok til at være en eentydig beskrivelse af hvordan der gemmes. dine 3 navne:
  Unicode
  Unicode big endian
  UTF-8
er alle unikode, blot i forkellige versioner.
Avatar billede simonvalter Praktikant
19. december 2005 - 20:19 #6
springer over.
Avatar billede Slettet bruger
19. december 2005 - 22:38 #7
Ok! Takker for jeres hjælp.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester