Speciel tegn: Tegnsæt problem, måske UTF-8 og UTF-16 problem
Jeg roder lidt med et program der sender og modtager beskeder fra en server via en protokol, generelt virker dette godt.Nu har jeg fået det problem at når jeg tilgår en anden server så får jeg tekstegn som dem angivet i første række:
Ã. Å ASCII (dec)=197
Ã, Ä 196
Ã- Ö 214
Ã¥ ä 228
ä ö 246
É é 233
Tegn i anden række er dem jeg ønsker at vise (benytte).
Den tredje række er blot ascii tegnsæt værdien for de i anden række karakterer.
Når jeg ser på min første række, så ser det ud som om at jeg modtager noget i 16 bit og det jeg ønsker at vise blot er i 8 bit (ASCII).
Er første række mon fra UTF16 tegnsættet ?!
For at løse dette skal jeg som punkt 1 kende til forskellen på de forskellige tegnsæt og kunne vurdere hvilket tegnsæt første række tilhører.
Når dette er kendt kan jeg vurdere hvordan jeg så konverterer tegnene og løser mit problem.
