Hvilket tegnsæt (encoding) er dit script lavet med (det der indeholder "tøj")? Hvilket tegnsæt er den webside, der viser indholdt sat til? Hvor kommer data i tabellen fra, og hvilket tegnsæt er anvendt der?
Det er ligemeget hvilket editor det er skrevet i :P Scriptet er vel skrevet i php?? For så forstår jeg ikke problemet i at parse det. Det gør jo ingen forskel om du gemmer det i en fil eller udskriver det på en side ...
Skal vi ikke slå fast, w13, at det aldrig hjælper på disse problmer at ændre på tegnsættet i databasen. Der ligger nu de bytes, der ligger, og som er lagt af det program/webside, der har lagt dem ind som enten utf-8, iso-8859-1, eller noget mere eksotisk. Tegnsættet i databasen hjælper på sortering (ORDER BY), og den slags.
UTF-8 i en almindelig mysql er også en smule problematisk, da fx en varchar(20) kan indeholde 20 "a"-er, men kun 10 "æ"-er.
Jeg er ikke så meget inde i det, men det burde vel ikke være et minus at have et UTF8-charset i sin database. Eksisterende data vil selvfølgelig stadig være i det charset, det blev gemt som, men fremtidigt indhold vil blive UTF8.
Det du nævner med varchar er selvfølgelig lidt problematisk.
"men det burde vel ikke være et minus at have et UTF8-charset i sin database" - selvfølgelig er det et plus, sortering osv., men det løser ikke det aktuelle problem, og er derfor mere til forvirring end løsning, at nævne det som det første. Undskyld, straszek, at jeg kaprer dit spørgsmål for at opdrage lidt på w13 ;)
"Det du nævner med varchar er selvfølgelig lidt problematisk." - derfor vil man også ofte vælge at opbevare data som iso-8859-1, hvis man ved man kan nøjes med det, men så konvertere til og fra utf-8 på fx websider, hvis man ved utf-8 er nødvendigt der. Men vi er så ude i nogle lidt langhårede overvejelser....
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.