26. maj 2004 - 18:52Der er
36 kommentarer og 1 løsning
invalid XML character
Jeg forsøger at lave et DOM træ i følge arne's artikel http://eksperten.dk/artikler/245. Det går sådan set også fint nok, men jeg det data jeg tilføjer til træet indeholder på en eller anden måde nogle invalide charcters. Jeg får denne fejl: java.io.IOException: The character '' is an invalid XML character. Jeg styrer desværre ikke helt selv (endnu) ikke hvilke characters der skal tilføjes da det er noget data jeg henter fra en anden server. Hvordan får jeg parset dem som valide chars. ? Jeg ved desværre heller ikke lige hvilken char det er, da den bare vises som en firkant hos mig :( håber i forstår mit spg.
Tror det er når jeg skriver det ud, den stopper efter 56 kb data hver gang, måske det er et bufferproblem ? Jo, den stopper efter præsic 57.344 bytes til trods for at det er forskellig data der skrives, så chancen for den ramte det tegn der er nok ikke ret stor
En StackTrace giver: java.io.IOException: The character '' is an invalid XML character at org.apache.xml.serialize.BaseMarkupSerializer.fatalError(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.surrogates(Unknown Source) at org.apache.xml.serialize.XMLSerializer.printText(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.characters(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serializeNode(Unknown Source) at org.apache.xml.serialize.XMLSerializer.serializeElement(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serializeNode(Unknown Source) at org.apache.xml.serialize.XMLSerializer.serializeElement(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serializeNode(Unknown Source) at org.apache.xml.serialize.XMLSerializer.serializeElement(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serializeNode(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serializeNode(Unknown Source) at org.apache.xml.serialize.BaseMarkupSerializer.serialize(Unknown Source)
Lav et svar du virkelig fortjænt de point, jeg troede bare det var et lille simpelt spg. Jeg kan nok finde ud af hvad det er for tegn, hvis du kan lave dem om fra bytes til chars
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.