Fil fra UTF-16 til UTF-8 så jeg kan bruge preg_match
HejJeg står med et "lille" problem. Jeg skal kunne læse en UTF-16 encoded fil ind og derefter foretage noget preg_match på den streng der så at sige kommer ud af det.
Problemet opstår, når jeg prøver at printe indholdet af filen på skærmen, så ser det højst mærkværdigt ud. Jeg har snuset mig frem til at det er en UTF-16 encoded fil, men skridtet herfra kan jeg så ikke lige greje...
Filen er denne: http://dev.footballground.dk/files/holdanalyse/fm_ingame/16CarstenChristensen.html
Koden er denne:
<?php
$file = $_SERVER['DOCUMENT_ROOT'].'files/holdanalyse/fm_ingame/16CarstenChristensen.html';
$file_content = file_get_contents($file);
echo $file_content;
?>
Outputtet kan ses her: http://dev.footballground.dk/html_dom_test.php
Jeg har afprøvet både at læse det ind i et DOM-object vha. DOMDocument-objektet, men den meldte (naturligvis) en entity-fejl og jeg har prøvet at konvertere den vha. iconv, som heller ikke gav det ønskede resultat.
Er der nogen derude der kan hjælpe mig? Jeg gætter på at problemet ligger i både encodingen og måske at det kan være multibyte-streng... Men det er alt sammen gætterier der bygger på min relativt begrænsede viden om lige præcis det emne :)
Men hvis man kunne, på en eller anden måde, konvertere den streng der kommer i første omgang, om en til en "alm" UTF-8 streng, så tror jeg meget ville være godt :D
På forhånd tak for hjælpen :)
