Avatar billede bigo Nybegynder
27. august 2009 - 09:16 Der er 1 løsning

Søg i wordfil

Hejsa.

jeg prøver at lave en lille søgefunktion i PHP. den skal bl.a. finde ord i en word fil.

Jeg kan godt lave :
    function msword2array ($sourceFile)
  {
    $textArray = array ();
    $objStart = 0;

    $fp = fopen ($sourceFile, 'rb');
    $content = fread ($fp, filesize ($sourceFile));
    fclose ($fp);
       
        $textArray = explode("\r\n", $content);
    return $textArray;   
  }


Som giver mig en del garbage i start og slut:

ÐÏࡱá>þÿ FDþÿÿÿGÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿì¥Áq`ø¿-%bjbjqPqP.6::-ÿÿÿÿÿÿ¤øøøøøøø T T T T $x  Ÿ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶       $Uh½¦Dø¶ ¶ ¶ ¶ ¶ Døø¶ ¶ Yø ø ø ¶ Rø¶ ø¶ ø ¶ ø ø :ò,øøz¶ " ÜÖOÅT  . o0Ÿ(Rc6 ¸czcøz¤¶ ¶ ø ¶ ¶ ¶ ¶ ¶ DDî ¶ ¶ ¶ Ÿ¶ ¶ ¶ ¶   ÄÐ „   Ð   øøøøøøÿÿÿÿ Referat af ordinær generalforsamling

......... ren tekst .................

isse lejligheder. <ouv µÕéê         H I R r ‡ " ´ Å Æ Z ¹ Ç ë       ) } œ ¿ À Ê Û  ( ; X l n y ~  " ¿ å 12WX¦©àÿ<KL`o


Se nu er jeg jo kun interesseret i det i midten so to speak.

Hvordan og hvorledes? (og nej, jeg er ikke lige interesseret i at skulle benytte COM objekter hvis jeg kan undgå det ;-)))
Avatar billede bigo Nybegynder
27. august 2009 - 19:15 #1
function msword2array ($sourceFile)
    {
        $fileHandle = fopen($sourceFile, "r");
        $line = @fread($fileHandle, filesize($sourceFile));
        $lines = explode(chr(0x0D),$line);

        $outtext = "";
        foreach($lines as $thisline)
        {
            $pos = strpos($thisline, chr(0x00));
            if (($pos !== FALSE)||(strlen($thisline)==0))
            {
            } else {
                $outtext .= $thisline." ";
            }
        }

        $outtext = preg_replace("[^[[:alnum:]]]","",$outtext);
        $textArray = explode(" ", $outtext);

        return $textArray;
    }
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Vi tilbyder markedets bedste kurser inden for webudvikling

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester