Problemet
Synlighed er alfa og omega på World Wide Web, hvor mulighederne er mange, og brugernes loyalitet ikke holder længere end til det første link, der peger på konkurrentens website. Søgemaskiner er en vigtig del af synliggørelsen, men som en tidligere artikel i PC World gør opmærksom på, så kan der være problemer mellem dynamiske websites og søgemaskiner.
Problemet
Problemet er, at mange søgemaskiner ignorerer adresser med spørgsmålstegn og ampersand (&) i webadressen, for eksempel som i
/index.php?artikel_id=1957&mode=2
Den del af adressen, der begynder med spørgsmålstegnet, kaldes for en querystring (forespørgselsstreng), og den benyttes af et bagvedliggende script eller program på webserveren.
Der gemmer sig som regel et dynamisk genereret website bag sådan en adresse. Derfor ignorerer søgemaskinernes indekseringsrobotter, de såkaldte spiders, ofte sådanne adresser.
Man kan for eksempel forestille sig, at en spider forvilder sig ind på et website, der er front-end for en database. Hvis den bagvedliggende database er stor som for eksempel en telefonbog, så kan spideren bruge lang tid og plads på at indeksere hele telefonbogen i stedet for at kigge efter sider med egentligt indhold. Derfor holder mange spidere sig væk, når de ser spørgsmålstegnet.
Det er ikke godt for dem, der designer dynamiske websites, hvor dynamikken afspejler et bagvedliggende publiceringssystem, det såkaldte content management software. Det eneste egentlige brugbare alternativ til querystrings er cookies, men det giver også problemer med søgemaskiner, idet de forskellige sider ikke kan differentieres af søgemaskinens spider.
Alle siderne har samme navn, for eksempel default.asp, og indholdet bestemmes ud fra cookien. Dermed kan spideren ikke se, at det i virkeligheden drejer sig om forskellige sider, da den bruger webadressen til at bestemme sidens identitet. Mange brugere bryder sig heller ikke om cookies, da de kan bruges til at spore brugeradfærd, og derfor slår de cookie-funktionaliteten fra i browseren, og så kan brugeren ikke benytte websitet.
Apache, som er verdens mest populære webserver-software målt i domæner, giver webudvikleren flere løsninger på problemet. Den mest vidtgående er modulet mod_rewrite, der gør det muligt for webserveren af omfortolke adressen. Således kan adressen i eksemplet fra før, se sådan ud for brugeren
/artikler/2957/2/index.htm
Men derefter videresendes adressen til script-fortolkeren eller andet bagvedliggende software som
/artikel.php?artikel_id=2957&mode=2
Mod_rewrite er et særdeles stærkt, men også ganske kompliceret modul, som vi gemmer til en senere artikel. Her gennemgår vi i stedet en simpel løsning, som fungerer under alle scripting-sprog eller andre typer af websoftware, som har adgang til Apaches miljøvariabler (environment variables). I dette eksempel benytter vi det populære scripting-sprog PHP.
Løsningen
Løsningen
Apache har en del muligheder, som er nemmere at benytte end mod_rewrite. Her benytter vi direktivet ForceType, der sender alle forespørgsler indenfor en given sti til et script eller program.
Det ser sådan ud:
<Location /artikler>
ForceType application/x-httpd-php
</Location>
Direktivet indsættes i en .htaccess-fil eller i en <Directory> eller <Location> sektion i httpd.conf-filen.
Dette direktiv bevirker, at alle forespørgsler til directoriet /artikler, for eksempel
http://www.mitsite.dk/artikler/2957/2/index.htm
bliver sendt til et script ved navn artikler.php, som befinder sig i roden af web-hierakiet.
Problemet er nu, hvorledes scriptet skal få den information frem, som ligger gemt i adressen. Hemmeligheden består i, at adressen ligger gemt i miljøvariablen $REQUEST_URI, og der kan de enkelte dele af adressen pilles ud.
Det kunne se sådan ud i vores script artikel.php:
<?php
$url_array = explode("/", $REQUEST_URI);
PHP-funktionen explode() genererer et array ved at opdele tekststrengen givet som anden parameter i kaldet, ud fra det tegn, som er angivet som første parameter i kaldet, altså "/" i eksemplet. De enkelte dele kan så hentes ud af adressen som $url_array[1], $url_array[2] og så videre. Vi kan lave et lille test-script, hvor vi foresætter koden fra oven med linierne
for($i=1;$i<sizeof($url_array);$i++) {
echo $i;
echo ". del af url_array: ";
echo $url_array[$i];
echo "<BR>";
}
?>
Med adressen
http://localhost/artikler/2957/2/index.htm
returnerer scriptet følgende til browseren:
1. del af url_array: artikler
2. del af url_array: 2957
3. del af url_array: 2
4. del af url_array: index.htm
I en kommende artikel kigger vi på det frygtede mod_rewrite modul, der kan mange spændende ting, eksempelvis sende forskellige klienter til forskellige steder, selvom den samme adresse benyttes.