Websites der rykker i søgemaskinen

Dynamiske websites kan være problematiske for søgemaskiner. Apache, verdens mest populære webserver, har flere løsninger på problemet om, hvordan man gør grimme webadresser smukke på en nem måde.

Problemet

Synlighed er alfa og omega på World Wide Web, hvor mulighederne er mange, og brugernes loyalitet ikke holder længere end til det første link, der peger på konkurrentens website. Søgemaskiner er en vigtig del af synliggørelsen, men som en tidligere artikel i PC World gør opmærksom på, så kan der være problemer mellem dynamiske websites og søgemaskiner.

Problemet
Problemet er, at mange søgemaskiner ignorerer adresser med spørgsmålstegn og ampersand (&) i webadressen, for eksempel som i

/index.php?artikel_id=1957&mode=2

Den del af adressen, der begynder med spørgsmålstegnet, kaldes for en querystring (forespørgselsstreng), og den benyttes af et bagvedliggende script eller program på webserveren.

Der gemmer sig som regel et dynamisk genereret website bag sådan en adresse. Derfor ignorerer søgemaskinernes indekseringsrobotter, de såkaldte spiders, ofte sådanne adresser.

Man kan for eksempel forestille sig, at en spider forvilder sig ind på et website, der er front-end for en database. Hvis den bagvedliggende database er stor som for eksempel en telefonbog, så kan spideren bruge lang tid og plads på at indeksere hele telefonbogen i stedet for at kigge efter sider med egentligt indhold. Derfor holder mange spidere sig væk, når de ser spørgsmålstegnet.

Det er ikke godt for dem, der designer dynamiske websites, hvor dynamikken afspejler et bagvedliggende publiceringssystem, det såkaldte content management software. Det eneste egentlige brugbare alternativ til querystrings er cookies, men det giver også problemer med søgemaskiner, idet de forskellige sider ikke kan differentieres af søgemaskinens spider.

Alle siderne har samme navn, for eksempel default.asp, og indholdet bestemmes ud fra cookien. Dermed kan spideren ikke se, at det i virkeligheden drejer sig om forskellige sider, da den bruger webadressen til at bestemme sidens identitet. Mange brugere bryder sig heller ikke om cookies, da de kan bruges til at spore brugeradfærd, og derfor slår de cookie-funktionaliteten fra i browseren, og så kan brugeren ikke benytte websitet.

Apache, som er verdens mest populære webserver-software målt i domæner, giver webudvikleren flere løsninger på problemet. Den mest vidtgående er modulet mod_rewrite, der gør det muligt for webserveren af omfortolke adressen. Således kan adressen i eksemplet fra før, se sådan ud for brugeren

/artikler/2957/2/index.htm

Men derefter videresendes adressen til script-fortolkeren eller andet bagvedliggende software som

/artikel.php?artikel_id=2957&mode=2

Mod_rewrite er et særdeles stærkt, men også ganske kompliceret modul, som vi gemmer til en senere artikel. Her gennemgår vi i stedet en simpel løsning, som fungerer under alle scripting-sprog eller andre typer af websoftware, som har adgang til Apaches miljøvariabler (environment variables). I dette eksempel benytter vi det populære scripting-sprog PHP.

Løsningen

Løsningen
Apache har en del muligheder, som er nemmere at benytte end mod_rewrite. Her benytter vi direktivet ForceType, der sender alle forespørgsler indenfor en given sti til et script eller program.
Det ser sådan ud:

<Location /artikler>
ForceType application/x-httpd-php
</Location>

Direktivet indsættes i en .htaccess-fil eller i en <Directory> eller <Location> sektion i httpd.conf-filen.

Dette direktiv bevirker, at alle forespørgsler til directoriet /artikler, for eksempel

http://www.mitsite.dk/artikler/2957/2/index.htm

bliver sendt til et script ved navn artikler.php, som befinder sig i roden af web-hierakiet.

Problemet er nu, hvorledes scriptet skal få den information frem, som ligger gemt i adressen. Hemmeligheden består i, at adressen ligger gemt i miljøvariablen $REQUEST_URI, og der kan de enkelte dele af adressen pilles ud.

Det kunne se sådan ud i vores script artikel.php:

<?php

$url_array = explode("/", $REQUEST_URI);

PHP-funktionen explode() genererer et array ved at opdele tekststrengen givet som anden parameter i kaldet, ud fra det tegn, som er angivet som første parameter i kaldet, altså "/" i eksemplet. De enkelte dele kan så hentes ud af adressen som $url_array[1], $url_array[2] og så videre. Vi kan lave et lille test-script, hvor vi foresætter koden fra oven med linierne

for($i=1;$i<sizeof($url_array);$i++) {
   echo $i;
   echo ". del af url_array: ";
   echo $url_array[$i];
   echo "<BR>";
}

?>

Med adressen

http://localhost/artikler/2957/2/index.htm

returnerer scriptet følgende til browseren:

1. del af url_array: artikler
2. del af url_array: 2957
3. del af url_array: 2
4. del af url_array: index.htm

I en kommende artikel kigger vi på det frygtede mod_rewrite modul, der kan mange spændende ting, eksempelvis sende forskellige klienter til forskellige steder, selvom den samme adresse benyttes.

Læses lige nu

    KMD A/S

    DevOps Engineer

    Københavnsområdet

    Banedanmark

    Systemudvikler (backend)

    Københavnsområdet

    Netcompany A/S

    Microsoft Operations Engineer

    Nordjylland

    Annonceindlæg tema

    Forsvar & beredskab

    Cybersikkerhed, realtidsdata og robuste it-systemer er blevet fundamentet for moderne forsvar.

    Navnenyt fra it-Danmark

    Norriq Danmark A/S har pr. 1. august 2025 ansat Mia Vang Petersen som Head of Marketing. Hun skal især beskæftige sig med at lede Norriqs marketingteam mod nye succeser. Hun kommer fra en stilling som Head of Marketing hos Columbus Danmark. Hun er uddannet Kandidat i Kommunikation fra Aalborg Universitet. Nyt job

    Mia Vang Petersen

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Katrine Køpke Rasmussen som Consultant. Hun skal især beskæftige sig med sikre vækst i NORRIQS kunders forretninger gennem hendes skarpe rapporteringer. Nyt job

    Katrine Køpke Rasmussen

    Norriq Danmark A/S

    Signifly har pr. 1. august 2025 ansat Anders Kirk Madsen som Tech Lead. Anders skal især beskæftige sig med at hjælpe Signiflys offentlige og private kunder med at styrke forretningen gennem teknisk solide løsninger. Anders kommer fra en stilling som Business Architect hos SOS International. Nyt job
    Danske Spil har pr. 1. oktober 2025 ansat Jesper Krogh Heitmann som Brand Manager for Oddset. Han skal især beskæftige sig med at udvikle og drive brandets strategi og sikre en rød tråd på tværs af alle platforme og aktiviteter. Han kommer fra en stilling som Marketing & Communications Manager hos Intellishore. Nyt job

    Jesper Krogh Heitmann

    Danske Spil