Websites der rykker i søgemaskinen

Dynamiske websites kan være problematiske for søgemaskiner. Apache, verdens mest populære webserver, har flere løsninger på problemet om, hvordan man gør grimme webadresser smukke på en nem måde.

Problemet

Synlighed er alfa og omega på World Wide Web, hvor mulighederne er mange, og brugernes loyalitet ikke holder længere end til det første link, der peger på konkurrentens website. Søgemaskiner er en vigtig del af synliggørelsen, men som en tidligere artikel i PC World gør opmærksom på, så kan der være problemer mellem dynamiske websites og søgemaskiner.

Problemet
Problemet er, at mange søgemaskiner ignorerer adresser med spørgsmålstegn og ampersand (&) i webadressen, for eksempel som i

/index.php?artikel_id=1957&mode=2

Den del af adressen, der begynder med spørgsmålstegnet, kaldes for en querystring (forespørgselsstreng), og den benyttes af et bagvedliggende script eller program på webserveren.

Der gemmer sig som regel et dynamisk genereret website bag sådan en adresse. Derfor ignorerer søgemaskinernes indekseringsrobotter, de såkaldte spiders, ofte sådanne adresser.

Man kan for eksempel forestille sig, at en spider forvilder sig ind på et website, der er front-end for en database. Hvis den bagvedliggende database er stor som for eksempel en telefonbog, så kan spideren bruge lang tid og plads på at indeksere hele telefonbogen i stedet for at kigge efter sider med egentligt indhold. Derfor holder mange spidere sig væk, når de ser spørgsmålstegnet.

Det er ikke godt for dem, der designer dynamiske websites, hvor dynamikken afspejler et bagvedliggende publiceringssystem, det såkaldte content management software. Det eneste egentlige brugbare alternativ til querystrings er cookies, men det giver også problemer med søgemaskiner, idet de forskellige sider ikke kan differentieres af søgemaskinens spider.

Alle siderne har samme navn, for eksempel default.asp, og indholdet bestemmes ud fra cookien. Dermed kan spideren ikke se, at det i virkeligheden drejer sig om forskellige sider, da den bruger webadressen til at bestemme sidens identitet. Mange brugere bryder sig heller ikke om cookies, da de kan bruges til at spore brugeradfærd, og derfor slår de cookie-funktionaliteten fra i browseren, og så kan brugeren ikke benytte websitet.

Apache, som er verdens mest populære webserver-software målt i domæner, giver webudvikleren flere løsninger på problemet. Den mest vidtgående er modulet mod_rewrite, der gør det muligt for webserveren af omfortolke adressen. Således kan adressen i eksemplet fra før, se sådan ud for brugeren

/artikler/2957/2/index.htm

Men derefter videresendes adressen til script-fortolkeren eller andet bagvedliggende software som

/artikel.php?artikel_id=2957&mode=2

Mod_rewrite er et særdeles stærkt, men også ganske kompliceret modul, som vi gemmer til en senere artikel. Her gennemgår vi i stedet en simpel løsning, som fungerer under alle scripting-sprog eller andre typer af websoftware, som har adgang til Apaches miljøvariabler (environment variables). I dette eksempel benytter vi det populære scripting-sprog PHP.

Løsningen

Løsningen
Apache har en del muligheder, som er nemmere at benytte end mod_rewrite. Her benytter vi direktivet ForceType, der sender alle forespørgsler indenfor en given sti til et script eller program.
Det ser sådan ud:

<Location /artikler>
ForceType application/x-httpd-php
</Location>

Direktivet indsættes i en .htaccess-fil eller i en <Directory> eller <Location> sektion i httpd.conf-filen.

Dette direktiv bevirker, at alle forespørgsler til directoriet /artikler, for eksempel

http://www.mitsite.dk/artikler/2957/2/index.htm

bliver sendt til et script ved navn artikler.php, som befinder sig i roden af web-hierakiet.

Problemet er nu, hvorledes scriptet skal få den information frem, som ligger gemt i adressen. Hemmeligheden består i, at adressen ligger gemt i miljøvariablen $REQUEST_URI, og der kan de enkelte dele af adressen pilles ud.

Det kunne se sådan ud i vores script artikel.php:

<?php

$url_array = explode("/", $REQUEST_URI);

PHP-funktionen explode() genererer et array ved at opdele tekststrengen givet som anden parameter i kaldet, ud fra det tegn, som er angivet som første parameter i kaldet, altså "/" i eksemplet. De enkelte dele kan så hentes ud af adressen som $url_array[1], $url_array[2] og så videre. Vi kan lave et lille test-script, hvor vi foresætter koden fra oven med linierne

for($i=1;$i<sizeof($url_array);$i++) {
   echo $i;
   echo ". del af url_array: ";
   echo $url_array[$i];
   echo "<BR>";
}

?>

Med adressen

http://localhost/artikler/2957/2/index.htm

returnerer scriptet følgende til browseren:

1. del af url_array: artikler
2. del af url_array: 2957
3. del af url_array: 2
4. del af url_array: index.htm

I en kommende artikel kigger vi på det frygtede mod_rewrite modul, der kan mange spændende ting, eksempelvis sende forskellige klienter til forskellige steder, selvom den samme adresse benyttes.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Despec Denmark A/S
Distributør af forbrugsstoffer, printere, it-tilbehør, mobility-tilbehør, ergonomiske produkter, kontor-maskiner og -tilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Cloud & AI Festival 2025

Med den eksplosive udvikling indenfor cloud & AI er behovet for at følge med og vidensdeling større end nogensinde før. Glæd dig til to dage, hvor du kan netværke med over 2.400 it-professionelle, møde mere end 50 it-leverandører og høre indlæg fra +90 talere. Vi sætter fokus på emner som AI; infrastruktur, compliance, sikkerhed og løsninger for både private og offentlige organisationer.

17. september 2025 | Læs mere


IT og OT i harmoni: Sikring uden at gå på kompromis med effektiviteten

IT og OT smelter sammen – men med risiko for dyre fejl. Få metoder til sikker integration med ERP, kundesystemer og produktion. Tilmeld dig og få styr på forskellene og faldgruberne.

24. september 2025 | Læs mere


NIS2: Vi gør status efter tre måneder og lærer af erfaringerne

Vær med, når vi deler oplevelser med implementering af NIS2 og drøfter, hvordan du undgår at gentage erfaringerne fra GDPR – og særligt undgår kostbar overimplementering.

30. september 2025 | Læs mere