Informationer fra adfærd
Der er ikke nogen entydig grænse for, hvad man kan udtrække af informationer ud fra en kortlægning af ens brugeres adfærd på websitet. Det afhænger af, hvor tæt man vil følge brugerne. Nogle informationer kan hentes ved at analysere den logfil, webserveren genererer løbende, mens andre kræver mere sofistikerede metoder.
Den simple analysetype, baseret på webserverens logfiler, kan dog også give nyttige informationer:
- Sidevisninger
Sidevisninger, også kendt som hits, er det antal gange en side er blevet vist i en browser. Navnene eksponeringer eller impressions benyttes også, men dækker egentligt over viste banner-reklamer eller andre typer af annoncer. - Browsere og platforme
Disse oplysninger kan være særdeles vigtige. Hvis en stor del af ens brugere benytter ældre browserversioner, er det ikke nogen god ide at udvikle til den nyeste og smarteste browser. - Fejl
Hvis der er døde links på websitet dukker det op i logfilen som 404-fejl (File not found) i logfilen. Hvis eksterne sider linker til en ældre version af websitet, vil det også fremgå her, og det kan for eksempel benyttes til at gøre de eksterne webmastere opmærksomme på sidernes nye placering. - Henvisninger
Sammen med forespørgslen sender browseren også adressen på den side, brugeren kom fra - referer-siden. Denne information kan benyttes til at se, hvem der linker til ens sider.
De mere sofistikerede metoder, som bygger på cookies, kan give nogle resultater, som oftest er mere nyttige end de ovenstående. Det drejer sig i særdeleshed om to nøgletal:
- Unikke brugere
Antallet af forskellige brugere som besøger websitet indenfor en given tidshorisont, som regel 30 minutter. - Brugersessioner
Antallet af besøg fra unikke brugere som defineret ovenfor.
Cookies eller IP
Cookies, transparente giffer eller IP-numre
Som sagt findes der to måder at skaffe sig trafikinformation på. Den simple måde er at benytte de oplysninger, som webserveren gemmer i sin log-fil. Den anden metode benytter cookies eller objekter som transparente gif-billeder eller Java-applets til at identificere brugere mere nøjagtigt.
Problemet ved kun at benytte logfiler som analysegrundlag, er at HTTP-protokollen som udgangspunkt er tilstandsløs. Det vil sige, at som udgangspunkt ser webserveren hver enkel forespørgsel som en isoleret hændelse. For at følge en bruger over flere forespørgsler, skal man benytte cookies. Man kan altså ikke benytte logfilen til at udlede antallet af unikke brugere eller brugersessioner.
Nogle log-analyseprogrammer prøver at analysere sig frem til unikke brugere og brugersessioner via de oplysninger, der bliver registreret i logfilerne, men det sker ved at benytte kvalificerede gætterier, som for eksempler, at én bestemt browser på ét bestemt IP-nummer identificerer en bestemt bruger. Det er ikke en rimelig antagelse, da personer, der sidder bag en firewall og benytter den samme browser og styresystem, alle vil tælle som én enkel bruger.
Ved hjælp af cookies eller andre typer af tilstandsbærende elementer kan man derimod identificere hver enkel bruger og følge deres adfærd. Der findes andre løsninger, som for eksempel Microsoft Site Server, der kan give endnu mere raffinerede informationer om brugerne, hvilket kan være særdeles vigtigt i forbindelse med e-handel.
Værktøjer
Værktøjer
Der findes en stor mængde værktøjer til loganalyse, lige fra freeware-scripts til dyre programpakker. Til cookie-baseret analyse findes der også en stor mængde software-løsninger og eksterne tjenester. Vi har kigget på to repræsentative loganalyse-programmer af slagsen i hver sin ende af spektret.
Den billige løsning er programmet Analog, der praler af at være det mest udbredte log-analyseprogram, der findes. Under Windows afvikles det som et DOS-program, og det kræver en del roden rundt med konfigurationsfilerne for at få programmet til at spille.
Efter opsætningen er fuldført, og det tog lidt tid med vores standard Apache logfil, så genererer det en fyldestgørende rapport i form af HTML-sider. Her er alle de resultater, man kan forvente at få, repræsenteret.
Analyse af logfilerne kan generere store mængder information, der dog ikke altid er lige anvendelig. Her er det gratis-programmet Analog.
I den anden ende af prisskalaen findes det populære program WebTrends, og en funktionel demo-version kan downloades fra producentens hjemmeside.
WebTrends genererer også en HTML-rapport og forsøger at give bud på antallet af unikke brugere og brugersessioner, men som tidligere nævnt er resultaterne ikke troværdige, når de kun baserer sig på loganalyse.
WebTrends genererer store, grafisk rige rapporter.
Man kan læse mere om trafikanalyse I følgende artikel på Webmonkey:
Log File Lowdown.