Avatar billede glvi93 Nybegynder
13. maj 2011 - 17:30 Der er 2 kommentarer og
1 løsning

Holde øje med robots.txt

Hej alle.
Har for nylig læst man kan sætte nogle robots.txt filer til på en måde at søge på nettet for en, så det begyndte at undre mig, om man kan lave sådan en fil, lægge den ud på en webside, også derefter få den til at "rapporterer" tilbage til ens computer hvad den har fundet, så jeg fx kan åbne en tekst fil og kigge hvad den har fundet?
Avatar billede wanze Nybegynder
13. maj 2011 - 17:44 #1
Du har misforstået, hvad robots.txt gør.

Web crawlers er computere, der er sat op til at søge på internettet efter specifikke sider og gemme referencer til dem baseret på indhold. Det er på den måde, at Googles indeks fungerer. Når du søger på Google, så kigger deres server i en kæmpe database over alle de hjemmesider, som deres web crawlers har besøgt.

Det robots.txt gør er at fortælle disse web crawlers, hvad man helst ikke ser indekseret. Hvis du fx har en privatmappe eller lignende, som du ikke umiddelbart ønsker at man skal kunne finde via Google, så sætter du stien til denne mappe i robots.txt.

Som eksempel kan du kigge på Ekspertens robots.txt, hvori du finder ting som fx Disallow: /cgi-bin/, hvilket betyder, at når en søgemaskines web crawlers besøger siden, så springer de (forhåbentlig) disse mappe over.
Avatar billede glvi93 Nybegynder
13. maj 2011 - 18:45 #2
Aha, så er jeg blevet det klogere.
Men gerne send svar :-)
Avatar billede wanze Nybegynder
13. maj 2011 - 19:28 #3
Svar.  :)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester