Avatar billede alvion Nybegynder
19. december 2004 - 21:44 Der er 16 kommentarer og
2 løsninger

Google indekserer kun nogle få sider af website

Jeg har udviklet et site, på adressen http://www.allfirms.com. Sitet har nu kørt i nogle måneder men Google indekserer ikke alle sider, selvom de er tilgængelige via links (fra forsiden kan man klikke på linket "Product categories", og derfra er alle firma-sider tilgængelige igennem underkategorier).

Hvis jeg inde på Google søger på: site:www.allfirms.com, så kan man normalt se alle et websites sider.

Men f.eks. er http://www.allfirms.com/company/119 ikke med. Og der er mange sider, der ikke er med.

Nogen fornuftig forklaring?
Avatar billede bufferzone Praktikant
19. december 2004 - 21:57 #1
Jeg har kikker rundt i sitet, og kan ikke umiddelbart finde noget der skulle bekymre google. De dynamiske links er udemærket udformet (dem jeg har set).

Normalt er der følgende problemer:

Google bryder sig grundlæggende ikke om dynamsike sites. man er bange for at blive fanget i uendelige loops eller i et site der er udformet sådan at botten aldrig kommer ud, hvilket koster tid for google. Derfor begrændser google ofte den dybde de crawler dynamiske sites i. Jeg synes dog jeres links ser tilpas ikkedynamiske ud.

Kode som f.eks. javascript kan give botterne problemer hvis de bruges til f.eks. menuer. Det gør I og det kan være her problemet ligger. Jeg har kikket på koden og den ser ikke umiddelbart ud til at volde problemer, men jeg har ikke nær læst dem.

Ting der opfattes som forsøg på at skjule andet. Det kan være tekstfarver (samme tekst farve som baggrund) eller tekst størrelse, men det kan også være DIV konflikter eller layers. Jeg har ikke kunne finde problemer af nogen art hos jer.

Jeg ville gøre følgende.

Lav et site map der tilsikre at alle jeres sider kan nmås mned max 3 klik med musen fra jeres forside. Altså. 1. til jeres forside, 2. klik til sitemappen. 3. klik til undersiderne. Lav sitemappet som almindelig flad HTML og linket til den fra forsiden som almindeligt href link. Lad så dette være på jeres side til i er sikre på at googlebot har været forbi og set jeres sitemap. Hvis det ikke virker. så vend tilbage så prøver vi noget andet
Avatar billede erikjacobsen Ekspert
19. december 2004 - 22:23 #2
Du skal nok lige fjerne dine metatags-keywords - de vil blive opfattet som keyword
spam, og du vil blive betragtet som mindre seriøs.

Hvordan kan man nå http://www.allfirms.com/company/119 fra forsiden??
Avatar billede espersen Novice
19. december 2004 - 23:38 #3
"Title" bør også være individuelt tilpasset hver sides indhold.
Avatar billede alvion Nybegynder
20. december 2004 - 14:39 #4
erik -> Fra forsiden:
1) Klik på "Product categories"
2) Klik på "IT software"
3) Klik på "Software professional"
4) Klik på "Sarum Webbureau"

Mange tak alle tre. Alle gode forslag, som jeg vil forsøge. Jeg vender tilbage senere.
Avatar billede espersen Novice
25. december 2004 - 11:50 #5
En af bufferzones artikler skriver han desuden om et lille fil: robots.txt - Den mangler du !! - den er vigtig for bl.a. Google!
- her er et link om den ; http://www.searchengineworld.com/robots/

Meta bruges ikke så meget mere:
Hvis du benytter meta ; så læg kun de keywords ind som passer til den enkelte side!

læs følgende artikler:
http://www.eksperten.dk/artikler/82 (google)
http://www.eksperten.dk/artikler/76 (optagelse i søgemaskiner)
Avatar billede espersen Novice
25. december 2004 - 11:52 #6
Vigtige elementer for at blive fundet:
- valid kode
- skaf links
- robots.txt
- interne links / sitemap

brug de bedste søge ord : http://joyzone.dk/sw303.asp (dvs. tilpas evt. indholdet så de bedste ord fremgår af teksten
Avatar billede alvion Nybegynder
30. december 2004 - 14:07 #7
SKAL robots.txt findes, selvom jeg ikke ønsker at udelukke Google fra nogen områder?
Avatar billede erikjacobsen Ekspert
30. december 2004 - 14:10 #8
Nej, robots.txt er en lille indikation af seriøsiteten af sitet, som en søgemaskine
kan vælge at bruge til en lidt bedre vægtning. Det betyder kun lidt - men lidt har
sommetider også ret. Jeg har fx

# you're welcome, unless you're MSNbot
User-agent: msnbot
Disallow: /
User-agent: *
Disallow:
Avatar billede bufferzone Praktikant
30. december 2004 - 14:16 #9
Robots.txt bør være der, da det er det første alle seriøse søgemaskiner spørger efter. Som erik siger, så er det et tegn på  seriøsitet fre web masterens side., så søgemskinen ikke starter med en fejl
Avatar billede erikjacobsen Ekspert
30. december 2004 - 14:25 #10
Men det er ikke nødvendigt. Søg på google efter øllebrød. Den øverste (i mit forsøg) har ingen:
http://www.augustenborgsopskriftsamling.dk/robots.txt  (404-fejl)
Avatar billede alvion Nybegynder
30. december 2004 - 14:27 #11
Ok.

erik -> Hvorfor er det liiige at du ikke vil have MSN forbi? :-)
Avatar billede erikjacobsen Ekspert
30. december 2004 - 14:39 #12
Hvorfor? Der er vel ingen der bruger dem til at søge med, så det er overflødig traffik ;))
Avatar billede alvion Nybegynder
30. december 2004 - 21:26 #13
He he... Længe leve template systemer. Jeg har lavet et sæt templates til siderne, der tages i anvendelse, hvis User-agent er GoogleBot. Indholdet er det samme (næsten), men al javascript og andre liggyldigheder er fjernet.

I kan se resultatet med en alm. browser ved at tilføje parametren ?googlebot=on i url'en, f.eks:

http://www.allfirms.com/index?googlebot=on

Nu kan jeg så bare vente på Google's resultat.

Tak for hjælpen allesammen. Erik jeg beder dig nu (for the record) om at lægge et svar, og du får så de sædvanlige 3-4 timer til at ignorere min forespørgsel. Derefter deler jeg pointene ud... :-)
Avatar billede bufferzone Praktikant
30. december 2004 - 21:34 #14
Der er mange flere end msn man kan banne fordi de ikke giver trafik. Hvis du vil se en rigtig maximums robot.txt, der banner stort set alt overflødigt, så se her

http://www.webmasterworld.com/robots.txt
Avatar billede erikjacobsen Ekspert
30. december 2004 - 21:48 #15
Cloaking er set før, alvion. Måske er det ikke så sundt. Læs
fx pkt 10 på http://www.mikes-marketing-tools.com/marketing-tips/advanced-optimization.html
og læs gerne mere om det, før du bruger det for alvor.

Jeg samler ikke på point, tak.
Avatar billede bufferzone Praktikant
30. december 2004 - 21:52 #16
Hvis du ønsker at læse om cloaking, så har webmasterworld en del meget gode dokumenter om dette emne og andre. det kræver at du opretter dig som bruger, men det er et godt site, så du kan roligt gøre det
Avatar billede alvion Nybegynder
30. december 2004 - 21:58 #17
At kalde mit "trick" for cloaking er IMHO at gå lidt for vidt. Begge sider indeholder præcist det samme indhold. Den eneste forskel er, at jeg har fjernet al grafik, alle <table>-tags, al javascript (og indsat menupunkter som links istedet for som javascript menuer). Men Google finder ingen tekstindhold på den "cloakede" side, som ikke findes på den rigtige.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester