30. juli 2009 - 11:00Der er
9 kommentarer og 2 løsninger
Sikring mod crawlers
Jeg udvikler på en webshop som skal sikres mod at konkurrenter kan crawle vores priser. Prisen må derfor ikke stå direkte i kildekoden, men skal udregnes med Javascript på den ene eller anden måde.
Jeg er ikke helt klar over hvordan jeg skal gribe det an, så er der nogen der har erfaring med det eller kan give et bud på en løsning?
I dette særtema om aspekter af AI ser vi på skiftet fra sprogmodeller til AI-agenter, og hvordan virksomheder kan navigere i spændet mellem teknologisk hastighed og behovet for menneskelig kontrol.
Jeg ville nok få fat på et image komponent til serveren, også udskrive prisen via et billede. Men så er du over i serverside sprog i stedet (php, asp eller hvad du nu bruger)
fennec: Det var en mulighed med billeder. Jeg vil dog prøve at se om jeg kan finde en Javascript løsning der er kryptisk nok til at konkurrenterne skal bruge langt tid på at gennemskue den.
Det eneste jeg har i hånden er produktets pris, og det er den der skal fjernes fra HTML-kilden. Jeg forestiller mig noget i stil med at delete prisen op i to, videregive dem til Javascript og derefter lægge dem sammen igen i Javascript og indsætte hvor prisen skal stå på hjemmesiden. Men den er lidt for simpel at gennemskue, så derfor spørger jeg herinde om der er nogen forslag.
Hvis det er 100% maskinelle crawlers, er det ligegyldigt, hvor simpel, din kode er at gennemskue - de læser ikke JS.
Hvis det er crawlers, der manuelt er sat op til at crawle bestemte sider og parse deres HTML for at hive info ud - og det er vel det eneste realistiske - kan du ikke gøre noget med JavaScript, som ikke er simpelt og nemt at gennemskue.
Det klogeste, du kan gøre, er nok at indse, at det er på Internettet din webshop ligger - og så indrette sig på dén virkelighed. Det betyder bl.a, at alle har adgang til dine informationer, som derfor også vil være crawlbare.
I betragtning af, hvad dét har givet os af fantastiske overvågnings og prissammenlignings værktøjer, er holdningen hos dine brugere formodentlig som hos 99% af WWW's andre brugere: "Gud være lovet for det!" ;o)
Der kan selvfølgelig være en grund til at netop din shop skal beskyttes mod crawlere, og er det som olebole siger rettet mod helt bestemte personer (der virkelig ønsker informationerne), eller mere automatiske crawler, er 2 helt forskellige ting.
Automatiske kan snydes med meget få midler, hvorimod specifikke "angreb" aldrig vil kunne forhindres, hvis de har midlerne. Selv billeder kan analyceres og kodes tilbage til tekst og tal.
Er det specifikke angreb, er billeder din bedste løsning, da det kræver analyse software. Med en ren JS løsning kan de finde decode funktionen direkte i din kildekoden, og derfor ikke den store udfordring.
Så hvad snakker vi er påkrævet?? Simpel eller advanceret?
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.