19. oktober 2007 - 19:34Der er
10 kommentarer og 1 løsning
HttpWebRequest / HttpWebResponse problem med frames?
Jeg laver lidt screen scraping (NB efter aftale med sitet) og benytter hertil de kendte teknikker uden problemer. Dog ikke når siden indeholder frames. I det tilfælde returneres hovedsiden med frameset i stedet for siden med incl. indhold indlæst i hver enkelt frame. Er der nogen der kan hjælpe?
Eller sagt med andre ord... Et request henter kun een fil af gangen. En typisk hjemmeside består af mange filer, og den skal derfor hentes af flere requests, et request-pr-fil. Det er i den sammenhæng ligegyldigt at de samlet fremstår i din browser som om at de hører pænt sammen som en "side" - det er stadigvæk enkelt filer der skal hentes.
Men hvorfor vil du overhvoedet have alt sammen? Skal du ikke specifikt have fat i en specifik side - den hvor der er noget intessant indhold til din screenscarping?
Svar til nielle: Mit udgangspunkt for at få fat i det indhold, jeg er interesseret i, er et antal links til flere forskellige hjemmesider (igen alt efter aftale med indehaverne af hjemmesiderne). Derfor ville det være rart, at kunne fremfinde en hvilken som helst sides indhold ved hjælp af linket alene uden at skulle lede efter evt. frames, som måske oven i købet i nogle tilfælde igen indeholder frames d.v.s. noget rekursiv kode.
Jag kan såmæn godt forstå hvorfor du gerne ville have det på den måde, men sådan fungere det desværre ikke: En fil == en request.
Det *kan* være at de har en noframes-løsning... Det er ikke særligt sandsynligt nu om dage, hvor der stort set ikke er noget behov for at understøtte browsere, som ikke har understøttelse for frames. Men hvis de har det, så kunne en løsning á la den som dr_chaos skitsere måske bruges: den lader populært sagt som om at den er en af de der tusse-gamle browsere som ikke kan forstå frames.
Personligt ville jeg nok i stedet lave funktionaliteten, med at downloade frames og de indgående filer, en gang for alle og pakke den pænt ind i en funktion som jeg så i fremtiden kunne kalde med sidens url uden at spekulere mere over det. :^)
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.