Avatar billede nopainnogain Nybegynder
05. juni 2005 - 21:16 Der er 6 kommentarer og
1 løsning

gemme indholdet af en hjemmeside som String

Hej jeg er rimelig ny indenfor javaprogrammering, så svaret må gerne være skåret ud i pap :-)

Jeg skal ind og aflæse rigtig mange hjemmesider til nogle statistiske data. Jeg har indtil nu leget med at oprette et objekt af Robot-klassen og lade denne "trykke" ctrl + "V" for mig for herefter at gå til et tekstarray og sætte teksten ind.

Er det ikke muligt at suge teksten direkte ud af en hjemmeside og gemme den som en String?
Avatar billede arne_v Ekspert
05. juni 2005 - 21:40 #1
private String get(String urlstr) {
        StringBuffer res = new StringBuffer("");
        try {
            URL url = new URL(urlstr);
            HttpURLConnection con = (HttpURLConnection) url.openConnection();
            con.setRequestMethod("GET");
            con.connect();
            if (con.getResponseCode() == HttpURLConnection.HTTP_OK) {
                BufferedReader br = new BufferedReader(new InputStreamReader(con.getInputStream()));
                String line;
                while ( (line = br.readLine()) != null) {
                    res.append(line);
                    res.append("\r\n");
                }
                con.disconnect();
            }
        } catch (IOException ex) {
            ex.printStackTrace();
        }
        return res.toString();
    }
Avatar billede nopainnogain Nybegynder
07. juni 2005 - 16:25 #2
Tak, det var en interessant kode. Det løste ikke helt mit problem, men gav mig en anden idé som virker. Tusind tak for hjælpen. Nu mangler jeg bare at hitte ud af hvordan jeg accepterer svaret, så du får dine point.
Hav en god dag, NPNG.
Avatar billede nopainnogain Nybegynder
07. juni 2005 - 16:30 #3
hmm
Avatar billede nopainnogain Nybegynder
07. juni 2005 - 16:32 #4
det ser ud som om at jeg ikke kan give dig point Arne, før du har indlagt et svar istedet for en kommentar.
Avatar billede arne_v Ekspert
07. juni 2005 - 16:46 #5
svar kommer her
Avatar billede nopainnogain Nybegynder
11. juni 2005 - 09:31 #6
Lige et tillægsspørgsmål :-)

Koden arne viste, gemmer HTTP koden som tekst.
Jeg er egentlig kun interesseret i at gemme den tekst, som står på skærmen, når siden åbnes med en browser.
Avatar billede arne_v Ekspert
11. juni 2005 - 09:37 #7
Det er jo ikke til at gemme i en tekst streng hvordan noget bliver
vist i en browser.

Men spørger du reelt om hvordan du fjerner alle HTML tags og kun får rå teksten ?
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester