Avatar billede eonix Nybegynder
28. august 2007 - 13:02 Der er 3 kommentarer og
1 løsning

Download HTML med Java

Hej folkens,

Jeg står og har skrevet et program i C# der henter en hjemmeside ned og gemmer den rå html data i en string som jeg så kan arbejde og filtrere lidt på. Jeg er blevet pålagt at lave systemet om til Java men mangler lidt hjælp til at få downloaded HTML'en som det første...

Er der nogle der ligger inde med eksempler på hvordan man i java henter HTML'en fra en hjemmeside og f.eks. gemmer html'en i en string?

Håber i kan hjælpe

//EoniX
Avatar billede eonix Nybegynder
28. august 2007 - 13:11 #1
Hmm jeg fandt lige denne som jeg lige vil prøve at bruge først. :)

http://www.eksperten.dk/spm/91996

Ser ganske fornuftigt ud - men jeg melder tilbage om det fungere for mig.

//EoniX
Avatar billede arne_v Ekspert
28. august 2007 - 15:47 #2
Jeg bruger normalt noget a la:

          URL url = new URL("http://www.xxxx.dk/");
          HttpURLConnection con = (HttpURLConnection) url.openConnection();
          con.connect();
          int status = con.getResponseCode();
          if (status == HttpURLConnection.HTTP_OK) {
              InputStream is = con.getInputStream();
              byte[] b = new byte[10000];
              int n;
              while ((n = is.read(b)) >= 0) {
                ...
              }
              is.close();

eller:

          URL url = new URL("http://www.xxxx.dk/");
          HttpURLConnection con = (HttpURLConnection) url.openConnection();
          con.connect();
          int status = con.getResponseCode();
          if (status == HttpURLConnection.HTTP_OK) {
              InputStream is = con.getInputStream();
              BufferedReader br = new BufferedReader(new InputStreamReader(is));
              String line;
              while ((line = br.readLine())) != null) {
                ...
              }
              is.close();
Avatar billede eonix Nybegynder
14. august 2009 - 11:29 #3
Kode eksemplet som jeg fandt fungerede også - men tak Arne :)
Avatar billede arne_v Ekspert
14. august 2009 - 22:14 #4
Det er grundliggende samme teknik, men det er godt at:
* teste på HTTP status
* bruge en buffer
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester