thomasaarhus Nybegynder

07. december 2004 - 21:39 Der er 3 kommentarer og
1 løsning

Regular Expression til at udtage html elementer

Jeg har brug for at finde alle <h1> elementer i et html dokument:

<h1> Tilfældigt h1 element </h1>

Og jeg troede at jeg kunne gøre det med dette regular expression:

<h1>.*</h1>

Desværre virker det ikke hvis der er linieskift imellem <h1> og </h1>, og jeg er bange for at der måske også er andre tegn, der ikke går ind under punktum (".").

Hvordan løser jeg det?

Vh Thomas

Synes godt om

arne_v Ekspert

07. december 2004 - 21:49 #1

Prøv med Pattern.DOTALL flaget

Synes godt om

arne_v Ekspert

07. december 2004 - 21:49 #2

Eksempel:

import java.util.regex.*;

public class H1Parse {
private static Pattern p = Pattern.compile("(?:<h1>)(.*?)(?:</h1>)", Pattern.DOTALL);

public static void findHeaders(String s) {
Matcher m = p.matcher(s);
while (m.find()) {
System.out.println("h1=" + m.group(1));
}
}

public static void main(String[] args) throws Exception {
findHeaders("<h1>xxx</h1>\r\nyyy");
findHeaders("<h1>xxx</h1>\r\nyyy\r\n<h1>zzz</h1>\r\nwww");
findHeaders("<h1>xxx</h1>\r\nyyy\r\n<h1>zzz\r\nzzz</h1>\r\nwww");
}
}

Synes godt om

thomasaarhus Nybegynder

07. december 2004 - 23:23 #3

Tak. Lægger du et svar?

Synes godt om

arne_v Ekspert

07. december 2004 - 23:24 #4

svar

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Java kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Programmering: Produktmixoptimering Af OBS i Java	34	23/05/202513:55	27/05/202518:32
Seleniumspørgsmål vedr. getText() Af mergelspir i Java	11	08/05/202516:32	08/05/202522:16
eclipse Af OBS i Java	0	02/05/202512:51	-
eclipse Af OBS i Java	14	27/04/202521:14	28/04/202521:28
eclipse Af OBS i Java	2	18/04/202517:14	18/04/202519:52

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

06:00

Morgen-briefing: Meta åbner algoritmen for forældre / Børsnoteret dansk tech-selskab fordobler indtjeningen / Regering overvejer at dele AI-gevinster med befolkningen

09:03

Et kinesisk kampfly i frit fald - og en verden, som vi slet ikke ønsker os

13/05

Nedtælling til skæbnesvanger messe for Apple: Det kan du forvente fra det enorme WWDC-show

13/05

Han opfandt Oculus Rift og står nu bag vildt AI-baseret våbenfirma: Har fordoblet sin værdi på et år - er nu 400 milliarder kroner værd

13/05

Netcompany-stifterne André Rogaczewski og Claus Bo Jørgensen skovler penge ind: Så meget scorede de i 2025

13/05

BitLocker kan knækkes på få minutter med en USB-stick: Sådan kan du beskytte din pc

13/05

Kæmpe-strejke kan snart lamme Samsung: Forhandlinger brudt sammen - 50.000 medarbejdere vil nedlægge arbejdet

13/05

Har ikke andre muligheder: Danske universiteter nødt til at betale 64 millioner kroner til Oracle i ny licens-afgift

13/05

Alle CISO'er er ramt af dette paradoks: Jo bedre arbejdet udføres, jo mindre værdifuldt fremstår det

13/05

Claus Rydkjær vil som ny topchef gennemtrawle hele NNIT-forretningen efter svagt kvartal: "Vi vender hver en sten"

13/05

EU får adgang til OpenAI's nye cyber-værktøj - vil følge udrulningen tæt og håndtere sikkerhedsbekymringer

Vis flere artikler

IT-JOB

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Medarbejdere til arkitekturledelsesteam for styring af Strategisk Arkitekturforum og Arkitekturløsningsforum i Forsvaret

Ringkjøbing Landbobank – Nordjyske Bank

Forretningsudvikler til procesoptimering

Jyske Bank

Senior Data Engineer til implementering af ny dataplatform

Region Midtjylland

Kan du sætte vores brugere og support i centrum, så bliv chef i en af landets største digitaliserings og it-afdelinger

TV2

Identity & Access Management Automation Engineer til IAM-teamet

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 23:24	Google sheets beregning udfra dato Af rickiegrayholm i Office & Kontorpakker
I går 18:09	Outlook Classic, lukker ikke Af mort1 i E-mail programmer
13/0520:48	Bred buet skærm vs. 2 skærme Af Nanarsi i Skærme
13/0518:07	Tilslut printer til netværk med WPS - hvis WPS slukkes på Router mistes forbindelse. Af Uvanga i Wifi
11/0521:05	Questyle M15i lydforstærker Af valby i Diverse

White papers

Find den SOC-model, der virker i praksis
SecureDevice
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta
E-fakturering bliver et krav – er din forretning klar?
Tabellae
Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta

Flere white papers »

Notifikationer

Regular Expression til at udtage html elementer

Log ind eller opret profil

Hov!