RegEx: Jeg søger et RegExp udtryk der rammer følgende
Hej med jer...Jeg ved ikke rigtigt om dette spørgsmål burde være her, men da jeg ikke kan se at der er et RegExp forum på eksperten, og jeg i øvrigt koder mit program i C# så er mit spørgsmål altså endt her.
Jeg har (lettere simplificeret) en række strenge som er på en af følgende former:
1) "<p>brødtekst1</p><h1>Overskrift<h1><p>brødtekst2</p>"
2) "<p>brødtekst1<h1>Overskrift</h1>brødtekst2</p>"
Jeg vil gerne have at alle strengene følger form 1, så alle overskrifterne er udenfor <p>-tagsene.
For at gøre ting besværlige, kan brødteksterne godt indeholde html tags som f.eks. "<br />" eller andet snask, så "<>" tegnene er altså IKKE meget bevendt at teste på.
Jeg er selv nået frem til følgende:
Regex regExH1 = new Regex(@"(\w)(\s*<h3>.+</h3>\s*)(\w)");
myString = regExH3.Replace(myString, "$1</p>$2<p>$3");
...men det virker kun hvis sidste tegn inden og første efter overskriften er alfanummerisk (hvilket de ikke altid er!)
Er der nogen af jer kloge åger der ude i det ganske danske land der kan komme op med et RegExp der vil kunne gøre tricket for mig? :/
/o-zone
