Avatar billede 2c Nybegynder
13. juli 2005 - 19:05 Der er 4 kommentarer og
1 løsning

Erstat alle html tags i en streng

Jeg har en string med text fra en html side. Jeg vil gerne fjerne alle html tags, og kun bevare indholdet. Hvordan lader det sig gøre? Jeg skal nok bruge Regular Expression, men hvordan gør jeg det ?
Avatar billede nielle Nybegynder
13. juli 2005 - 19:16 #1
using System;
using System.Text.RegularExpressions;

namespace e632396
{
    class Class1
    {
        [STAThread]
        static void Main(string[] args)
        {
            string dinTekst = "Er det bare mig, eller er <strong>Eksperten.dk</string> bare <ul>super</ul>?";

            Regex RE = new Regex("<.*?>");
            dinTekst = RE.Replace(dinTekst, "");

            Console.WriteLine(dinTekst);
        }
    }
}
Avatar billede arne_v Ekspert
13. juli 2005 - 19:39 #2
HTML er en rådden standard

hvis du ved at den HTML er rimelig simpel, så er nielles løsning
glimrende (jeg kunne have fundet på at bruge en for løkke + en switch med
'<', '>' og default, men alle veje fører til Rom - og niells kode er
betydeligt simplere)

hvis HTML'en indeholder mere obskure konstruktioner så kan det blive lidt svært
at beslutte hvad den rigtige løsning er og meget svært at implementere
logikken

XHTML vil du kunne genbruge en XML parser til og så er det nemt igen
Avatar billede 2c Nybegynder
13. juli 2005 - 19:48 #3
Tak. Det virkede.

Smid et svar :-)
Avatar billede nielle Nybegynder
13. juli 2005 - 19:51 #4
Svar :^)

PS: HTML-sider er iøvrigt også kendt for at indeholde andre konstruktioner - som f.eks. javascript. Sådan scriptkode vil blive stående (men nu som læselig klartekst). Der er ingen simpel løsning på hvordan man ville fjerne sådan noget.
Avatar billede 2c Nybegynder
13. juli 2005 - 19:58 #5
Hej arne. Jeg så ikke dit indlæg før jeg skrev min sidste kommentar.

Til begge.
Den html jeg skal fjerne er de fleste gange rimelig simpel, så nielles løsning er hvad jeg søgte. Det er i forbindelse med en RSS news/blog reader, jeg laver, og i det tilfælde kun den beskrivelse der står i RSS feedet at html'en skal fjernes(hvis der overhovedet er noget).

Det jeg laver er kun til personligt brug, så det gør ikke noget at det ikke virker optimalt hele tiden.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester