Notifikationer

Markér alle som læst Log ud

zurekk Nybegynder

15. maj 2008 - 15:15 Der er 8 kommentarer og
1 løsning

Look-behind problem.

Hej Eksperter,

Jeg har til opgave, at lave et script som fanger og fjerner halve html-tags. Mit problem er så bare, at RegEx ikke tillader RegEx inde i look-behinds.

Jeg havde tænkt mig noget ala:
#(?<!<(\w+)>.*?)</\1>#is (simpel udgave)

Men som I kan se, vil det ikke virke. Så er der andre måder at gøre det på?

Det den skal gøre er at fjerne tags som disse:
"Lille Lise gik sig en tur."
"Lille Lise gik sig en tur."
"Lille Lise gik sig en tur."

På forhånd tak!

Synes godt om

nielle Nybegynder

15. maj 2008 - 15:43 #1

Det er nu specifikt PHP's variant af regsxp som ikke tillader regexp af *varierende* længde i en look-behind. Havde regexp'en været af fast længde (altså uden .*), ville PHP have accepteret den. Andre programmerings-sprog har ikke denne mangel i deres regexp-variant - man man f.eks. godt gøre det i .NET.

Du giver nogle eksempler på tags der skal fjernes - imidlertid er det de relativt pæne eksempler. Hvad skal der f.eks. fjernes her?

abc defghi jkl
abc defghijkl mno

Jeg mener imidlertid ikke at opgaven er specielt velegnet til at blive løst lige med regexp. Du kan måske bruge regexp til at finde selve tags'ene, men optælling af start- og slut-tags er nok bedre gjort i almindelig PHP kode.

Synes godt om

zurekk Nybegynder

15. maj 2008 - 15:53 #2

Hej Nielle,

Dit andet eksempel løses allerede i mit script. På eksempel et, er det ligegyldigt hvilken close-tag den fjerner, så længe kun tags der åbnes og lukkes(...), bliver tilbage.

Synes godt om

nielle Nybegynder

15. maj 2008 - 17:33 #3

Det er da vel ikke totalt ligegyldigt hvordan resultatet ser ud bagefter? Så kunne du jo bare slette samtlige tags.

Synes godt om

zurekk Nybegynder

15. maj 2008 - 17:42 #4

Nej. Det er ligegyldigt hvilken closing-tag der fjernes. Hvis der findes et open-tag, og to closing-tags. Altså som i "abc defghi jkl". Er det umuligt at fjerne den sidste, så fjern bare den første. Så længe der kun er "...." tilbage.

Det der er lettest :)

Synes godt om

nielle Nybegynder

15. maj 2008 - 18:09 #5

Det er vel ikke et spørgsmål om hvad der er lettest, men om hvad der er mest korrekt.

Det er f.eks. ikke lige korrekt HTML-kode der kommer ud af om du sletter den eller eller dan anden her:

a <div> b c d </div> e f

Men som sagt mener jeg ikke at det er en opgave der passer specielt som fod-i-hose til regexp.

Synes godt om

zurekk Nybegynder

15. maj 2008 - 18:22 #6

Det er muligt, at den bedste løsning ville være en blanding af både regexp og php. Men lige pt. er det noget jeg gerne vil ordne med regexp. Kan du hjælpe mig med det?

Og ja, det er rigtigt, at det ville være smartest at fjerne den sidste, det ville jeg også foretrække. Men uanset om du fjerner den første, eller anden, vil det blive ordnet i mit script senere hen. Det er ikke sådan at jeg kører min tekst igennem det script, som du forhåbentlig kan hjælpe mig med, og så skulle det være fixet. Der ligger meget mere bag det, som jeg dog selv står for.

Det jeg skal bruge, er bare et script, som finder closing-tags, som ikke er blevet startet. Derfor skulle: "Lille Lise gik sig en tur.", gerne ende med at se således ud: "Lille Lise gik sig en tur.".

Jeg håber, at det er noget som du kan hjælpe mig med.

Synes godt om

zurekk Nybegynder

16. maj 2008 - 12:10 #7

Jeg giver tråden et par timer, og så lukker jeg :-)

Synes godt om

zurekk Nybegynder

16. maj 2008 - 23:17 #8

Okay then..

Synes godt om

nielle Nybegynder

17. maj 2008 - 09:07 #9

Ok, en smule utålmodig?

Nej, jeg tror faktisk ikke at denne bare kan klares med regexp og intet andet.

En mulig løsning kunne være at matche alle tags med en tilsvarende slut-tag:

... <tag attr="42"> ... <tag> ... </tag> ...
... *************** ... <tag> ... ****** ...

og ændre dem midlertidigt sådan at de ikke er tags mere - f.eks. til:

... [tag attr="42"] ... <tag> ... [/tag] ...

Fortsæt med dette til at der ikke mere er nogen tags som kan "fjernes". Slet så de tags der er tilbage:

... [tag attr="42"] ... ... [/tag] ...

- og ret derefeter tilbage til rigtige tags:

... <tag attr="42"> ... ... </tag> ...

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Andet programmering kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Bat file. Af johnnylassen i Andet programmering	4	23/04/202616:10	24/04/202609:43
Hjælp til Api.asmx Af lurup i Andet programmering	1	17/03/202609:27	17/03/202614:12
burgermenu til hjemmeside - hjælp! Af SabrinaL i Andet programmering	2	12/11/202514:10	02/12/202520:42
Hjælp til programmering af website Af hamdenlange i Andet programmering	16	17/08/202522:26	19/08/202515:53
Kan man registrere hvis folk lukker en side ned Af KurtG i Andet programmering	8	24/07/202513:06	28/07/202517:03

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

03/07

Test: Denne robot-støvsuger er kompakt og kapabel – fås lige nu til kuppris

03/07

En af it-branchens største superstjerner fandt sin inspiration i København: Nu kommer han til byen igen

03/07

Kun tre uger efter patch: Nu advarer Cisco om at kritisk sårbarhed aktivt bliver udnyttet

03/07

Nørgaard: Hvorfor i alverden skal vi styre noget, der ikke kan styres?

03/07

Dette firma skal stå for kæmpe ERP-projekt i Region Syddanmark: Tegner kontrakt til 300 millioner kroner

03/07

Amazon lancerer ny stor-konkurrent til Elon Musk og Starlink

03/07

Efter hård kritik: Nu vil Statens It rette op på sine sikkerheds-problemer - her er planen

03/07

19 midtjyske kommuner har valgt at indgå i aktieselskab om fælles it-drift: Her er de væsentligste problemstillinger

03/07

Betaler prisen for opkøb: Unit IT lander endnu et underskud – sådan vil ny topchef vende skuden

03/07

Derfor ejer verdens mest værdifulde virksomheder overraskende lidt

03/07

Microsoft i kæmpe sats: Åbner helt ny milliardvirksomhed med tusindvis af it-specialister

Vis flere artikler

IT-JOB

Octocube Games ApS

CIFI Developer

Netcompany A/S

Data Management Consultant

KMD A/S

Business analyst

STELLA CARE ApS

Backend-udvikler (AI-Native)

Forsvaret

Projektkoordinator til operative kapacitetsprojekter

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 18:58	Mellemled til forsendelse fra Tyskland Af nu_igen i E-handel
I går 12:44	Lenovo ThinkPad X1 Yoga Af mort1 i PC
03/0710:40	Dagens vits fra AI Af nu_igen i Andet software
03/0710:28	Stifinder gemmer de sidste 20 åbnede dokumenter, nu er de pludselig væk. Af Uvanga i Windows
01/0715:18	Min PC kan nu ikke se den ekstra skærm Af KurtG i Windows

White papers

Dine data ligger i Europa – men hvem har reelt kontrollen?
Keepit
Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta
De spørgsmål 200+ danske virksomheder stiller om print – samlet i én guide
Konica Minolta

Flere white papers »