fjerne fontface-tags
Følgende kode fjerner de fleste word-generede tags fra en tekst-streng. Men den fjerner ikke fontface-tags. Når den får<FONT face="Times New Roman" color=#000000 size=3>Hello world</FONT>
skal den altså returnere
<FONT color=#000000 size=3>Hello world</FONT>
Er det muligt? (Jeg kan ikke finde ud af det :-)
function doCleanCode(code) {
// removes all Class attributes on a tag eg. '<p class=asdasd>xxx</p>' returns '<p>xxx</p>'
code = code.replace(/<([\w]+) class=([^ |>]*)([^>]*)/gi, "<$1$3")
// removes all style attributes eg. '<tag style="asd asdfa aasdfasdf" something else>' returns '<tag something else>'
code = code.replace(/<([\w]+) style="([^"]*)"([^>]*)/gi, "<$1$3")
// gets rid of all xml stuff... <xml>,<\xml>,<?xml> or <\?xml>
code = code.replace(/<\\?\??xml[^>]>/gi, "")
// get rid of ugly colon tags <a:b> or </a:b>
code = code.replace(/<\/?\w+:[^>]*>/gi, "")
// removes all empty <p> tags
code = code.replace(/<p([^>])*>( )*\s*<\/p>/gi,"")
// removes all empty span tags
code = code.replace(/<span([^>])*>( )*\s*<\/span>/gi,"")
return code
}
