用java字符串方法去除HTML代码标签的问题

2024年11月18日 04:23
有4个网友回答
网友(1):

可以通过replaceAll方法进行字符串替换,之后替换的内容用正则表达式来匹配。举例

 String ss="

";

String ss=ss.replaceAll("<(/?\\S+)\\s*?[^<]*?(/?)>","<$1$2>");//通过只保留"<“后面的字符串,之后删除空格和后面的内容,快捷的实现去除操作(此方法通用于所有的标签去除,只需要传入不同的ss值)。

结果就是:

网友(2):

按照<> 一对对的遍历处理,如:处理

时,将第一个空格到倒数第二个字符之间的字符串删除即可。

网友(3):

试试这个

public class DelHTML {

public static void main(String[] args){
String html = "

";
System.out.println(removeInTag(html));
}

private static String removeInTag(String a) {
String reg = "\\s\\w+=\\\"[^\"]+\\\"";
//System.out.println(a.replaceAll(reg, ""));
return a.replaceAll(reg, "");
}
}

网友(4):

class Test {
public static void main(String [] a){
String ss="

";
String ss2=ss.replaceAll("(\\<\\w+\\s*)[^\\>]*", "$1");
System.out.println(ss2);

}
}