Java代码 [url=][/url]
- // 1、过滤掉所有script脚本的正则:
- content.replaceAll("<script[^>]*?>[\\s\\S]*?<\\/script>", "")
-
- // 2、过滤掉所有style的正则:
- content.replaceAll("<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>", "");
-
- // 滤掉所有html标签,保留p和br标签。
- content.replaceAll("</?(?!br|/?p)[^>]*>", "");
-
- // 4、指定字符串去重
- content = content.replaceAll("(?s)(\r\n)(?=[\r|\n]*\\1)", "");
-
- // 5、字符串去重
-
- content = content.replaceAll("(?s)(.)(?=.*\\1)", "");
-
- /* (?s) 开启单行模式 DOTALL 让. 号匹配任意字符
- (.) 任意字符 并捕获在第一组
- (?=.*\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容
- 这样子,如果这整个式子匹配到,表示,第一个捕获组内容在字符串中,至少出现两次,替换为 "" 空串. */
|
|