黑马程序员技术交流社区
标题:
正则表达式过滤
[打印本页]
作者:
15670379287
时间:
2016-4-5 22:14
标题:
正则表达式过滤
Java代码
[url=]
[/url]
// 1、过滤掉所有script脚本的正则:
content.replaceAll("<script[^>]*?>[\\s\\S]*?<\\/script>", "")
// 2、过滤掉所有style的正则:
content.replaceAll("<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>", "");
// 滤掉所有html标签,保留p和br标签。
content.replaceAll("</?(?!br|/?p)[^>]*>", "");
// 4、指定字符串去重
content = content.replaceAll("(?s)(\r\n)(?=[\r|\n]*\\1)", "");
// 5、字符串去重
content = content.replaceAll("(?s)(.)(?=.*\\1)", "");
/* (?s) 开启单行模式 DOTALL 让. 号匹配任意字符
(.) 任意字符 并捕获在第一组
(?=.*\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容
这样子,如果这整个式子匹配到,表示,第一个捕获组内容在字符串中,至少出现两次,替换为 "" 空串. */
作者:
1833495284
时间:
2016-4-5 22:22
顶顶顶,水水水水
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2