黑马程序员技术交流社区

标题: java正则表达式找出不包含特定字符串 [打印本页]

作者: major2015    时间: 2015-4-9 15:36
标题: java正则表达式找出不包含特定字符串
看到有同学询问这个都好几天了还没解决,就摆渡了哈,
以下纯属copy,
=======================================

正则表达式中有前瞻(Lookahead)和后顾(Lookbehind)的概念,这两个术语非常形象的描述了正则引擎的匹配行为。需要注意一点,正则表达式中的前和后和我们一般理解的前后有点不同。一段文本,我们一般习惯把文本开头的方向称作“前面”,文本末尾方向称为“后面”。
但是对于正则表达式引擎来说,因为它是从文本头部向尾部开始解析的(可以通过正则选项控制解析方向),因此对于文本尾部方向,称为“前”,因为这个时候,正则引擎还没走到那块,而对文本头部方向,则称为“后”,因为正则引擎已经走过了那一块地方。

如下图所示:

前瞻就是在正则表达式匹配到某个字符的时候,往“尚未解析过的文本”预先看一下,看是不是符合/不符合匹配模式。

后顾,就是在正则引擎已经匹配过的文本看看是不是符合/不符合匹配模式。符合和不符合特定匹配模式我们又称为肯定式匹配和否定式匹配

现在看它们的定义方法吧(零断言,不用管术语名称,翻译太拗口复杂了)
Java代码  
//前瞻  
(?=exp)真正有用的部分,在这个位置之前,之前的数据需要匹配exp  
(?<=exp)真正有用的部分,在这个位置之后,之后的数据需要匹配exp  
//后顾  
(?!exp)真正有用的部分,在这个位置之前,之前的数据不匹配exp  
(?<!exp)真正有用的部分,在这个位置之后,之后的数据不匹配exp  


开始写不含特定字符的正则

参考例子说明
Java代码  
         
String reg="^(?!.*(不合谐)).*$";//用到了前瞻  
        System.out.println("不管信不信,反正现在很不合谐".matches(reg));//false不通过  
        System.out.println("不管信不信,反正现在非常合谐".matches(reg));//true通过  
        System.out.println("不合谐在某国是普遍存在的".matches(reg));//false不通过  


上面就把含有特定字符的句子完全抹杀了,实现了完全和谐社会。。。。。

上面例子是特定字符在任意位置出现都会匹配
现在某国突然良心发现皇恩浩荡开放部分言论
只想实现不以特定字符结尾的句子
我们套用上面的例子,稍微改下
Java代码  
         
String reg="^.*(?<!(不合谐))$";//用到了后顾  
        System.out.println("不管信不信,反正现在很不合谐".matches(reg));//false不通过  
        System.out.println("不管信不信,反正现在非常合谐".matches(reg));//true通过  
        System.out.println("不合谐在某国是普遍存在的".matches(reg));//true通过  


现在第三条数据这么不和谐的数据也通过
人民可以说些话了,某国也可以辟谣了
五毛们也有工作量了,也多少增加了GDP的发展吧

连接网址http://xixian.iteye.com/blog/1323630
作者: major2015    时间: 2015-4-9 15:38
额,图都不见了,看原文吧    http://xixian.iteye.com/blog/1323630
作者: zouxx    时间: 2015-4-9 16:12
嘿嘿,看你博客去、、
作者: cat73    时间: 2015-5-3 10:30
感觉还是下面这份资料讲的比较清晰
http://www.imkevinyang.com/2009/08/%E4%BD%BF%E7%94%A8%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E6%89%BE%E5%87%BA%E4%B8%8D%E5%8C%85%E5%90%AB%E7%89%B9%E5%AE%9A%E5%AD%97%E7%AC%A6%E4%B8%B2%E7%9A%84%E6%9D%A1%E7%9B%AE.html
他总结的感觉比较晦涩难懂




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2