A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

本帖最后由 刘云东 于 2013-4-4 23:43 编辑

如题,简单介绍一下,调用的方法,以及遍历所有找到的值,如有多种使用方法,尽量发出来。
还有介绍一些常用正则表达式的语法,顺便贴一下正则的语法规则。万分感谢。

5 个回复

正序浏览
正则表达式,匹配中文字符、手机号、Email地址、网址URL、HTML标记、国内电...
常用正则表达式,匹配中文字符、Email地址、网址URL、HTML标记、国内电话号码、邮政编码和ip地址等等

最新手机号:

r'^(13[0-9]|15[0|3|6|7|8|9]|18[8|9])\d{8}$'

只含有汉字、数字、字母、下划线,下划线位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$

匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了

匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行

匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用 例如:if(!/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/.test(email))

匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用

匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
评注:匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始

匹配中国邮政编码:[1-9]\d{5}(?!\d)
评注:中国邮政编码为6位数字

匹配身份证:\d{15}|\d{18}
评注:中国的身份证为15位或18位

匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用

匹配特定数字:
^[1-9]\d*$    //匹配正整数
^-[1-9]\d*$   //匹配负整数
^-?[1-9]\d*$   //匹配整数
^[1-9]\d*|0$  //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$   //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正

匹配特定字符串:
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
回复 使用道具 举报
工作中一般都是从网上找现成的。熟悉怎么用就可以了;
正则表达式中的转义符也是\,如果要出现一个字符,这个字符呢又是“元字符”,这时为了让元字符,系统不认为是“元字符”,就需要将元字符转义。
元字符1:
通用字符 . :表示任意一个字符;任意个.就表示任意个字符;
选择字符: [] :凡是在这个括号中的东西都可以匹配,但是记住一对中括号只表示一个字符;例如:foo[dt]可以匹配food或者foot
逻辑或 | :表示逻辑或,但是特别注意优先级的问题;优先级最低;例如food|t 如果是foot的话则只能匹配字母t;但是如果你想改变优先级的话可以使用圆括号foo(d|t)此时先匹配foo,紧接着匹配要么是d要么是t
优先级与分组 () :表示调整优先级与分组;
限定符:
*:表示紧挨着*的前一个字符出现零次到多次;例如abcd*则表示匹配abc(此时d出现零次次)或者abcd(此时d出现一次)或者abcddddddd........(此时d出现多次,任意次数)
+:表示紧挨着+的前一个字符出现一次到多次; 例如”下一站是.+”     “.”表示任意一个字符,这句话就是说可以匹配前面是“下一站是”后面任意个字符;匹配邮箱如  .+@.+就可以匹配邮箱地址表示
?:表示紧挨着?的前一个字符出现零次或者一次例如http(s)?://.+
{n}:表示括号前面的字符重复n次;例如w{3}匹配的是www
{n,}:表示括号前面的字符至少重复n次;而{n,m}表示的是括号前面的字符出现n到m次数;
注意:*表示{0,},+表示{1,},?表示{0,1},注意在正则表达式中即使在难看也不要加空格
开头与否定:^ 1.限定必须开头匹配2.在[]中使用表示不出现里面的字符
结束与编组:$ 1.限定必须结束匹配2.在分组后引用数据;这两个一般多用在验证方面。
数字与非数字:\d   和\D    digital
空字符与飞空字符:\s  和\S    space
文字与非文字:\w    和\W   word
正则表达式用到的地方:1.是否匹配2.字符串提取3.替换
正则表达式的命名空间是System.Text.RegularExpressions,常用到的类有Regex  Match  Group  MatchCollection   GroupCollection  常用到的方法
Regex.IsMatch(字符串,正则表达式),返回的是一个bool值,判断一个字符串是否匹配某个正则表达式
Regex.Match();//从某个字符串中提取匹配正则表达式的某个子字符串(只能提取一个)
Regex.Matches();//字符串循环提取,可以提取所有匹配的字符串
Regex.Replace();//字符串替换,把所有匹配正则表达式的字符串替换为对应的字符串

点评

很给力,谢谢你的回答。  发表于 2013-3-30 19:37
回复 使用道具 举报
收藏了~~~~~
回复 使用道具 举报
一些常用的C#正则表达式:
"^\d+$"  //非负整数(正整数 + 0)

"^[0-9]*[1-9][0-9]*$"  //正整数

"^((-\d+)|(0+))$"  //非正整数(负整数 + 0)

"^-[0-9]*[1-9][0-9]*$"  //负整数

"^-?\d+$"    //整数

"^\d+(\.\d+)?$"  //非负浮点数(正浮点数 + 0)

"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数

"^((-\d+(\.\d+)?)|(0+(\.0+)?))$"  //非正浮点数(负浮点数 + 0)

"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数

"^(-?\d+)(\.\d+)?$"  //浮点数

"^[A-Za-z]+$"  //由26个英文字母组成的字符串

"^[A-Z]+$"  //由26个英文字母的大写组成的字符串

"^[a-z]+$"  //由26个英文字母的小写组成的字符串

"^[A-Za-z0-9]+$"  //由数字和26个英文字母组成的字符串

"^\w+$"  //由数字、26个英文字母或者下划线组成的字符串

"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"    //email地址

"^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"  //url


只能输入数字:“^[0-9]*$”
只能输入n位的数字:“^\d{n}$”
只能输入至少n位数字:“^\d{n,}$”
只能输入m-n位的数字:“^\d{m,n}$”
只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”
只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”
只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”
只能输入非零的正整数:“^\+?[1-9][0-9]*$”
只能输入非零的负整数:“^\-[1-9][0-9]*$”
只能输入长度为3的字符:“^.{3}$”
只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”
只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”
只能输入由26个小写英文字母组成的字符串:“^[a-z]+$”
只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”
只能输入由数字、26个英文字母或者下划线组成的字符串:“^\w+$”
验证用户密码:“^[a-zA-Z]\w{5,17}$”正确格式为:以字母开头,长度在6-18之间,
只能包含字符、数字和下划线。
验证是否含有^%&',;=?$\"等字符:“[^%&',;=?$\x22]+”
只能输入汉字:“^[\u4e00-\u9fa5],{0,}$”
验证Email地址:“^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”
验证InternetURL:“^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$”
验证电话号码:“^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$”
正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
验证身份证号(15位或18位数字):“^\d{15}|\d{}18$”
验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正确格式为:“01”“09”和“1”“31”。
回复 使用道具 举报
支持一下,分留给别人吧
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马