黑马程序员技术交流社区

标题: 关于在使用split()方法时,遇到转义字符的一些疑问 [打印本页]

作者: 李尧    时间: 2013-3-18 17:10
标题: 关于在使用split()方法时,遇到转义字符的一些疑问
本帖最后由 李尧 于 2013-3-18 18:00 编辑
  1. String str="a.b.c";
  2.                 String[] strs=str.split("\\.");
复制代码
代码如上,我想用 点 来分割字符串,必须用"\\."才能得到想要的结果.百度了一下 说 .和|是转义字符,就没有然后了.说得不清不楚.
我自己测试一下,用str.split("."); 分割的结果是[, a , . , b, . , c] 而不是 [a ,b , c];
于是我猜测 这是不是跟"\"类似,编译器不知道 到底是路径分隔符还是字符串\,所以要写成"\\"
我的问题是,为什么这里要写成"\\." 写成"\."则编译无法通过,  是不是"\."也有什么特殊含义? "\|" 是不是也有特殊含义?求高人指点.

作者: 全超    时间: 2013-3-18 17:31
这里的一点代表的是任意字符需要用反斜杠作为提示这是转义字符,为什么么要用到两个反斜杠呢因为例如“\.”这个格式本身也是转义字符需要再加一个斜杠转义,楼主注意咯正则表达式中的反斜杠都是成对出现的。
作者: 李尧    时间: 2013-3-18 17:39
全超 发表于 2013-3-18 17:31
这里的一点代表的是任意字符需要用反斜杠作为提示这是转义字符,为什么么要用到两个反斜杠呢因为例如“\.” ...

多谢,  "\."这个转义字符代表是什么,能说一下么,百度半天没找到..
作者: IT菜鸟    时间: 2013-3-18 17:48
str.split() ,中的参数 不是一个普通的字符串,而是一个正则表达式。 正则表达中的.也是特殊字符,如果查找需要转义,而正则表达中
的转义字符也是\    java 中\\ 转义后变成正则表达式中的\      \\.   转义后就是 正则表达式\.     个人理解,欢迎大家批评指正。

作者: 曾钦    时间: 2013-3-18 17:49
之前回答过类似问题的。。
于是我就再贴一遍 笔记吧。。
java 数组 split~java 中 split() 一点经验 
 特别注意的是:如果使用“\”分割,则需要使用“\\\\”来分割!
  在java.lang包中有String.split()方法,返回是一个数组
  我在应用中用到一些,给大家总结一下,仅供大家参考:
  1、如果用“.”作为分隔的话,必须是如下写法:String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
  2、如果用“|”作为分隔的话,必须是如下写法:String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");
  “.”和“|”都是转义字符,必须得加"\\";
  3、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用String.split("and|or");
  使用String.split方法分隔字符串时,分隔符如果用到一些特殊字符,可能会得不到我们预期的结果。
  我们看jdk doc中说明 public String[] split( String regex)
  Splits this string around matches of the given regular expression.
  参数regex是一个 regular-expression的匹配模式而不是一个简单的String,他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:
  用竖线 | 分隔字符串,你将得不到预期的结果
  String[] aa = "aaa|bbb|ccc".split("|");
  //String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的结果
  for (int i = 0 ; i <aa.length ; i++ ) {
  System.out.println("--"+aa[i]);
  }
  用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。
  String[] aa = "aaa*bbb*ccc".split("*");
  //String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的结果
  for (int i = 0 ; i <aa.length ; i++ ) {
  System.out.println("--"+aa[i]);
  }
  显然,+ * 不是有效的模式匹配规则表达式,用"\\*" "\\+"转义后即可得到正确的结果。
  "|" 分隔串时虽然能够执行,但是却不是预期的目的,"\\|"转义后即可得到正确的结果。
  还有如果想在串中使用"\"字符,则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果:
  String[] aa = "aaa\\bbb\\bccc".split("\\\\");

作者: 李尧    时间: 2013-3-18 17:57
蔡志刚 发表于 2013-3-18 17:48
str.split() ,中的参数 不是一个普通的字符串,而是一个正则表达式。 正则表达中的.也是特殊字符,如果查找 ...

嗯,经过我努力的百度正则表达式 好像这么理解比较靠谱.
作者: 全超    时间: 2013-3-18 19:14
李尧 发表于 2013-3-18 17:39
多谢,  "\."这个转义字符代表是什么,能说一下么,百度半天没找到..

一点“。”在正则表达式中是代表任意字符 但是需要作为一个字符的话前面要加反斜杠




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2