java 正则匹配提取字符串
wupeigang1 人气:0java.util.regex类支持用正则表达式来匹配和提取字符串,读者可以去官网查看java.util.regex的详细使用方法。
首先给出一个匹配字符串的例子(判断line是否符合格式"GraphType\\s*=\\s*\".+\"\\s*"):
public static boolean isLegalInputLine(String line ) { Pattern p =Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*"); Matcher m = p.matcher(line); boolean r =m.matches(); return r; }
这个函数判断line是否匹配格式"GraphType\\s*=\\s*\".+\"\\*",这里的格式是使用java的正则表达式语法规则书写的。具体的语法规则我提供一个网址:https://wenku.baidu.com/view/e109601f52d380eb62946d75.html?rec_flag=default&mark_pay_doc=2&mark_rec_page=1&mark_rec_position=4&mark_rec=view_r_1&clear_uda_param=1
里面有具体的介绍。
下面给出用正则表达式提取字符串的例子(从s中提取匹配格式"GraphType\\s*=\\s*\".+\"\\s*"的字符串):
public List<String> getString(String s) { List<String> strs = new ArrayList<String>(); Pattern p = Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*"); Matcher m = p.matcher(s); while(m.find()) { strs.add(m.group()); } return strs; }
有一款叫做Regex Match Tracer的软件,可以用它来练习书写java的正则表达式。值得注意的是这款软件匹配和提取字符串的结果和java中的有所不同,有时这块软件不能识别的,java可以识别,笔者就碰到过这种情况。
另外对于学过形式语言与自动机的要注意java的语法规则与形式语言与自动机里面的正则语法不同。
附:Java正则取出每一个匹配的字符串
String data = "我的1<if test='case == 1'>1</if>我的2<if test='case == 2'>2</if>"; String regex = "<if test='([\\s\\S]*?)'>([\\s\\S]*?)</if>"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(data); while (matcher.find()) { String group = matcher.group(); System.out.println(group); }
总结
加载全部内容