正则表达式贪婪与惰性

1. 量词的贪婪与惰性
惰性是从左往右匹配,第一个不匹配就再加第二个...

贪婪是先匹配整个字符串,然后从右往左,不匹配就舍去一个 ...

如:

HTML code

<script>
var str = 'ab123';
var reg1 = /(.+)d+$/; // ab12
var reg2 = /(.+?)d+$/; // a

reg1.test(str);
alert(RegExp.$1); // ab12
reg2.test(str);
alert(RegExp.$1); // ab
</script>

例如： /(.+)d+$/

ab123 ab12 3

/(.+?)d+$/ a b123 ab 123

2. 正则表达式贪婪、惰性量词疑问
例子代码，如下：
str = "abbb1234abbbaabbbaaabbb1234";
re = /.*bbb/g;
alert(str.match(re)); //结果为 abbb1234abbbaabbbaaabbb
re = /.*?bbb/g;
alert(str.match(re)); //结果为 abbb,1234abbb,aabbb,aaabbb
re = /a*bbb/g;
alert(str.match(re)); //结果为 abbb,abbb,aabbb,aaabbb
re = /a*?bbb/g;
alert(str.match(re)); //结果为 abbb,abbb,aabbb,aaabbb

对于第一、第二和第四个打印结果容易理解：
第一个 str.match(re)，贪婪量词先匹配整个字串，若不匹配去掉一个尾字符，继续匹配；
第二个 str.match(re)，惰性量词从第一个字符开始递加去匹配，直到匹配成功，清空字串，从下一个字符
继续匹配。
第四个 str.match(re)，同第二个。

但第三个就不知道如何解释，如果按照第一个的方式去理解：
先匹配整个字串，发现不匹配，去掉尾字符，继续匹配...到最后，结果应该是 abbb；
而其结果却为 abbb,abbb,aabbb,aaabbb

对于第三个正则，就是这样来执行的；
首先清楚了是用了简单量词 (*), 而我们知道了 * 是贪婪量词：
贪婪量词执行过程。正好楼主所说的那样。“先匹配整体，若不匹配则去掉尾字符继续匹配，直到成功或者
结束 ”
这样说应说只能得到第一被匹配的对象。
也就是说，只是说了匹配第一个。
(btw 如 C# 中 Regex 类中 match 方法是返回第一个匹配，而 matches 搜索正则表达式的所有匹配项)
对于 javascript 中的 match 来说。正如 C# 中的 matches 一样，返回所有匹配。
对于要返回所有匹配。
它还有第二个步：就是匹配成功后，从最近的一个匹配后的下一个字符开始重新贪婪模式匹配。重新执行
它的步骤；

例 :
str = "abbb1234abbbaabbbaaabbb1234";
re = /a*bbb/g;
alert(str.match(re));

它的执行过程 :

第一步：首先整个字符串 ("abbb1234abbbaabbbaaabbb1234") 匹配 , 发现匹配不成功，
接着。删除最后一个字符 ("4"), 成了 ("abbb1234abbbaabbbaaabbb123"), 这样依次执行下去；
执行。。。最后。发现 ("abbb") 可以被匹配了。。所以生成第一个匹配值。

但在这个 match 方法中是返回所有匹配。所以 ..

第二步：从最近的一个匹配（这里就是第一次匹配了）后的下一个字符开始重新贪婪模式匹配 .得到字符
串是
("1234abbbaabbbaaabbb1234"), 然后。就按第一步执行。。

执行完第一步后。
然后就从最近一次（这里就是第二次匹配了）

....后面的过程就是重复一二步了。
。

正则表达式贪婪与惰性

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (20)