在 PHP 中正则表达式匹配规则的调整(允许某一个捕获子组为空)

1、现有的 PHP 代码实现如下

// $va = 'internal://all_collectionss/';
$va = 'internal://all_collectionss/1';
$matches = [];
if (preg_match('#internal://([^/]+)s/([^/]+)#', $va, $matches)) {
 $resource = strtolower($matches[1]);
 $resourceId = $matches[2];
}

2、打开:https://regex101.com/ ,匹配成功,结果如下。如图1

图1

Match 1 0-29 internal://all_collectionss/1
Group 1 11-26 all_collections
Group 2 28-29 1

3、现在期望 internal://all_collectionss/ 也能够匹配到。提示:您的正则表达式与主题字符串不匹配。如图2

图2

Your regular expression does not match the subject string.
Try launching the debugger to find out why.

4、正则表达式中具有特殊含义的字符称之为元字符,常用的元字符有:* 量词,0 次或多次匹配;+ 量词,1 次或多次匹配。由于最后的 / 后面允许为空,则应该将 + 调整为 *。#internal://([^/]+)s/([^/]*)# 两种情况皆能够匹配成功。如图3、图4

图3

 

图4

5、最终的 PHP 代码实现如下

// $va = 'internal://all_collectionss/';
$va = 'internal://all_collectionss/1';
$matches = [];
if (preg_match('#internal://([^/]+)s/([^/]*)#', $va, $matches)) {
 $resource = strtolower($matches[1]);
 $resourceId = $matches[2];
}
永夜