正则表达式执行只返回第一个匹配

IT技术 javascript regex
2021-02-24 16:08:25

我正在尝试实现在Golfscript 语法页面上找到的以下正则表达式搜索

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;
input = ptrn.exec(input);

输入只是正则表达式的第一个匹配项。例如: "hello" "world"应该返回["hello", "world"]但它只返回["hello"].

3个回答

RegExp.exec 一次只能返回一个匹配结果。

为了检索多个匹配项,您需要exec多次在表达式对象上运行例如,使用一个简单的 while 循环:

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;

var match;
while ((match = ptrn.exec(input)) != null) {
    console.log(match);
}

这会将所有匹配记录到控制台。

请注意,为了完成这项工作,您需要确保正则表达式具有g(全局)标志此标志确保在对表达式执行某些方法后,更新lastIndex属性,因此将上一个结果之后开始进一步的调用

可以match在字符串上调用方法以检索整个匹配集合:

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;
var results = "hello world".match(ptrn);

results 是(根据正则表达式):

["hello", " ", "world"]

match 规格在这里

也许我应该举一个不太普遍的例子。具体来说,我正在尝试解析一个 OBJ 文件,其中包含以下形式的行中有关网格面的信息:f 3/5/4 5/13/4 2/2/3 4/6/3 在我的情况下,斜线中间可能有也可能没有数字,但如果有,我会喜欢忽略它。所以我想做一些事情,比如/ (\d+)\/.*\/(\d+) /g只提取斜线项目的末端。
2021-04-16 16:08:25
有可能是一个更好的解决办法,但我会用这样的事情... "3/5/4 5/13/4 2/2/3 4/6/3".match(/(\/(\d+)(?!(\d+|\/))|((^|\s)\d+))/g)这将返回["3", "/4", " 5", "/4", " 2", "/3", " 4", "/3"],您可以通过检查斜杠和空格来区分这些数字。这个正则表达式使用负前瞻,检查数字后面没有斜线。它仅适用于最后一个符号。模式的第二部分,在|运算符查找数字之后,在它们之前有换行符或空格。我只检查了你的例子,所以如果你会使用它,请检查更多数据。
2021-04-25 16:08:25
不会OR操作|就够了吗?例如"cat dog cat tiger dog".match(/(cat)|(dog)/g)会产生["cat", "dog", "cat", "dog"]. 这是一维数组。您的示例中所需的输出是什么?
2021-04-26 16:08:25
这就是我搜索时要找的,谢谢!不过有一个后续问题:是否可以为具有多个匹配组的 regx 执行此操作?"hello world hello world".match(/\S+ \S/g) 我会接受一维或二维数组的输出。
2021-05-08 16:08:25

我不明白"hello" "world"你的问题是什么意思,它是用户输入还是正则表达式,但我被告知 RegExp 对象有一个状态——lastIndex它开始搜索的位置。它不会一次返回所有结果。它只带来第一场比赛,您需要继续.exec获得从 lastIndex 位置开始的其余结果:

const re1 = /^\s*(\w+)/mg; // find all first words in every line
const text1 = "capture discard\n me but_not_me" // two lines of text
for (let match; (match = re1.exec(text1)) !== null;) 
      console.log(match, "next search at", re1.lastIndex);

印刷

["capture", "capture"] "next search at" 7
[" me", "me"] "next search at" 19

为您的结果构建迭代器的功能性 JS6 方法在这里

RegExp.prototype.execAllGen = function*(input) {
    for (let match; (match = this.exec(input)) !== null;) 
      yield match;
} ; RegExp.prototype.execAll = function(input) {
  return [...this.execAllGen(input)]}

另请注意,与poke不同,我如何更好地使用-loop 中match包含的变量for

现在,您可以在一行中轻松捕获您的匹配项

const matches = re1.execAll(text1)

log("captured strings:", matches.map(m=>m[1]))
log(matches.map(m=> [m[1],m.index]))
for (const match of matches) log(match[1], "found at",match.index)

哪个打印

"captured strings:" ["capture", "me"]

[["capture", 0], ["me", 16]]
"capture" "found at" 0
"me" "found at" 16