用于 Javascript 正则表达式的转义字符串

IT技术 javascript regex escaping
2021-01-13 00:02:58

可能的重复:
Javascript 中有 RegExp.escape 函数吗?

我正在尝试根据用户输入构建一个 javascript 正则表达式:

函数 FindString(输入){
    var reg = new RegExp('' + input + '');
    // [snip] 执行搜索
}

但是当用户输入包含?or时,正则表达式将无法正常工作,*因为它们被解释为正则表达式特殊。事实上,如果用户在他们的字符串中放置了不平衡的([,则正则表达式甚至无效。

正确转义所有用于正则表达式的特殊字符的 javascript 函数是什么?

1个回答

Short 'n Sweet(2021 年更新)

要转义 RegExp 本身:

function escapeRegExp(string) {
    return string.replace(/[.*+?^${}()|[\]\\]/g, '\\$&'); // $& means the whole matched string
}

要转义替换字符串:

function escapeReplacement(string) {
    return string.replace(/\$/g, '$$$$');
}

例子

所有转义的 RegExp 字符:

escapeRegExp("All of these should be escaped: \ ^ $ * + ? . ( ) | { } [ ]");
>>> "All of these should be escaped: \\ \^ \$ \* \+ \? \. \( \) \| \{ \} \[ \] "

查找并替换字符串:

var haystack = "I love $x!";

var needle = "$x";
var safeNeedle = escapeRegExp(needle); // "\\$x"

var replacement = "$100 bills"
var safeReplacement = escapeReplacement(replacement); // "$$100 bills"

haystack.replace(
  new RegExp(safeNeedle, 'g'),
  escapeReplacement(safeReplacement),
);
// "I love $100 bills!"

:上面是不是原来的答案,它被编辑以显示从MDN一个,这意味着它不。匹配,你会在下面NPM的代码查找,一点匹配什么是在下面长所示回答。评论现在也令人困惑。我的建议:使用上述内容,或从 MDN 获取,并忽略此答案的其余部分。-Darren,2019 年 11 月)

安装

在 npm 上可用作为转义字符串正则表达式

npm install --save escape-string-regexp

笔记

请参阅MDN:Javascript 指南:正则表达式

其他符号 (~`!@# ...) 可以转义而不会产生任何后果,但不是必需的。

.

.

.

.

测试用例:一个典型的 url

escapeRegExp("/path/to/resource.html?search=query");

>>> "\/path\/to\/resource\.html\?search=query"

长答案

如果你打算使用上面的函数,至少在你的代码文档中链接到这个堆栈溢出帖子,这样它就不会看起来像疯狂的难以测试的巫术。

var escapeRegExp;

(function () {
  // Referring to the table here:
  // https://developer.mozilla.org/en/JavaScript/Reference/Global_Objects/regexp
  // these characters should be escaped
  // \ ^ $ * + ? . ( ) | { } [ ]
  // These characters only have special meaning inside of brackets
  // they do not need to be escaped, but they MAY be escaped
  // without any adverse effects (to the best of my knowledge and casual testing)
  // : ! , = 
  // my test "~!@#$%^&*(){}[]`/=?+\|-_;:'\",<.>".match(/[\#]/g)

  var specials = [
        // order matters for these
          "-"
        , "["
        , "]"
        // order doesn't matter for any of these
        , "/"
        , "{"
        , "}"
        , "("
        , ")"
        , "*"
        , "+"
        , "?"
        , "."
        , "\\"
        , "^"
        , "$"
        , "|"
      ]

      // I choose to escape every character with '\'
      // even though only some strictly require it when inside of []
    , regex = RegExp('[' + specials.join('\\') + ']', 'g')
    ;

  escapeRegExp = function (str) {
    return str.replace(regex, "\\$&");
  };

  // test escapeRegExp("/path/to/res?search=this.that")
}());
@SushantGupta "\\" 添加了新的反斜杠,用于转义匹配的特殊正则表达式字符。“$&”是对当前模式匹配内容的反向引用,添加了原始的特殊正则表达式字符。
2021-03-10 00:02:58
2016 年有更理智的方式吗?
2021-03-17 00:02:58
为什么它被 '\\$&' 取代。那是什么意思?对不起,我是JS新手。
2021-03-18 00:02:58
哇,好啰嗦。我更喜欢bobince 的版本但是任何可以在没有不必要地逃避事物的情况下工作的东西......
2021-03-26 00:02:58
大多数这些字符不需要在字符类中转义。破折号和正斜杠根本不需要转义。所以,这可以简化为: return str.replace(/[[{}()*+?^$|\]\.\\]/g, "\\$&");
2021-04-01 00:02:58