我正在运行我的 DOM 的所有文本节点并检查 nodeValue 是否包含某个字符串。
/html/body//text()[contains(.,'test')]
这是区分大小写的。但是,我也想赶上Test
,TEST
或TesT
。XPath(在 JavaScript 中)可以实现吗?
我正在运行我的 DOM 的所有文本节点并检查 nodeValue 是否包含某个字符串。
/html/body//text()[contains(.,'test')]
这是区分大小写的。但是,我也想赶上Test
,TEST
或TesT
。XPath(在 JavaScript 中)可以实现吗?
这适用于 XPath 1.0。如果您的环境支持 XPath 2.0,请参见此处。
是的。可能,但并不美丽。
/html/body//text()[
contains(
translate(., 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'),
'test'
)
]
这适用于预先知道字母表的搜索字符串。添加您希望看到的任何重音字符。
如果可以,请用其他方式标记您感兴趣的文本,例如<span>
在构建 HTML 时将其包含在具有特定类的 a 中。与元素文本中的子字符串相比,使用 XPath 定位这些东西要容易得多。
如果这不是一个选项,您可以让 JavaScript(或您用来执行 XPath 的任何其他宿主语言)帮助您构建动态 XPath 表达式:
function xpathPrepare(xpath, searchString) {
return xpath.replace("$u", searchString.toUpperCase())
.replace("$l", searchString.toLowerCase())
.replace("$s", searchString.toLowerCase());
}
xp = xpathPrepare("//text()[contains(translate(., '$u', '$l'), '$s')]", "Test");
// -> "//text()[contains(translate(., 'TEST', 'test'), 'test')]"
(对@KirillPolishchuk 的回答的提示- 当然,您只需要翻译您实际搜索的那些字符。)
这种方法适用于任何搜索字符串,无需事先了解字母表,这是一个很大的优势。
当搜索字符串可以包含单引号时,上述两种方法都会失败,在这种情况下事情会变得更加复杂。
不区分大小写 contains
/html/body//text()[contains(translate(., 'EST', 'est'), 'test')]
是的。您可以使用translate
将要匹配的文本转换为小写,如下所示:
/html/body//text()[contains(translate(.,
'ABCDEFGHIJKLMNOPQRSTUVWXYZ',
'abcdefghijklmnopqrstuvwxyz'),
'test')]
如果您使用的是 XPath 2.0,那么您可以将排序规则指定为 contains() 的第三个参数。但是,整理 URI 未标准化,因此详细信息取决于您使用的产品。
请注意,之前使用 translate() 给出的解决方案都假定您仅使用 26 个字母的英文字母表。
更新: XPath 3.1 定义了一个用于大小写匹配的标准排序规则 URI。