提问者:小点点

使用regex获取所有js hrefs


使用Jmeter的正则表达式提取器,我试图从一个html文档中获取仅与javascript相关的所有链接或路径--即包含“.js”子字符串的hrefs。我使用了next regex表达式,但它也是get“.css”链接:

href="(.*?)"[^<]

下面是html片段的相关示例:

<head >
<title>TITLE</title><link data-n-head="ssr" rel="icon" type="image/x-icon" href="/favicon.ico"><link rel="preload" href="/_nuxt/app.js" as="script"><link rel="preload" href="/_nuxt/app.js" as="script"><link rel="preload" href="/_nuxt/app.css" as="style"><link rel="preload" href="/_nuxt/app.js" as="script"><link rel="preload" href="/_nuxt/app.css" as="style"><link rel="preload" href="/_nuxt/app.js" as="script"><link rel="stylesheet" href="/_nuxt/app.css"><link rel="stylesheet" href="/_nuxt/app.css">

你能帮我用右正则表达式吗?它只得到“.js”链接,而不得到包含“.css”/“svg”等的其他链接?


共1个答案

匿名用户

使用正则表达式解析HTML不是最好的主意,我宁愿建议考虑使用CSS选择器提取器。

更多信息:CSS选择器参考

如果要继续使用正则表达式,则应该使用href=“(.*)\.js