我想从JSON数据返回的文本中获取一个img
标记。我想从一个字符串中抓取这个:
<img class="img" src="https://fbcdn-photos-c-a.akamaihd.net/hphotos-ak-frc3/1239478_598075296936250_1910331324_s.jpg" alt="" />
我必须使用什么正则表达式来匹配它?
我使用了以下方法,但它不起作用。
"<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>"
您可以简单地使用此表达式来匹配img标记,如示例所示:
<img([\w\W]+?)/>
您的正则表达式与字符串不匹配,因为它缺少结束符/
。
编辑-不,/
不是必需的,所以你的正则表达式应该已经工作。但是你可以像下面这样放松一下。
稍加修改:
<img\s[^>]*?src\s*=\s*['\"]([^'\"]*?)['\"][^>]*?>
请注意,由于各种原因,您不应该使用正则表达式来解析HTML
<img\s+[^>]*src="([^"]*)"[^>]*>
或者使用Jsoup
。。。
String html = "<img class=\"img\" src=\"https://fbcdn-photos-c-a.akamaihd.net/
hphotos-ak-frc3/1239478_598075296936250_1910331324_s.jpg\" alt=\"\" />";
Document doc = Jsoup.parse(html);
Element img = doc.select("img").first();
String src = img.attr("src");
System.out.println(src);