服务器之家

服务器之家 > 正文

JAVA 使用正则提取A标签以及href链接

时间:2021-09-28 10:02     来源/作者:码农致富

正则提取a标签以及href链接

代码如下:

  1. string content = "<p>下载地址:<a title="持续更新补丁下载地址" target="_blank" href="http://pan.baidu.com/s/xxxx">持续更新补丁下载地址</a></p><p>"; 
  2. pattern pattern_a = compile("<a[^>]*href=("([^"]*)"|'([^']*)'|([^s>]*))[^>]*>(.*?)</a>"); 
  3. matcher matcher_a = pattern_a.matcher(content); 
  4. system.out.println("网站连接"); 
  5. while (matcher_a.find()) { 
  6.     for (int i = 0; i < matcher_a.groupcount(); i++) { 
  7. system.out.println(matcher_a.group(i)); 
  8.     } 

输出结果如下:

  1. <a title="持续更新补丁下载地址" target="_blank" href="http://pan.baidu.com/s/xxxx">持续更新补丁下载地址</a> 
  2. "http://pan.baidu.com/s/xxxx" 
  3. http://pan.baidu.com/s/xxxx 
  4. null 
  5. null 

java 匹配正则表达式大全

java匹配字符串表达式在我们数据处理方面是及其重要的,现在就把我这几天数据处理比较常用的向大家介绍一下,常规的一些匹配方式就不介绍了,我们来学习一些特殊的

一.我们先举个例子来看看java匹配正则表达式

?
1
2
3
4
5
6
7
pattern pattern = pattern.compile("采购(人名称|人单位|名称).*");
        matcher matcher = pattern.matcher("采购名称乒位");
        string datestr = null;
        if (matcher.find()) {
            datestr = matcher.group(0);
            system.out.println(datestr);
        }

运行结果如下:

JAVA 使用正则提取A标签以及href链接

二.匹配表达式的特殊情况

(1)匹配中文字符

?
1
2
3
4
5
6
7
pattern pattern = pattern.compile("[u4e00-u9fa5]");
        matcher matcher = pattern.matcher("2322购购购购232323");
        string datestr = null;
        if (matcher.find()) {
            datestr = matcher.group(0);
            system.out.println(datestr);
        }

运行结果如下:

JAVA 使用正则提取A标签以及href链接

(2).匹配从规定字符开始所有非换行字符

?
1
2
3
4
5
6
7
pattern pattern = pattern.compile("1.*");
        matcher matcher = pattern.matcher("2312购购购购232323");
        string datestr = null;
        if (matcher.find()) {
            datestr = matcher.group(0);
            system.out.println(datestr);
        }

运行结果如图:

JAVA 使用正则提取A标签以及href链接

(3)使用字符串数组匹配多个条件匹配字符串,这是我在实习进行处理数据的一个例子,希望有助于大家理解:

JAVA 使用正则提取A标签以及href链接

JAVA 使用正则提取A标签以及href链接

JAVA 使用正则提取A标签以及href链接

(4).对于字符串匹配查找多个符合条件的字符字串,我们用到group(),

group(num=0): 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。

groups() : 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。

原文链接:https://blog.csdn.net/u011781521/article/details/88936540

标签:

相关文章

热门资讯

yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
2021年耽改剧名单 2021要播出的59部耽改剧列表
2021年耽改剧名单 2021要播出的59部耽改剧列表 2021-03-05
返回顶部