package com.panzhihua.common.utlis;
|
|
import java.util.ArrayList;
|
import java.util.List;
|
import java.util.regex.Matcher;
|
import java.util.regex.Pattern;
|
|
/**
|
* @program: springcloud_k8s_panzhihuazhihuishequ
|
* @description: 富文本提取
|
* @author: huang.hongfa weixin hhf9596 qq 959656820
|
* @create: 2021-01-26 11:18
|
**/
|
public class RichTextUtil {
|
private static Pattern p_image = Pattern.compile("<img.*src\\s*=\\s*(.*?)[^>]*?>", Pattern.CASE_INSENSITIVE);
|
private static Pattern r_image = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)");
|
|
/**
|
* 提取富文本中纯文本
|
*/
|
public static String getText(String richText) {
|
String regx = "(<.+?>)|(</.+?>)";
|
Matcher matcher = Pattern.compile(regx).matcher(richText);
|
while (matcher.find()) {
|
// 替换图片
|
richText = matcher.replaceAll("").replace(" ", "");
|
}
|
return richText;
|
}
|
|
/**
|
* 提取富文本中图片地址
|
*/
|
public static List<String> getImgStr(String richText) {
|
List<String> list = new ArrayList<>();
|
Matcher pMatcher = p_image.matcher(richText);
|
while (pMatcher.find()) {
|
// 得到<img />数据
|
String img = pMatcher.group();
|
// 匹配<img>中的src数据
|
Matcher rMatcher = r_image.matcher(img);
|
while (rMatcher.find()) {
|
list.add(rMatcher.group(1));
|
}
|
}
|
return list;
|
}
|
|
public static void main(String[] args) {
|
String s =
|
"<p class=\"ql-align-justify\">新年伊始,兴华办湖东社区党委开展了新年送福活动。2020年是不平凡的一年,一场突如其来的新冠肺炎开启了新年的第一天。在经历了疫情、双城创建、人口普查、疫情......更加彰显了党组织的凝聚力和战斗力。辖区党员在疫情防控阻击战中无私奉献、积极捐款、双城创建广大党员积极投身到创建一线、协助人口普查员入户走访、引导广大市民按时参加集中核酸检测......每一个战斗的场面都有共产党员的身影。湖东社区党委为了表达党组织对广大党员积极参与的感谢,激励广大党员不忘初心、牢记使命,为实现新时代党的历史使命不谢奋斗,在新年来临之际以“碗净福至”的含义为辖区党员送上新年祝福。此次送祝福活动共为辖区270名党员送去精美纪念品,收到纪念品的党员激动地说“2020年是我们共同的考验,感谢党组织的认可,我们也会继续发挥党员先锋模范作用。”</p><p class=\"ql-align-justify\"><img src=\"http://image.panzhihua.nhys.cdnhxx.com//idcard/f31fbe096b63f624ebcdee7a844009ff1b4ca3c7.jpg\"></p><p><br></p>";
|
String text = RichTextUtil.getText(s);
|
System.out.println(text);
|
}
|
}
|