会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Jsuop进行链接提取!

Jsuop进行链接提取

时间:2025-11-04 23:24:14 来源:益强数据堂 作者:域名 阅读:413次

 

// 检索WebContent中的进接提图片和附件  Document doc = Jsoup.parse(info.getWebc().getWebContent());  // 当前页中的图片  Elements srcLinks = doc.select("img[src]");  String imagesPath = "";  for (Element link : srcLinks) {  // 剔除标签,只剩链接路径  String imagesPaths = link.attr("src");  String ht = imagesPaths.substring(0,行链 4);  String htt = imagesPaths.substring(0, 1);  if (!ht.equals("http") && htt.equals("/")) {  imagesPath = imagesPaths.trim().replaceAll(ContextPath, "");  imagesPath = imagesPath.substring(imagesPath.lastIndexOf("/") + 1);  } else {  imagesPath = "";  }  //System.out.println("---导入WebContent中的云南idc服务商图片---" + imagesPath);  if (!imagesPath.equals("")) {  importCopy("/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/"+imagesPath, path, strInfoID,"/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/");  }  }  // 提取所有的href连接  String filePaths = "";  Elements linehrefs = doc.select("a[href]");  for (Element link : linehrefs) {  filePaths = link.attr("href").trim().replaceAll(ContextPath, "");  filePaths = filePaths.substring(filePaths.lastIndexOf("/") + 1);  //System.out.println("---导入WebContent中的文件---" + filePaths);  if (!filePaths.equals("")) {  importCopy("/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/"+filePaths, path, strInfoID,"/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/");  }  } 

 【本文是源码库专栏作者张勇波的原创文章,转载请通过获取作者授权】

进接提亿华云计算

(责任编辑:应用开发)

推荐内容
  • 电脑运营商端口绑定错误(了解电脑运营商端口绑定错误的危害及如何避免)
  • CSS边玩边学,这五个游戏让你对CSS的掌握更进一步!
  • 给女同事讲完代理后,女同事说:你好棒哦
  • 设计模式系列-建造者模式
  • 优化工作效率,轻松锁定MacBook(通过设置快捷键,实现一键锁屏,提升工作效率)
  • Java程序员应该掌握多个编程语言