| 注册
请输入搜索内容

热门搜索

Java Linux MySQL PHP JavaScript Hibernate jQuery Nginx
jopen
13年前发布

HTML 解析器 Jericho

     <p>Jericho HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML 。它也提供高层次的HTML表单操作函数。</p>    <p>示例代码:</p>    <pre class="brush:java; toolbar: true; auto-links: false;">import net.htmlparser.jericho.*; import java.util.*; import java.io.*; import java.net.*;  public class Encoding {  public static void main(String[] args) throws Exception {   String sourceUrlString="data/test.html";   if (args.length==0)     System.err.println("Using default argument of \""+sourceUrlString+'"');   else    sourceUrlString=args[0];   if (sourceUrlString.indexOf(':')==-1) sourceUrlString="file:"+sourceUrlString;   System.out.println("\nSource URL:");   System.out.println(sourceUrlString);   URL url=new URL(sourceUrlString);   Source source=new Source(url);   System.out.println("\nDocument Title:");   Element titleElement=source.getFirstElement(HTMLElementName.TITLE);   System.out.println(titleElement!=null ? titleElement.getContent().toString() : "(none)");   System.out.println("\nSource.getEncoding():");   System.out.println(source.getEncoding());   System.out.println("\nSource.getEncodingSpecificationInfo():");   System.out.println(source.getEncodingSpecificationInfo());   System.out.println("\nSource.getPreliminaryEncodingInfo():");   System.out.println(source.getPreliminaryEncodingInfo());  } }</pre>    <p><strong>项目主页:</strong><a href="http://www.open-open.com/lib/view/home/1324433058296" target="_blank">http://www.open-open.com/lib/view/home/1324433058296</a></p>    <p></p>     
 本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
 转载本站原创文章,请注明出处,并保留原始链接、图片水印。
 本站是一个以用户分享为主的开源技术平台,欢迎各类分享!
 本文地址:https://www.open-open.com/lib/view/open1324433058296.html
Java HTML操作类库