NekoHTML 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
NekoHTML 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议: Apache
开发语言: Java
操作系统: 跨平台
收录时间: 2008-09-14

NekoHTML是一个Java语言的 HTML扫描器和标签补全器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。这个解析器能够扫描HTML文件并“修正”许多作者(人或机器)在编写HTML文档 过程中常犯的错误。

NekoHTML能增补缺失的父元素、自动用结束标签关闭相应的元素,以及不匹配的内嵌元素标签。NekoHTML的开发使用了 Xerces Native Interface (XNI),后者是Xerces2的实现基础。

示例代码:

package sample;

import org.cyberneko.html.parsers.DOMParser;
import org.w3c.dom.Document;
import org.w3c.dom.Node;

public class TestHTMLDOM {
public static void main(String[] argv) throws Exception {
DOMParser parser = new DOMParser();
for (int i = 0; i < argv.length; i++) {
parser.parse(argv[i]);
print(parser.getDocument(), "");
}
}
public static void print(Node node, String indent) {
System.out.println(indent+node.getClass().getName());
Node child = node.getFirstChild();
while (child != null) {
print(child, indent+" ");
child = child.getNextSibling();
}
}

}
展开阅读全文

NekoHTML 的相关资讯

还没有任何资讯

NekoHTML 的相关博客

使用NekoHtml处理网页(删除Style标签)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/jaune161/article/details/43561577 最近在做...

nekohtml转换html时标签变大写的问题

public static Document transferByNeko(InputStream stream, String charset) { if (stream == null) ...

Nutch1.7和eclipse集成

自己整理的笔记,Nutch 和 eclipse 集成过程

springboot整合thymeleaf+tiles示例

网上关于此框架的配置实在不多,因此想记录下来以防忘记 因为公司框架基于上述(公司采用gradle构建项目,楼主采用的是maven...

Nutch1.7 配置到 eclipse

在nutch项目集成到eclipse中遇到了很多的问题,第一次参照网上资料配置成功后,由于没做笔记。第二天写笔记时,没想到又忘记了...

SpringBoot+thymelates入门

在pom.xml当中加入这俩个依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter...

springboot使用thymeleaf 解析异常

  在使用springboot的过程中,如果使用thymeleaf作为模板文件, 则要求HTML格式必须为严格的html5格式,必须有结束标签,否...

templates html5没有结束标签报错的解决方法

原文博客:https://blog.csdn.net/qq_41692413/article/details/81746103 将spring.thymeleaf.mode=HTML5(此行不写或这样写则...

spring boot thymeleaf 标签未关闭报错

每天学习一点点 编程PDF电子书免费下载: http://www.shitanlife.com/code spring boot,input标签未关闭报bug,代码稍有不慎...

springboot 使用model重定向到html模板,对数据进行展示

1:使用springboot, ,html使用thymeleaf,nekohtml模板 在build.gradle中添加依赖 buildscript { repositories { ...

评论 (0)

加载中
更多评论
0 评论
36 收藏
分享
返回顶部
顶部