jsoup 处理可能怀有恶意的 html 代码

红薯 发布于 2010/08/04 20:15
阅读 2K+
收藏 11

在做网站的时候,经常会提供用户评论的功能。有些用户比较淘气,会搞一些脚本到评论内容中,这些脚本可能会破坏整个页面的行为,或者更严重的是获取一些机要信息,例如跨站点攻击之类的。

jsoup 对这方面的支持非常强大,非常之简单。

瞧瞧下面的代码:

String unsafe = 
  "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";
String safe = Jsoup.clean(unsafe, Whitelist.basic());
// now: <p><a href="http://example.com/" rel="nofollow">Link</a></p>

jsoup 想得简直太周到了。

而 Whitelist 类还提供以下几个方法:

另外你也可以自定义这个白名单。

加载中
0
jing31
jing31

这个功能真是不错~

准备着手尝试一下~

0
GeneGuo
GeneGuo

嗯,很不错。

这几天做的一个项目,需要解析 HTML 内容,用 正则 解析出我的东西了,但是看到你的关于 JSOUP 的介绍,用了下,真是事半功倍呀。

0
桔子
桔子

  "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>"; 
 String safe = Jsoup.clean(unsafe, Whitelist.basic()); 
// now: <p><a href="http://example.com/" rel="nofollow">Link</a></p> 

0
akunamotata1
akunamotata1

不知道有没有处理敏感词的功能?

0
丛俊龙
丛俊龙
请问一下  这个怎么使用阿?
0
wlli
wlli
dfasfafaf
0
j
jiang1
简单好用
0
JohnsonZ
JohnsonZ
但是问题是,  正常的 /n也被清除了, 这个不知道 怎么解决?
返回顶部
顶部