如何用C解析一个网页获取相关信息.

PLeo 发布于 2011/11/16 09:44
阅读 5K+
收藏 2

我想用C/C++去解析一个网页,去获取相应的内容,比如文字/url/图片地址等

目前我使用的方案是用C访问一个php网页,php网页也是自己写的,用的phpquery的解析库感觉很好用.

现在想用纯C/C++写,但是找不到合适的C/C++的解析库,看了下面三个,感觉好像都是半成品?有没有合适的推荐?

目的主要是为了提取文字/url/图片地址等,主要页面结构都是目前流行的DIV之类的.谢谢

htmlcxx / Streaming HTML parser / libhtml

 

加载中
0
红薯
红薯
本站只收录了这三个,没遇见其他了
梁欢
梁欢
我记得google出了一款开源软件gumbo(http://www.oschina.net/p/gumbo),可以试试。
0
Lunar_Lin
Lunar_Lin

     这些C\C++的 html解析 或多或少都有点问题. 自己写一个吧,耗时不久.主要就是字符串的读取 判断. 

     windows上有微软的IE com库.不过我觉得挺难用的.而且行为怪异.

0
钛元素
钛元素
用专业的东西做专业的事情吧
小菜的粉丝
小菜的粉丝
厉害
0
hellogirl
hellogirl

http://hi.baidu.com/chenshuanj/blog/item/24246fb3633829bcd9335ac9.html

我写过一个,你稍微改改应该能帮上忙

0
itsusony
itsusony

要解析还是用perl吧。

有正则表达式能力超过perl的么?

0
fromdtor
fromdtor

你看一下有没有xpath的C++库。使用css选择器语法

0
青春驿站

c++  自带  regex

0
cuihao
cuihao

C++ 搞这个太费劲,用python吧兄弟

0
calvinwilliams
calvinwilliams

试试我的fasterxml

你值得拥有 ;)

返回顶部
顶部