PHP 爬虫库 Goutte

MIT
PHP 查看源码»
跨平台
2013-12-31
红薯

Goutte 是一个抓取网站数据的 PHP 库。它提供了一个优雅的 API,这使得从远程页面上选择特定元素变得简单。

示例代码:

require_once '/path/to/goutte.phar';

use Goutte\Client;

//发送请求
$client = new Client();
$crawler = $client->request('GET', 'http://www.oschina.net/');

//点击链接
$link = $crawler->selectLink('Plugins')->link();
$crawler = $client->click($link);

//提交表单
$form = $crawler->selectButton('sign in')->form();
$crawler = $client->submit($form, array('signin[username]' => 'fabien', 'signin[password]' => 'xxxxxx'));

//提取数据
$nodes = $crawler->filter('.error_list');
if ($nodes->count())
{
  die(sprintf("Authentication error: %s\n", $nodes->text()));
}

printf("Nb tasks: %d\n", $crawler->filter('#nb_tasks')->text());
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

goutte操作

goutte操作 absolute path. curl.cainfo = "E:/wamp/bin/php/php7.1.9/extras/ssl/cacert.pem" 2.修改php.ini文件,搜索curl.cainfo absolute path. curl.cainfo = G:\phpStudy\WWW\cacert.p...

03/09 18:13
11
0
PHP 开发者应了解的24个库

作为一个PHP开发者,现在是一个令人激动的时刻。每天有许许多多有用的库分发出来,在 Github上很容易发现和使用这些库。下面是我曾经遇到过最酷的24个库。你最喜欢的库没有在这个列表里面?那...

2016/09/20 15:28
41
0
PHP 开发者应了解的 24 个库

作为一个PHP开发者,现在是一个令人激动的时刻。每天有许许多多有用的库分发出来,在 Github 上很容易发现和使用这些库。下面是我曾经遇到过最酷的24个库。

2014/01/10 15:56
133
1
php常用类库及jquery常用插件汇总

php常用类库及jquery常用插件汇总,便于查阅提高工作效率!

2016/06/20 10:41
49
0
Github上的PHP资源汇总

依赖管理 ——用于依赖管理的包和框架 Composer/Packagist : 一个包和依赖管理器 Composer Installers: 一个多框架Composer库安装器 Pickle: 可以在任意平台上安装PHP扩展包 依赖管理的附加部...

2015/01/07 11:16
2.3K
4
Github上PHP资源汇总大全

依赖管理 ——用于依赖管理的包和框架 Composer/Packagist : 一个包和依赖管理器 Composer Installers: 一个多框架Composer库安装器 Pickle: 可以在任意平台上安装PHP扩展包 静态站点生成器 ...

2016/12/18 01:54
32
0
最好的语言PHP + 最好的前端测试框架Selenium = 最好的爬虫

入职冰鉴科技做爬虫开发已经半年多了,陆续开发维护了几个爬虫以后终于在web端爬虫这一块有了登堂入室的感觉。中间踩了许多坑,也对爬虫的许多细节有了自己的认识,所以今天希望能分享一些爬...

2016/12/06 14:46
202
0
100个常用的 PHP 类库、资源和技巧小结

收集整理一些常用的PHP类库, 资源以及技巧. 以便在工作中迅速的查找所需... 学习资源 PHP相关的有参考价值的社区,博客,网站,文章,书籍,视频等资源 PHP网站(PHP Websites) PHP The Right Way ...

2017/10/26 09:24
45
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部