软件简介

Goutte 是一个抓取网站数据的 PHP 库。它提供了一个优雅的 API,这使得从远程页面上选择特定元素变得简单。

示例代码:

require_once '/path/to/goutte.phar';

use Goutte\Client;

//发送请求
$client = new Client();
$crawler = $client->request('GET', 'http://www.oschina.net/');

//点击链接
$link = $crawler->selectLink('Plugins')->link();
$crawler = $client->click($link);

//提交表单
$form = $crawler->selectButton('sign in')->form();
$crawler = $client->submit($form, array('signin[username]' => 'fabien', 'signin[password]' => 'xxxxxx'));

//提取数据
$nodes = $crawler->filter('.error_list');
if ($nodes->count())
{
  die(sprintf("Authentication error: %s\n", $nodes->text()));
}

printf("Nb tasks: %d\n", $crawler->filter('#nb_tasks')->text());
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
2018/03/09 18:13

goutte操作

goutte操作 absolute path. curl.cainfo = "E:/wamp/bin/php/php7.1.9/extras/ssl/cacert.pem" 2.修改php.ini文件,搜索curl.cainfo absolute path. curl.cainfo = G:\phpStudy\WWW\cacert.pem Goutte基本用法 最近工作上用到PHP爬虫框架Goutte(号称是PHP上最好用的爬虫框架)。这里记下自己用到过的使用技巧,免得下次使用的时候再摸索。 table相关 html: <table id="ip_list"> <tbody><tr> <th colspan="8"> <h2>国内高...

0
0
发表了博客
2018/02/05 18:15

[SF] Symfony 组件 BrowserKit 原理

直接看下面的注释中针对每一个文件的作用说明。 <?php /** * BrowserKit - Make internal requests to your application. * * If you need to make requests to external sites and applications, consider using Goutte. * * Request.php 是一个简单包装请求中的各部分信息的容器,以提供存取。 * Response.php 是一个简单包装 content, status, headers 的对象,仅仅用于返回,return new Response()。 * ...

0
0
发表了博客
2018/11/17 19:31

Laravel5.5 综合使用

<blockquote>使用 Laravel5.5 开发一个自动交割的项目,把使用到的开源扩展包及特性整理起来,以供后续使用。</blockquote> <h2>一、安装IDE提示工具</h2> <p>Laravel IDE Helper 是一个极其好用的代码提示及补全工具,可以给编写代码带来极大的便利。</p> <h3>1、安装</h3> # 如果只想在开发环境安装请加上 --dev composer require barryvdh/laravel-ide-helper <p>安装 doctrine/dbal 「请装上它,在为模型注释字段的时候必...

0
0
01/22 16:06

PHP 开源库中选出了几款实用有趣的工具

本文从众多 PHP 开源库中选出了几款实用有趣的工具,希望对你的学习工作有帮助。 1、PHP 日志工具 Monolog Monolog 是一种支持 PHP 5.3+ 以上的日志记录工具。并为 Symfony 默认支持。 示例代码: 2、Excel 操作库 PHPExcel PHPExcel 是一个用来读写 Excel 2007 (OpenXML) 文件的 PHP 库。 示例代码: 3、PHP 机器学习库 PHP-ML PHP-ml 是 PHP 的机器学习库。同时包含算法,交叉验证,神经网络,预处理,特征提取等。 示例代码:...

0
0
发表了博客
2018/07/03 13:11

开源网络爬虫汇总

互联网爬虫,蜘蛛,数据采集器,网页解析器的汇总,因新技术不断发展,新框架层出不穷,此文会不断更新... 交流讨论 欢迎推荐你知道的开源网络爬虫,网页抽取框架. 开源网络爬虫QQ交流群:322937592 email address: liinux at qq.com Python Scrapy - 一种高效的屏幕,网页数据采集框架。 django-dynamic-scraper - 基于Scrapy内核由django Web框架开发的爬虫。 Scrapy-Redis - 基于Scrapy内核采用Redis组件的爬虫。 scrapy-clust...

0
0
发表了博客
2019/09/16 09:21

PHP之50个开源项目

GitHub上50个最受欢迎的PHP开源项目【2019】 1、Laravel Laravel是一个为Web开发者打造的PHP开发框架。 GitHub Stars: 43.5k+ 网址: https://github.com/laravel/laravel 2、Symfony Symfony是一个web应用开发框架,包含一组可重用的PHP组件。Symfony已经应用于上千个web应用,包括BlaBlaCar.com和Spotify.com以及大多数流行的PHP项目中,例如Drupal和Magento。 GitHub Stars: 17.8k+ 网址: https://github.com/symfony/symfo...

0
0
发表了博客
2019/08/24 20:40

PHP开发者必备的50个库/框架【2019】

2019年最受欢迎的50个PHP开源项目,汇智网翻译整理。 > 如果希望快速掌握区块链应用的开发,推荐汇智网的 [**区块链应用开发系列教程**](http://www.hubwiz.com/course/?type=%E5%8C%BA%E5%9D%97%E9%93%BE&affid=osc7878), 内容涵盖比特币、以太坊、eos、超级账本fabric和tendermint等多种区块链, 以及php、 java、go、nodejs、python、dart等多种开发语言 ## 1、Laravel Laravel是一个为Web开发者打造的PHP开发框架。 GitHub...

0
2
发表了博客
2016/09/20 15:28

PHP 开发者应了解的24个库

作为一个PHP开发者,现在是一个令人激动的时刻。每天有许许多多有用的库分发出来,在 Github上很容易发现和使用这些库。下面是我曾经遇到过最酷的24个库。你最喜欢的库没有在这个列表里面?那就在评论中分享吧! 1. Dispatch – 微框架 Dispatch是一个PHP小框架。它并没有给你完整的MVC设置,但你可以定义URL规则和方法,以便更好组织应用程序。这对API、简单的站点或原型来说是完美的。 //包含库 include 'dispatch.php'; //...

0
11
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
80 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部