浏览网页的Pythonic库 RoboBrowser

BSD
Python 查看源码»
跨平台
2016-07-27
开源中国股瞎

RoboBrowser 是一款简单的浏览网页的Pythonic库,无需依赖独立的浏览器。

使用示例代码:

import re
from robobrowser import RoboBrowser

# Browse to Genius
browser = RoboBrowser(history=True)
browser.open('http://genius.com/')

# Search for Porcupine Tree
form = browser.get_form(action='/search')
form                # <RoboForm q=>
form['q'].value = 'porcupine tree'
browser.submit_form(form)

# Look up the first song
songs = browser.select('.song_link')
browser.follow_link(songs[0])
lyrics = browser.select('.lyrics')
lyrics[0].text      # \nHear the sound of music ...

# Back to results page
browser.back()

# Look up my favorite song
song_link = browser.get_link('trains')
browser.follow_link(song_link)

# Can also search HTML using regex patterns
lyrics = browser.find(class_=re.compile(r'\blyrics\b'))
lyrics.text         # \nTrain set and match spied under the blind...
的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

无需图形界面环境下的浏览器项目一览表

本表几乎列出了所有无需图形界面环境下的浏览器开源项目,可用于自动化、测试或者其他用途。 软件名 介绍 支持语言 Awesomium 基于Chromium无图形界面浏览器引擎。 C++, .NET benv Benv是nod...

2018/06/12 10:16
27
0
Python库大全,建议收藏留用!

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会...

2018/05/22 22:59
15
0
Python库大全(涵盖了Python应用的方方面面), 建议收藏留用!

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会...

2018/05/11 07:45
75
0
Python库大全,建议收藏留用!

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会...

2018/07/14 17:29
14
0
156个Python网络爬虫资源,GitHub上awesome系列之Python爬虫工具

项目地址:lorien/awesome-web-scraping GitHub上awesome系列之Python的爬虫工具。 本列表包含Python网页抓取和数据处理相关的库。 网络相关 通用 urllib - 网络库(标准库) requests - 网络库...

2018/07/02 14:58
31
0
Python 爬虫的工具列表

这个列表包含与网页抓取和数据处理的Python库 网络 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。 pycurl – 网络库(绑定libcurl)。 urllib3 – Pyth...

2017/10/26 11:38
43
0
Python学习干货 史上最全的 Python 爬虫工具列表大全

来源:马哥教育 链接:https://mp.weixin.qq.com/s/UkXT20Oko6oYbeo7zavCNA 这个列表包含与网页抓取和数据处理的Python库。 网络 通用 urllib -网络库(stdlib)。 requests -网络库。 grab –...

2018/08/02 22:34
13
0
爬虫体系

这里分享一个比较全面的爬虫体系,可供参考和快速学习爬虫。 1、网络 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。 pycurl – 网络库(绑定libcurl)。...

2018/12/11 16:00
3
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部