Python的HTML解析 mechanize

BSD
Python
Linux
2010-01-19
红薯

完善个人资料领开源豆,速来抽奖!>>>

当您希望与 Web 页面中找到的内容进行某种比较复杂的交互时,您需要使用 mechanize

示例代码:

import re
from mechanize import Browser

br = Browser()
br.open("http://www.example.com/")
# follow second link with element text matching regular expression
response1 = br.follow_link(text_regex=r"cheese\s*shop", nr=1)
assert br.viewing_html()
print br.title()
print response1.geturl()
print response1.info() # headers
print response1.read() # body
response1.close() # (shown for clarity; in fact Browser does this for you)

br.select_form(name="order")
# Browser passes through unknown attributes (including methods)
# to the selected HTMLForm (from ClientForm).
br["cheeses"] = ["mozzarella", "caerphilly"] # (the method here is __setitem__)
response2 = br.submit() # submit current form

# print currently selected form (don't call .submit() on this, use br.submit())
print br.form
加载中

评论(0)

暂无评论

暂无资讯

4
回答
python模拟登陆腾讯微博

由于项目需要爬去腾讯微博 的数据,所以在尝试模拟登陆腾讯微博,但是一直登陆不了,感觉参数都对了,但就是登陆不了,求大家 帮忙看看,或者有没有其他的方法获取...

2013/03/15 15:50
4
回答
关于Ruby的HTTP访问,怎样保持会话状态

我想用Ruby程序对网站进行自动投稿,网站有登陆认证,我用以下代码通过登陆认证后,怎样才能保持住会话状态呢? require 'mechanize' a...

2011/10/26 10:28

没有更多内容

加载失败,请刷新页面

没有更多内容

Mechanize对WEB的操作

与网页交互(Interacting With a Web Page) 通过Mechanize模拟自然的浏览器行为来完成与网页之间的交互. # Mechanize的安装 Mechanize的安装请查看 -> Ruby library的安装 # 使用Mechanize时,...

2013/01/25 11:37
181
0
Mechanize模拟自然网页交互一些基本常用方法

与网页交互(Interacting With a Web Page) 通过Mechanize模拟自然的浏览器行为来完成与网页之间的交互. # Mechanize的安装 Mechanize的安装请查看 -> Ruby library的安装 # 使用Mechanize时,...

2013/01/25 11:38
3.4K
0
性能测试工具MultiMechanize的使用介绍

MultiMechanize是一款轻便的性能测试工具,做一下入门级别的使用介绍

2016/08/18 16:17
50
0
python http 组件简介

1. mechanize https://pypi.python.org/pypi/mechanize/ 中文简介:基于urllib2,完全兼容urllib2,提供浏览历史,表单状态,cookies等功能。 mechanize 0.2.5 Downloads ↓ Stateful program...

2013/06/06 23:18
613
0
python---easy_install 安装软件 及BeautifulSoup 中文乱码

安装easy_install工具 使用ez_setup.py脚本方便安装: wget - q http: // peak.telecommunity.com/dist/ez_setup.py python ez_setup.py 安装完后,最好确保easy_install所在目录已经被加到P...

2012/04/10 22:37
2.1K
0
Doing BDD with Behave on a Django project

尝试了按照 Behave 文档中的指导在我们的 Django 项目上加入 BDD。今天就来分享下过程中解决的坑和一些心得体会。

2013/05/19 16:25
798
0
服务端测试工具

入门必备

2016/12/10 11:04
99
0
【转载】50个很棒的Python模块

Python具有强大的扩展能力,以下列出了50个很棒的Python模块,包含几乎所有的需要:比如Databases,GUIs,Images, Sound, OS interaction, Web,以及其他。推荐收藏。 Graphical interface wx...

2011/02/13 22:18
7.3K
1
Python 和 egg 文件

不会安装python的egg文件,在网上搜索了一下,被“蟒蛇蛋”这个词雷到了,记录下。 随着对python的逐渐使用,发现一些python组件是用一个包管理器发布的,今天搞了快一个小时,终于搞定了,这...

2012/03/03 15:56
2.5W
2
Multi-Mechanize工程目录结构说明

目录结构 每个测试项目包含以下内容: config.cfg的配置文件。用于设定测试选项。 test_scripts/虚拟用户脚本的目录。在这里添加您的测试脚本。 results/:结果存储目录。对于每个测试都声称一...

2016/12/10 12:31
53
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部