BeautifulSoup4 爬虫问题

daishunchao 发布于 2014/03/22 11:47
阅读 209
收藏 0
<ul>
<li class="name"><a class="" href="/movies/4266" title="费城故事">费城故事 <span class="year">(1993)</span></a></li>
<li class="rank"><span class="movie_rank"><i class="icon bigstar45"></i> <span itemprop="ratingValue">8.5</span></span></li>
<li><label>地区:</label><div class="tags"><a class="country" href="/movies?country=美国">美国</a></div></li>
<li><label>导演:</label><div class="tags"><a class="director" href="/movies?director=乔纳森·戴米">乔纳森·戴米</a></div></li>
<li><label>主演:</label><div class="tags"><a class="actor" href="/movies?actor=汤姆·汉克斯">汤姆·汉克斯</a> / <a class="actor" href="/movies?actor=丹泽尔·华盛顿">丹泽尔·华盛顿</a> / <a class="actor" href="/movies?actor=安东尼奥·班德拉斯">安东尼奥·班德拉斯</a></div></li>
<li><label>类型:</label><div class="tags"><a class="category" href="/movies?category=剧情">剧情</a> / <a class="category" href="/movies?category=同性">同性</a></div></li>
<li>
<label>资源:</label>
<div class="tags">
<a class="down" href="/movies/4266">4 个下载地址</a>
</div>
</li>
</ul>

我用爬虫找出很多个ul,我想封装成一个个对象,请问如何操作,能否举个例子给我看看。

 


加载中
0
Tanweijie
Tanweijie
可以用正则或者xpath获取ul里面需要的内容自己封装成对象吧?
daishunchao
daishunchao
是啊,怎么做
返回顶部
顶部