当前访客身份:游客 [ 登录 | 加入 OSCHINA ]

代码分享

当前位置:
代码分享 » PHP  » 网络编程
小囧

抓取百度排名

小囧 发布于 2011年07月11日 11时, 10评/3599阅
分享到: 
收藏 +0
1

百度排名抓取~

标签: 百度

代码片段(2) [全屏查看所有代码]

1. [图片] so.png    

2. [代码][PHP]代码     跳至 [2] [全屏预览]

function s($keyword,$url,$page = 1){
	static $px = 0;
	$rsState = false;
	
	$enKeyword = urlencode($keyword);
	$firstRow = ($page - 1) * 10;
	
	if($page > 10){
		die('10页之内没有该网站排名..end');
	}	
	$contents = file_get_contents("http://www.baidu.com/s?wd=$enKeyword&&pn=$firstRow");
	preg_match_all('/<table[^>]*?class="result"[^>]*>[\s\S]*?<\/table>/i',$contents,$rs);
	foreach($rs[0] as $k=>$v){
		$px++;
		if(strstr($v,$url)){
			$rsState = true;
			preg_match_all('/<h3[\s\S]*?(<a[\s\S]*?<\/a>)/',$v,$rs_t);
			echo '当前 "' . $url . '" 在百度关键字 "' . $keyword . '" 中的排名为:' . $px;
			echo '<br>';
			echo '第' . $page . '页;第' . ++$k . "个<a target='_blank' href='http://www.baidu.com/s?wd=$enKeyword&&pn=$firstRow'>进入百度</a>"; 
			echo '<br>';
			echo $rs_t[1][0];
			break;
		}
	}
	unset($contents);
	if($rsState === false){
		s($keyword, $url,++$page);
	}
}
if(isset($_POST['submit'])){
	
	$time = explode(' ',microtime());
	$start = $time[0] + $time[1];

	$url = $_POST['url'];
	if( count(explode('.',$url)) <= 2){

		$url = ltrim($url,'http://');
		$url = 'www.' . $url;
	}

	s($_POST['keyword'],$url);
	
	$endtime = explode(' ',microtime());

	$end = $endtime[0] + $endtime[1];

	echo '<hr>';
	echo '程序运行时间: ';
	echo $end - $start;	
	die();
}

?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gbk" />
<title>抓取排名</title>

</head>

<body>
<form action="" method="post">
	<ul>
		<li>
			<span>关键字:</span><input type="text" name="keyword">
		</li>
		<li>
			<span>url地址:</span><input type="text" name="url">
		</li>
		<li>
			<input type="submit" name="submit" value="搜索">
		</li>
	</ul>
	
</form>
</body>
</html>


开源中国-程序员在线工具:Git代码托管 API文档大全(120+) JS在线编辑演示 二维码 更多»

发表评论 回到顶部 网友评论(10)

  • 1楼:盛夏的白菜土豆西红柿 发表于 2011-07-11 18:59 回复此评论

    我想问问上面这是用什么编辑器写的代码??我很喜欢这编辑器的风格~

  • 2楼:盛夏的白菜土豆西红柿 发表于 2011-07-11 18:59 回复此评论
    哪位大侠能告诉我一声,谢谢~
  • 3楼:Aileen 发表于 2011-07-11 22:26 回复此评论

    引用来自“kulijia”的评论

    我想问问上面这是用什么编辑器写的代码??我很喜欢这编辑器的风格~

    貌似红薯老大用的是 syntaxhighlighter.js
    这个是一个 Js 的实现语法高亮的库~
    http://code.google.com/p/syntaxhighlighter/
  • 4楼:毕升 发表于 2011-07-15 13:15 回复此评论
    php的 file_get_contents函数经常出问题
  • 5楼:慕容日华 发表于 2011-07-16 00:51 回复此评论

    非常酷,我这是太喜欢了,你真酷!做个朋友吧,加我QQ!1319258636

  • 6楼:日你爸 发表于 2011-07-20 17:54 回复此评论

    引用来自“慕容日华”的评论

    非常酷,我这是太喜欢了,你真酷!做个朋友吧,加我QQ!1319258636

    非常酷,我这是太喜欢了,你真酷!做个朋友吧,加我QQ!
  • 7楼:五味格子 发表于 2011-07-22 08:56 回复此评论
    肉测,很好用
  • 8楼:zuiw 发表于 2011-08-05 10:52 回复此评论

    引用来自“日你爸”的评论

    引用来自“慕容日华”的评论

    非常酷,我这是太喜欢了,你真酷!做个朋友吧,加我QQ!1319258636

    非常酷,我这是太喜欢了,你真酷!做个朋友吧,加我QQ!
    你们都非常酷,我这是太喜欢了,你们真酷!做个朋友吧,加我QQ!
  • 9楼:Maplews 发表于 2011-08-10 08:41 回复此评论
    上面的php为啥不直接二次循环?
  • 10楼:谨以此为号 发表于 2012-05-01 11:16 回复此评论
    这个代码不错哇。收藏了。^_^
开源从代码分享开始 分享代码
小囧的其它代码 全部(23)...