网页代理网站dailila的自动转向页面不会解析,求大神指点!

刘地 发布于 2013/12/17 15:06
阅读 2K+
收藏 0

是这样的:

从http://www.dailila.net/主页,点击submit后就会进入一个“正在转入代理……”的中转页面,大概1-2s后该页面就会自动跳转到具体的代理页面去。

我用python和golang都能捕获到这个代理页面,但是从该页面却找不到action=“...”,因为我要搜集这个里面的地址(也就是代理的具体网址),但是使用fiddler2是没问题的(action属性就在页面的最下面靠上一点,见下面的页面代码),伪装了header之后,也是有时行,有时不行。

HTTP/1.1 200 OK
Connection: close
Date: Tue, 17 Dec 2013 06:29:57 GMT
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
X-Powered-By: PHP/5.2.17
Content-type: text/html

 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>....正在转入代理....</title>
<script type="text/javascript">
window.setTimeout('document.getElementById("dailila").submit();',800); 
String.prototype.trim = function ()
{ 
    return this.replace(/^\s+|\s+$/, ''); 
}

var IE_all_cache = new Object();

function IE_getElementById(id)
{
    if (IE_all_cache[id] == null)
    {
        IE_all_cache[id] = document.all[id];
    }

    return IE_all_cache[id];
}

if (document.all)
{
  if (!document.getElementById)
  {
    document.getElementById = IE_getElementById;
  }
}

function waitForDownload()
{
    if (waitingTime <= 0)
    {
        document.getElementById("wait_to_download").style.display = 'none';
        document.getElementById("download_link").style.display = 'inline';
        clearInterval(downloadTimer);
    }
    else
    {
        document.getElementById("remaining_secs").innerHTML = waitingTime;
    }

    waitingTime --;
}

if (window.parent != window)
{
    window.parent.location = window.location;
}
</script>
<style>

.red {
	color: #CC0000;
}
</style>
<script type="text/javascript">
            var waitingTime = 5;
            var downloadTimer = setInterval("waitForDownload()", 1400);
if (window.location.hash == "#speed")
    waitingTime = 0;
var strCookie=document.cookie;
var arrCookie=strCookie.split("; ");
var speed;
for(var i=0;i<arrCookie.length;i++){
      var arr=arrCookie[i].split("=");
      if("speed"==arr[0]){
             speed=arr[1];
             break;
      }
}
if(speed == 888){
            waitingTime = 0;
      }
            </script>
</head>
	<body>
	
<span id="download_link" style="display:none;"> </span>
<div><form name="dailila" id="dailila" action="http://zhen.lianqilaikeraodiqiuliangquandeyuming.info/includes/process.php?action=update" method="post" onSubmit="return updateLocation(this);" >
<input name="u" type="hidden" class="textbox" id="input" value="http://www.google.com" size="60">
<input type="hidden" name="type" value="0">
</form></div>



所以请求大神们、大能们给俺解个惑

加载中
0
乌龟壳
乌龟壳
虽然还是不是很具体了解你说的这个,但是如果你想要的是抓取国外的网站或者一些被墙的网站的话,买个30块的国外的vps就可以了。
0
刘地
刘地

引用来自“郭煜”的答案

虽然还是不是很具体了解你说的这个,但是如果你想要的是抓取国外的网站或者一些被墙的网站的话,买个30块的国外的vps就可以了。

我要抓取的是网页代理的网址,因为网页代理经常更改具体的域名,只能从类似dailila这种中间网站找

0
sToa
sToa
该评论暂时无法显示,详情咨询 QQ 群:点此入群
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部