httpclient使用get方法调用URL,得到403

Tsunami 发布于 2013/02/21 15:34
阅读 4K+
收藏 0
String url = "http://cn.made-in-china.com";//使用此URL则返回200
//url为http://www.chinanews.com/hwjy/2013/02-20/4579723.shtml就返回403
HttpClient httpClient = new HttpClient();
GetMethod getMethod = new GetMethod(url);
int statusCode = httpClient.executeMethod(getMethod);
System.out.println(statusCode);
我就想问下,为什么有的URL访问返回200状态码,有的返回403状态码,如果是网站应用设置的,则他是如何做到这一点的?请高手指教啊~~~~~~~
加载中
0
yurii
yurii

这个其实很好解决,你用curl -I访问某个URL,就可以看到往来的header明细。

我刚才测试过chinanews的地址,是返回200的,如果是403,可能是根据你的IP或者header请求做的判断,你可以更换header(user-agent)或ip验证。

Tsunami
Tsunami
是加上这样的代码么? httpClient.getParams().setParameter( HttpMethodParams.USER_AGENT, "Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.1.2) Gecko/20090803"); 我不知道自己少了什么JAR包,httpclient没有getParams方法
0
星爷
星爷
这是协议http协议的约定 200表示成功
Tsunami
Tsunami
HTTP协议我知道,状态码的意思我也了解,只是不明白为什么换个链接而已,返回不同的状态码
0
苦寒竹
苦寒竹
防采集呗。
Tsunami
Tsunami
那网站应用如何做到防采集的呢?通过什么方法?
返回顶部
顶部