16
回答
php怎么样防爬虫好呢?
开发十年,就只剩下这套Java开发体系了   

我的一个网站,有一篇文章,正常来的,访问一次,浏览量加一(更新数据库的文章表里面的一个字段),然后记录文章ID到cookie,,然后cookie设为24小时过期。

这样就做到一天一个访客浏览量加1


但是现在问题是爬虫,好象可以不停的刷新我的页面,不受cookie限制。有什么好的办法呢

语言是php

PHP
举报
半醉人间
发帖于5年前 16回/1K+阅
共有16个答案 最后回答: 5年前
用文章后加脚本的方式的方式统计。然后生成页面的时候根据IP,ua,时间之类的的信息做个加密,把加密串写到页面上,然后脚本带着这个串往后台发起统计。后台校验该串是否正确。

用ip 就行了....cookie不保险. 记录浏览ip和浏览日期.下次浏览的时候检测该ip上次浏览的时间.

当然ip也不是100%保险..

<!--- 在文章中间加乱码字符----  采集过去 乱码就没人采集了散---   现在采集程序模拟浏览器浏览的-- 用cookie 什么的没什么用  --->  我错了,, 请无视---

有一类爬虫是模仿cookie的而且是模仿浏览器点击页面打开的,跟真实用浏览器打开没有任何区别是不可能被防止的

我做过的ruby的nokogiri+watir  webdriver就是这种的,

顶部