首页
开源软件
问答
博客
翻译
资讯
Gitee
众包
活动
专区
源创会
高手问答
开源访谈
周刊
公司开源导航页
登录
注册
资讯
软件
博客
专区
问答
活动
工具
培训
众包
APP
Gitee
新媒体
OSC 公众号
硬核 + 嬉笑怒骂
OSC 微博
技术圈大 V 出没
OSC 视频号
AI 百科
OSC 今日头条
微头条显行业百态
LFOSSA 公众号
LF 开源软件学园
Gitee AI 公众号
大模型托管平台
Gitee 服务号
研发管理解决方案
登录
注册
开源问答
技术问答
正文
如何设计爬虫代理机制?
happylifelx
发布于 2014/09/27 12:02
阅读 2K+
收藏
1
答案
8
Java
9月21日,源创会西安,聊聊大模型技术与产业应用
目标是抓取几十个网站,但其中只有少数网站的某些域名下会有反爬机制,试着用代理访问,相比不用代理访问速度明显较慢,而且IP质量有的很不好,觉得要是本来不用代理的也加代理的话也没必要,但是想让自己的爬虫不被封,还尽可能的有效率,有什么好方法吗,大家都用什么机制?IP质量难以保证怎么弄啊
收藏 (
1
)
分享
微博
QQ
微信
举报
加载中
最多投票
最新
我要回答
热门内容
更多精彩内容
开源日报 | Swift 6发布;Mistral推出开发者免费套餐;Java 23发布;“国服最强”开源模型将何去何从;为啥机器要做成人形?
国产数据库管理工具 CloudDM v2.8.2 发布,修复 Bug 若干
英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型
协程的原理与实现:GMP 源码走读
Go 语言社区系统 BBS-GO 4.0.3 发布
8000 多名 JS 社区成员联名让 Oracle 放弃 JavaScript 商标!包括 JS、Node、npm 创建者等核心人物
Swift 6 发布
Go 卷土重来:其复兴动力何在?
CrateDB 5.8.3 发布,分布式 SQL 数据库
UJCMS 9.6.2 发布,Java CMS 网站内容管理系统
:fire: 理解 Liquor :动态编译 Java 代码的神器
Java 23 / JDK 23 正式发布
smart-doc 3.0.8 发布,Java 零注解 API 文档生成工具
Openfire 4.9.0 发布,即时消息传输平台
Linux Kernel 6.11
XL-LightHouse 2.2.7 发布,轻松实现大数据实时统计
Linux 基金会宣布成立 OpenSearch 软件基金会
Skyeye 云智能制造 v3.14.5 发布,ERP 商城
avue v3.5.0 已经发布,基于 Element 的前端框架
Xinference v0.15.1 更新指南:图像模型兼容 SDAPI 等新功能!:tada:
模拟登录流程
Eclipse提交项目到github
Maven Assembly构建发布包
Vps虚拟化技术
Netty自定义协议
Java Instrumentation 进行热替换
线程安全容器类
Redis的安装与使用
Dubbo的一次体验与分析
游戏中发送道具奖励的概率算法
Maven打包包含源码
游戏缓存粗谈
如果需要精确的答案,请避免使用float和double
for-each循环优先于传统的for循环
消息中间件-Activemq之Master-Slaver
Raft算法浅析
Redis window环境
RDD编程
Eclipse翻译插件
Android+eclipse+maven环境搭建
从ACID到CAP/BASE
Java字符集和编码
Thrift 使用
异步编程RxJava-介绍
Eclipse远程连接Hbase
Bash入门教程
Spark本地模式运行
如果其他类型更适合,则尽量避免使用字符串
Java CAS操作的ABA问题
Windows下svn服务器安装
Thrift代理Hbase
Socket的半包,粘包与分包的问题
Java中的script引擎在游戏中的使用
CountDownLatch和CyclicBarrier的区别
并行编程下的选择
EasyProtocol介绍和使用
关于社交类游戏的服务器端架构
Zookeeper序列化组件Jute分析
Java分布式应用简介
Eclipse中使用真机调试android程序
对协程的一些理解
MySQL引擎
Java压缩算法性能比较
VisualVm插件安装配置
ToolProvider.getSystemJavaCompiler()为空的问题
Hessian体验与分析
Netty通过MBean监控流量
Eclipse插件protobuf-dt
Java虚拟机运行时数据区
Java代理-Javassist
Github管理Eclipse分布式项目
Netty实现shadowsocks客户端
TCP/IP,http,socket,长连接,短连接
2PC/3PC到底是啥
只针对异常的情况才使用异常
基本类型优先于装箱基本类型
Excel2db-excel转成二进制文件
Redis脚本实现分布式锁
Netty模拟redis服务器
Spring整合Hessian与分析
Java 流io和块io
Android问题汇总
Eclipse记录
Linux启用root用户
Redis的集群
Hexo在github上搭载个人博客
Netty基于protobuf协议的编解码
Kafka快速开始
Paxos算法浅析
Eclipse中创建gradle项目
Eclipse+Maven+Nexus+Hudson+Svn自动部署
Redis集群方案
Java原码,反码和补码
基于ELK5.1(ElasticSearch, Logstash, Kibana)的一次整合测试
调用构造器的处理步骤
Unix i/o模型
HttpClient执行Https请求与分析
Eclipse连接Hadoop分析的三种方式
ZAB协议和Paxos算法
Mysql的过程和函数(记录)
全站热门评论
z-zg
2024-09-18 21:14
现在与es的区别大吗?
kushu001
2024-08-14 15:24
为什么一定要强调“国产”?是开源的项目么?如果开源,是不是不接受国外开发者的贡献?我只是好奇,不带“国产”,是宣传不了了么😀
osc_566335
2024-08-05 10:48
os是媾粉聚集地还不了解吗?只要碰到国产、华子相关报道,必然评论区乌烟瘴气口伏声难止。还能期待啥有深度发言?大佬敢发这些,那还给搞前端什么都懂的“程序员”粪死?
烈冰
2024-07-22 08:41
不如说国内90%的电脑都没安装CrowdStrike软件
osc_50722289
2024-09-06 13:51
如果苹果不让步,微信也不让步那就好看了!微信在中国深入寻常百姓家!支付社交微信根本离不开,如果微信不在IOS上更新,苹果“不用混了”
279778325
2024-08-16 16:22
好不容易有个国产开发平台,没有鼓励只有贬低,就算宣传夸大怎么了?那么较真干什么?遍地都是夸大的广告宣传怎么不一个一个去找厂家?批判的同时想想自己能搞一个吗?为什么加上国产俩字就非要这么较真?
z
zb79463626
2024-08-26 15:51
IBM中国哪有什么研发? 全部都是测试!所谓的搞研发的都是去养老混日子的!
平波
2024-07-07 16:54
吃完就砸锅,好像那个啥纯血,吃完了,就想把小米,oppo、vivo的锅咂了;😂
小而美软件开发
2024-09-19 06:40
挺会耍流氓的啊
-SORA-
2024-09-18 20:46
你是哪个倒霉公司的,我替你同情一下它吧🤪
智布道
2024-08-13 12:02
不管是谁在打平安县城,我三五八团一定帮帮场子!
HalLi
2024-09-09 01:10
普通用户不懂就算了,怎么连程序员都不懂?苹果是全平台30%,国产是渠道服50%。微信、抖音这种大app哪来的渠道服,除了游戏,哪个app带渠道服。
0day
2024-07-21 11:52
一个流氓也配谈安全?
平波
2024-09-18 20:46
我写的东西,他们都看不懂,哈哈;所以他们没法毕业我,你就不一样了,CRUD的活,谁都可以干,要小心啊
infoworld
2024-09-11 18:00
感谢,正是有你们这些先驱做的实事,才能避免被国外的系统和应用垄断。
Yanlongli
2024-07-11 17:28
降低了视觉复杂性,增高了操作复杂性。
Azeroth008
2024-07-09 10:43
有自研操作系统挺好的啊,那些乱喷的人是什么心态?
寻梦
2024-09-18 22:35
着实大开眼界
Artrener
2024-07-21 15:12
可以看他不爽,看360不爽,但人家说的是事实。比如说航空业的业内人士也这么说的。
平波
2024-09-18 20:35
就你那思维能力,写CRUD,都是漏洞百出的;🤣
Kevin586
2024-07-29 17:09
真降低成本还是得换go,java太吃内存了
优秀良民
2024-07-10 16:17
明明能躺平,明明可以割韭菜,还花钱研发?为了找骂?说这个能割韭菜?你被割了?你买了吗?是谁年年换mac,是谁年年换iphone?华为的用户好像没有那么干的吧?真让我一个小米用户都看不下去了!
小而美软件开发
2024-09-19 06:38
这不是道德绑架吗
Binx
2024-09-07 08:28
最好提高苹果税到80%,不然怎么彰显尊贵的苹果用户身份
-SORA-
2024-09-18 20:59
啊波波,是波波!有华为的地方,一定有傻波波!😁
-SORA-
2024-09-18 21:04
出现了,野生的波波!只要有华为,就会有波波😏
-SORA-
2024-09-18 20:37
你应该好好补习初中哈,不要整天想这些不属于你的东西哈😁
平波
2024-09-18 20:43
你是哪个垃圾公司的,我防范一下🤣
songdragon
2024-08-14 13:11
这个对比的条件还存在好几个问题。 1. solon使用的是smart-http,spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同,性能更好的原因大概率是web服务器、应用配置依赖导致的。 如果要拉齐,需要使用同样的web服务器,spring应用排除掉所有的自动配置,只保留web必须的,才能说明框架的性能差距。 现在这个结果,无法说明solon本身性能好。
CloudShi83
2024-07-06 17:13
感谢祖师爷赏饭吃,给你磕一个
f
fzn0268
2024-09-04 14:26
这是那个做代码生成器的老哥起的吧
-SORA-
2024-09-18 20:39
你的任务是补习基础,CRUD对你来说还太奢侈了😂
-SORA-
2024-09-18 20:44
你不如先担心你自己所在公司会不会因为你制造的灾难,把你毕业了🤣
-SORA-
2024-09-18 20:50
傻波波
-SORA-
2024-09-18 20:13
希望你不仅仅是记住这话、复述这话,还要深刻理解这话,明白你数学老师当年为什么要说这话。😎
简洛-默
2024-08-12 19:31
你是家里才通网吗? 龙芯早都弃用MIPS了,现在是自研的LoongArch。 自己好好看看吧:https://loongarch.dev/zh-cn/posts/20210501-loongarch-manual/
osc_566335
2024-08-01 15:05
“虽然两人只有大专学历”—— 大专也算高等教育,现在这些媒体口中已经文盲一个级别的感觉了吗?
平波
2024-09-18 20:40
初中知识都太难为你了,你还是回小学去吧😄
-SORA-
2024-09-18 20:48
你写的都是啥垃圾玩意,别人根本不需要,你连同你的代码一起消失就好了🤣
小而美软件开发
2024-09-19 06:39
这不是绑架吗
小而美软件开发
2024-09-19 06:46
只要她没有思想就是白搭
我有我可以
2024-07-09 11:40
喷子们之所以喷,其本质是为自己的阴暗和自卑找理由罢了。
Tobyee
2024-07-09 11:04
没GMS是借口,本质还是不想适配国内的手机系统,等鸿蒙Next出来,看微软拥抱不拥抱就知道了
平波
2024-09-18 20:49
今天咱们要霸屏,搞出名,哈哈,学渣哥,咱们共同努力;
平波
2024-09-18 20:55
还有芯片原理;最有名的就是香农同学硕士论文,关于电子开关与布儿代数。数字电路就是这么被发明出来的;超有意思的;
-SORA-
2024-09-18 20:38
庆幸你不是做技术的,不然干什么都是灾难🤣
平波
2024-09-18 20:33
要不你也堆砌点名词出来,让我瞅瞅;😄
dwingo
2024-07-18 10:12
不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.
liming0101
2024-09-10 09:09
什么纳吉东西,还碰瓷黑神话
fastfail
2024-09-19 08:43
吃瓜
平波
2024-09-18 20:31
知道什么理想环不?😂
-SORA-
2024-09-18 20:10
看来确实你数学老师对你这么说过。 你现在又复述了一遍,就是当年数学老师对你说话时的情景再现吧。😂
kakai
2024-09-07 10:39
微信咋得罪你了?不管怎么样,微信此举哪怕从自身商业利益出发,让苹果降低中国税率这是利于中国人的,这个税率可不仅仅是针对微信的,还苹果大功一件,这是多么愚蠢、可耻的言论!
黑人牙膏
2024-07-21 12:12
真的人不要脸则无敌,只要他不尴尬,尴尬的是别人。
-SORA-
2024-09-18 20:06
你应该补习初中,不要眼高手低😁
平波
2024-09-18 20:52
话说,你真的不懂香农信息论里编码是什么意思吗,私下,我可以教你;
blue_think
2024-08-26 11:00
别光喷华为啊,说点你自己的能力,到了什么程度,有什么成就,这样好歹有点说服力吧
-SORA-
2024-09-18 20:57
香农信息论一一般般,不如你创立的平波信息论的民科编码,世界独你一份。😏
大后锋
2024-07-10 14:03
然后交警找责任方,打过去是牛逼高大上的生成式AI的客服
平波
2024-09-18 20:42
按理说写CRUD的,一对多的关系应该是了熟于心的,为什么一个数的映射会有多种情况,这么简单的道理都不懂;很担心你们公司的信息系统;🤣
h
happylifelx
最近登录:2015/11/29 16:32
全部
hap...的其他提问
如何求无向图中两点间距离为2和3的所有路径?(即限定深度之内的所有路径)
0 回答
590 阅读
无权无向图有什么最短路径算法?
2 回答
2K+ 阅读
求一个C4.5决策树分类算法的代码
0 回答
291 阅读
java中LinkedList队列不为空却发生NoSuchElementException是怎么回事
0 回答
1K+ 阅读
java程序中如何写一个比较有效的垃圾回收的方法?
14 回答
1K+ 阅读
热门资讯
1
VirtualBox 7.1 发布
2
Java 23 / JDK 23 正式发布
3
我国半导体制造核心技术实现突破
4
开源日报 | “纯血”鸿蒙9月底正式发布;VirtualBox 7.1;OpenAI o1的价值及意义;云计算的底色;丰田的软件危机
5
OpenAI 发布全新的 o1 系列模型
6
李飞飞创办的 World Labs 获 2.3 亿美元融资
7
全球 6G 标准化工作进入实质阶段
8
李开复:中国人工智能大模型落后美国同行 6 至 9 个月
9
Go 卷土重来:其复兴动力何在?
10
deepin 25 开发计划大揭秘:新增功能与性能优化一览
热门软件
Droid Wall
- Android防火墙软件
SearchStatus
- FireFox的SEO工具条
Sexybuttons
- 网页按钮
PowerDNS
- 开源DNS服务器
Jazz
- IBM软件开发协作平台
Apache Cassandra
- 分布式 K/V 存储方案
OpenJDK
- Java 开发环境
qTip
- jQuery工具提示插件
Squid
- 代理服务器
Eclipse SQL Explorer
- 瘦 SQL 客户端
SQLike
- JavaScript查询引擎
JCaptcha
- Java验证码生成库
JSP Layout
- JSP布局框架
Open ModelSphere
- 开源建模工具
StatusNet
- 微博客平台
Redmine
- 项目管理和缺陷跟踪工具
jQuery Raty
- jQuery 星级评分插件
GPars
- Groovy的并行处理框架
Cosmetic
- 零售服务业综合运营系统
Infobright
- MySQL数据仓库解决方案
登录后可查看更多优质内容
使用微信快捷登录
©OSCHINA(OSChina.NET)
工信部
开源软件推进联盟
指定官方社区
社区规范
深圳市奥思网络科技有限公司版权所有
粤ICP备12009483号
顶部