关于爬取没有设置robots.txt的网站的法律风险

hzucc 发布于 07/10 08:40
阅读 6K+
收藏 2

如果要爬取的网站上没有设置robots.txt,那么是不是代表默认都允许爬取呢?有没有法律风险呢?

加载中
2
西红柿幽幽子
西红柿幽幽子

robots.txt 只是一个行业内部潜规则,没有法律约束力。一切以计算机信息系统相关法律为准

1
Holt_Vong
Holt_Vong

看你遇上谁了,要是南山必胜客,那就等嗝屁

一枚假程序猿
一枚假程序猿
从此南山再无必胜客……
0
玖伍贰柒
玖伍贰柒

robots.txt 是行业规则,有段时间百度都无视这个文件,并无法律效果

dingdayu
dingdayu
在判责是就成为一个依据了。
0
Mayeff
Mayeff

爬虫都是有风险的吧

欧阳春晖
欧阳春晖
爬公网网站资源没问题,但是爬隐私什么的就有问题了,通常可以认为没有明确robot的网站可以爬(因为公网能检索的基本都是可以对外的),但不能爬robot明确禁止的内容
0
sxgkwei
sxgkwei

一般不模拟登录再爬取,就没有风险。

0
丁富贵

robots.txt 是老外订的约定,我天朝自有国情。我朝法律好像是按爬虫占对方流量比例判断的。

0
W
WindSpeed

不是大规模扒别人数据,或者比较隐私的非公开的,随便爬

0
开源中国首席罗纳尔多
开源中国首席罗纳尔多

您好,请问 robots.txt 在哪里获取? 模拟登录再爬取不合法的吗?

最爱的洋芋坨坨
最爱的洋芋坨坨
web 根目录
0
luisleee
luisleee

引用来自“开源中国首席罗纳尔多”的评论

您好,请问 robots.txt 在哪里获取? 模拟登录再爬取不合法的吗?

一般网站根目录就有。模拟登录之后会有用户名留下。

返回顶部
顶部