如何禁止浏览器爬虫

 时间:2024-11-01 00:11:57

1、(1)禁止所有搜索引擎访问网站的任何部分。User-agent: *Disallow: /

2、(2)允许所有的robots访问,无任何限制。User-agent: *Disallow:或者User-agent: *Allow: /还可以建立一个空文件robots.txt或者不建立robots.txt。

3、(3)仅禁止某个搜索引擎的访问(例如:百度baiduspider)User-agent: BaiduSpiderDisallow:/

4、(4)允许某个搜索引擎的访问(还是百度)User-agent: BaiduSpiderDisallow:User-agent: *Disallow: /这里需要注意,如果你还需要允许谷歌bot,那么也是在“User-agent: *”前面加上,而不是在“User-agent: *”后面。

5、(5)禁止Spider访问特定目录和特定文件(图片、压缩文件)。User-agent: *Disallow: /AAA.net/Disallow: /admin/Disallow: .jpg$Disallow: .rar$这样写之后,所有搜索引擎都不会访问这2个目录。需要注意的是对每一个目录必须分开说明,而不要写出“Disallow:/AAA.net/ /admin/”。

  • 小黑盒护眼模式怎么开启
  • 京东APP如何快速取消全部商品收藏
  • 怎么卸载win10隐藏程序
  • 关于雷神笔记本电脑一键重装win7的问题教程
  • H5加密加固的三个技巧
  • 热门搜索
    迅捷路由器怎么安装 word中如何自动生成目录 毛蟹怎么吃 差强人意是什么意思 suv是什么意思 如何网上购物 王者荣耀转移号是什么意思 如何去除红血丝 如何提高性持久能力 拘留所的生活