网站首页 > 技术教程 正文
使用场景:
新建网站robots时,网站没有限值任何蜘蛛的爬取数量限值,导致网站因为蜘蛛的大量爬取,网络带宽资源占用过高,来判断哪个蜘蛛的访问频率比较大所以今天我们写一个如何查看网站访问日志来观察蜘蛛的实时访问量。
使用步骤:
这里以字节的蜘蛛为例,从2019年就开始认证站长,带宽资源占用非常大,收录没几个,蜘蛛每天上万或者大几千,严重拉慢了网站的速度。
第一步:打开宝塔后台,打开终端,
第二步:输入下面的命令观察蜘蛛
tail -f /www/wwwlogs/www.playezu.com.log | grep spider
第三步:可以结合nslookup查询是否为字节蜘蛛
nslookup + ip win运行ctrl+r 输入cmd
第五步:nginx将字节蜘蛛跳转403
if ($http_user_agent ~* "toutiao|Bytespider") { return 403; }
猜你喜欢
- 2024-10-12 国内高防部署证书后自动301跳转https访问
- 2024-09-22 Nginx 反向代理学习及实例笔记(nginx反向代理rewrite)
你 发表评论:
欢迎- 08-06linux 和 windows文件格式互相转换
- 08-06谷歌 ChromeOS 已支持 7z、iso、tar 文件格式
- 08-06Linux下比较文件内容的6种方法
- 08-06文件格式及功能汇总
- 08-0610个Linux文件内容查看命令的实用示例
- 08-06Linux-如何区分不同文件类型
- 08-06Zabbix技术分享——监控windows进程资源使用情况
- 08-06Linux系统卡顿?学会ps命令这三招,轻松定位问题进程
- 最近发表
- 标签列表
-
- 下划线是什么 (87)
- 精美网站 (58)
- qq登录界面 (90)
- nginx 命令 (82)
- nginx .http (73)
- nginx lua (70)
- nginx 重定向 (68)
- Nginx超时 (65)
- nginx 监控 (57)
- odbc (59)
- rar密码破解工具 (62)
- annotation (71)
- 红黑树 (57)
- 智力题 (62)
- php空间申请 (61)
- 按键精灵 注册码 (69)
- 软件测试报告 (59)
- ntcreatefile (64)
- 闪动文字 (56)
- guid (66)
- abap (63)
- mpeg 2 (65)
- column (63)
- dreamweaver教程 (57)
- excel行列转换 (56)
本文暂时没有评论,来添加一个吧(●'◡'●)