编程技术分享平台

网站首页 > 技术教程 正文

用户反馈网站访问突然很慢,如何快速排查和解决?

xnh888 2024-09-14 15:34:50 技术教程 79 ℃ 0 评论

本文出自头条号老王谈运维,转载请说明出处。

问题场景:某个用户向你反馈某网站访问速度很慢,但是该用户访问其他网站很正常,如何快速排查问题原因,怎么解决问题呢?

登录后台服务器或者监控平台,查看系统资源是否达到上限,例如:CPU、内存、磁盘、I/O、网络带宽等,如果是这些问题,先将这些问题逐一解决:

1、服务器负载过高,比如说CPU和内存消耗完了

  • 如果是访问量导致的,那就要考虑服务器扩容
  • 如果是性能的问题,通过日志查到慢查询的代码
  • 查看一下CPU占比较高的进程,然后使用jstack命令生成进程的堆栈信息

2、服务器出口带宽不够用

  • 用户访问量上来了,并发量大了,分给用户的出口带宽变小,增加带宽即可加
  • 检查Web服务器的请求日志,是否存在DDos攻击

3、内存使用过高

  • 将没有用的进程杀掉
  • 查看占用进程高的应用的日志,对其做相应用的优化
  • 增加内存

通过pstack这些工具去查对应进程的pid对系统调用的情况来定位故障原因

4、I/O读写负载过高

  • 因为读数据库导致IO过高,通常是慢查询导致的,交给开发让他们去优化
  • 如果是Web访问量过大而导致大量写日志的,可以考虑暂时将日志关闭,或优化日志
  • 因为写数据库导致IO过高的,增加DB的缓存的内存参数或升级硬盘,将硬盘换成SSD硬盘

5、磁盘空间满了

  • 需要及时清理磁盘

看似非常的轻松容易,但是假设你的业务部署相对复杂,涉及到多台服务器,多台数据库,甚至更多数据结构,对于问题的排查就会增加很多工作。如何做到快速的数据汇聚与查看呢?

今天给大家推荐一款非常实用的运维工具——王教授

这个小工具可以为用户提供基于云端的可视化数据监控与汇聚,帮助我们在监控事件发生后,快速分析和定位问题。

通过将时间序列指标数据(如业务、应用、云、基础架构等指标),发送至时序监控 SaaS 平台。对于实时获取资产的监控信息,还可以通过将任意维度数据进行有机组合,基于统一坐标轴图表展示,利于综合分析,全面了解系统状况。

监控对象既可以是一台服务器,也可以是运行的服务,比如 Nginx,Apache 等。

配置与使用

1、连接云服务

在开始查看“统一监控”之前,我们需要先在王教授中配置连接云服务。

详细步骤可点击链接:

https://help.prof.wang/doc/e86f4172d860e889e73aaf20be5cb8f2c9c45362

2、接入监控数据

王教授“统一监控”功能由 Forethought 先见平台承载,目前支持三种接入方式:

  1. 阿里云云监控
  2. 通过 Telegraf 收集监控指标进行汇聚展示
  3. 通过 Prometheus Exporter 收集监控指标进行汇聚展示

监控指标接入王教授 Forethought 之后,就可以开始配置日常工作中,需要经常查看的监控视图。

详细步骤可参考链接:

https://help.prof.wang/doc/552affdbdb4545ff274429ae6e9a26d648d5fde8

3、配置自定义监控视图

点击“王教授”的“监控”菜单,进入 Forethought 先见平台,在 Forethought “洞察” 页面,点击左侧“新建视图”,创建视图名称后,选择需要在该视图下查看的监控指标,如CPU使用率、内容使用率等等。

若王教授连接了多个阿里云账号,“Forethought”支持多账号下的监控指标统一展示。

若王教授连接了阿里云后,又接入了 Prometheus Exporter 的监控指标,“Forethought”支持两者的监控指标在同一个视图中对比展示。

此外王教授的“资产”页面,也提供基于单个资产所有监控指标的查看。

具体步骤可参考:超实用的云资源运维管理小工具,多号归一集中管理


网站崩溃找不到原因?平台搭建无从下手?热门技术不想落伍?想要变强找不到资料?

加入[IT拯救联盟],让大牛和同伴拯救你,带你装x带你飞。定期干货分享、大牛专业解答、实用IT工具优选.....

私信小编“联盟”,即可加入我们~

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表