服务器故障如何处理

服务器故障如何处理?面对服务器故障的发生,第一步永远是先进行必要的信息收集,对于整个系统的基本信息,故障信息、存储设备信息以及组网、主机服务器信息要有了解。

对故障可能的发生原因有一个了解,然后再细化到每个组成部分上排查可能存在的问题。

主机层

在主机层面大多需要检查的是操作系统版本,相应的HBA卡是否达到合适的标准,如速率、IOPS及带宽等。其次是在主机上安装的多路径软件,查看一下与存储设备连接的物理路径的状态以及存储LUN等信息。

网络层

网络层次可能发生的问题大多是连通性问题,由于链路故障导致的丢包或者误码率上升等现象,此现象可以在交换机上观察端口的信息,观察误码率是否在持续增长,如有,则可能存在链路部件异常或接触不良的现象。其次,可能是端口速率或带宽未达到标准,查看端口配置及协商状况,这些都有可能导致服务器安全故障或性能问题。

存储层

在底层存储方面主要考虑存储模块的配置,指示灯状态等信息,从指示灯状态我们可以分析出是否存在硬件故障等,其次在配置方面:RAID级别、分条深度、LUN读写策略、cache策略,LUN归属、硬盘类型等是否符合业务的特点以及不符合时可能导致的问题。都是需要我们在故障排查处理时需要考虑的。

以上是西部数码关于服务器故障如何处理的整理,西部数码提供高稳定高可用的云服务器产品,详情链接 https://www.west.cn/cloudhost/

赞(0)
声明:本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-62778877-8306;邮箱:fanjiao@west.cn。本站原创内容未经允许不得转载,或转载时需注明出处:西部数码知识库 » 服务器故障如何处理

登录

找回密码

注册