首页
正文
2019/07/15

工程师笔记|服务器出故障了我却不知道?

戴尔官方企采中心

想必大家都经历过手机、电脑等电子设备出问题的情况,跟手机、电脑一样,服务器运转过程中也会出点故障,作为承载了企业各种业务的平台,服务器出故障的影响非同小可,严重时可能危及业务开展,而如果故障发现不及时,企业就会蒙受更大的损失。


最近也经常有客户询问笔者,如何才能快速发现服务器出了故障。

对此目前主要有两种方案,一是通过集中管理平台管理大量设备,定期对其进行检查,发现问题再处理;二是只要服务器出现问题,就第一时间发送事件通知出来,随后由管理员根据通知定位问题做出处理。

可以看出,第二种方法下,管理员只需关注出现问题的设备即可,不仅避免了大量的重复性设备检查工作,而且有助于问题的及时处理,比如SNMP告警。

☟☟☟



SNMP告警


SNMP

SNMP(Simple Network Management Protocol),即简单网络管理协议,是一种应用层协议,可用于网络管理。

通过SNMP,管理员可进行信息查询、设置、接收告警等,及时发现网络设备等出现的问题。


当设备状态发生变化时(比如电源断电、硬盘被移除、服务器重启或宕机等),SNMP会发送Trap消息到管理设备,实现事件通知告警等功能。这种方式下SNMP Agent主动将信息通知到管理设备,由此管理设备不必对大量设备进行定期查看,只要出现问题即可接收到信息。

而为了接收SNMP Agent发送的通知,管理端需要启用Trap接收机制——通常使用的是UDP162端口,收到Agent发送的信息时,接收端的控制台会显示事件出来,并带有描述事件的相关表述。

目前SNMP有v1、v2和v3版本,其中v3版本可以实现加密和认证,相比前两种版本更加安全,目前大多数设备都支持此版本,包括戴尔易安信服务器。

出于及时发现服务器故障的考虑,在服务器上配置SNMP是必要的。接下来我们就以一台戴尔易安信PowerEdge服务器为例,具体说明如何在服务器上设置SNMP Trap告警,并配置管理端接收信息。


1


由于SNMP v3协议需要支持认证及加密,因此在iDRAC Web UI上,首先要设置用户支持的协议类型及认证加密类型。

在iDRAC设置里找到用户配置,编辑本地用户后需要在高级设置的SNMP v3 Settings中勾选v3协议,默认是Disabled,这里需要选择Enabled来开启此用户的SNMP v3的支持。

此外认证及加密类型需要设备支持,有“认证+加密”、“认证+不加密”以及“不认证+不加密”几种选择,这里我们自行测试的话,认证及加密类型可以选择none。


2


其次,在配置的系统设置中选择告警配置的选项,为了发送告警信息,这里需要将默认的Disabled选项调整为Enabled。


3


针对告警内容,PowerEdge服务器支持多种方式的告警,包括Email、SNMP Trap、ipmi等,这里为了实现Trap功能,需要勾选SNMP Trap类别。

至于告警级别,也包括了“通知”、“警告”、“严重”三种等级,对此我们可以根据具体不同的Category进行设置。

关于类别筛选,我们可以在Alertsand Remote System Log Conguration(警报和远程系统日志配置)中执行操作:


• 系统运行状况—表示系统机箱内与硬件相关的所有警报的系统运行状况类别(示例包括温度故障、电压故障、设备错误)。

• 存储运行状况—存储运行状况类别代表与存储子系统相关的警报(示例包括控制器错误、物理磁盘错误、虚拟磁盘错误)。

• 配置—表示与硬件、固件和软件配置更改相关的警报配置类别(示例包括添加/移除的PCI-E卡、更改的RAID配置以及更改的iDRAC许可证)。

• 审核—表示审核日志的审核类别(示例包括用户登录/注销信息、密码验证故障、会话信息、电源状态)。

• 更新—更新类别表示由于固件/驱动程序升级/降级而生成的警报。

4


在SNMP Trap格式部分,选择发送Trap的版本,一般支持SNMP v1、SNMP v2或SNMP v3,为了实现SNMP v3功能这里需要选择SNMP v3,随后单击应用。SNMP端口号默认162,共同体(Community String)是v1和v2使用的(如图所示),实际上相当于密码,若需要可以进行设置,对SNMP v3协议而言则不需要此项。


5


在SNMP Traps设置中,勾选State来启用警报目标可以填写IPv4地址、IPv6地址或完全限定域名(FQDN),目前最多可以指定八个目标地址;对于Destination Address(添加的发送目标IP地址),这里的地址为管理设备的地址,比如网管平台或者Mib Browser客户端所在的地址等;至于SNMP v3 Users,只有在上一步的Trap格式选择v3后才可以在此选择用户。


6


服务器端设置完成后,还需要设置管理端,可以通过Mib Browser接受服务器发送的Trap信息。下图为Mib Browser的界面,此界面通常会包含Mib库及告警信息查看的相关内容。

管理端设置中可以添加用户,此用户要跟PowerEdge服务器上设置的用户对应,这里首先需要将SNMP版本设置为v3,之后再添加参数信息。

选择了v3之后,点击Add添加用户信息——添加目标主机的IP地址和端口,当需要从服务器获取或设置信息时,管理端会与服务器上SNMP Agent的161端口进行通信,这里认证和加密协议与之前服务器端的设置要保持一致。


7


设置完成后,打开TrapViewer即可接收告警信息,服务器状态改变后,可以看到接收端收到了一条Trap信息。

自此,服务器上的SNMP Trap告警设置完成。

可以看到,通过SNMP Trap的简单设置,用户就可以轻而易举地实现大批量设备管理操作,并且相比于人为从设备上寻找信息,被动地接收告警减少了大量的工作量,也保证了问题的及时发现,从而将损失降到最低。


服务器管理


另外,服务器管理方面,戴尔易安信的OpenManage管理平台也是个不错的选择,它可以同时管理多台设备,允许管理员全面掌控环境的运行情况,针对系统进行管理及监控,而且支持接收SNMP告警,是件全面的智能管理平台,了解OpenManage的具体应用,详见《A君的救赎》,一份IT运维工程师的自救指南。


戴尔易安信

企业级产品促销季

限时开启

现在购买普通中端存储

即可1:1免费置换全闪存

购买服务器,可享受低至二六折优惠

更有多品类产品钜惠出击

买戴尔易安信存储和服务器

现在就是最好的时候!

undefined


硬盘换闪存1:1促销,

买普通存储,免费升级全闪,不加价!


优惠多多,赶快行动吧!


相关阅读推荐:工程师笔记︱趁降价采购了一批SSD,结果管理上遇到了问题?


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
戴尔官方企采中心
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    您好,我们的在线客服人工咨询时间为工作日的 8:30-17:30,感谢您的咨询! 请留下您的联系方式,我们会在下个工作日第一时间与您取得联系,祝您生活愉快,工作顺利~
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证