Inspur NF3180A6 Operation and Maintenance Manual

タイプ
Operation and Maintenance Manual

このマニュアルも適しています

浪潮英信服务器
NF3180A6_NF3280A6
BMC 日志收集和分析指南
文档版本 V1.0
发布日期 2021-04-08
版权所有 © 2021-2022 浪潮电子信息产业股份有限公司。保留一切权利。
未经本公司事先书面许可,任何单位和个人不得以任何形式复制、传播本手册的部分或
全部内容。
环境保护
请将我方产品的包装物交废品收购站回收利用,以利于污染预防,共同营造绿色家园。
商标说明
Inspur 浪潮、Inspur、浪潮、英信是浪潮集团有限公司的注册商标。
本手册中提及的其他所有商标或注册商标,由各自的所有人拥有。
安全声明
服务器产品安全一直是浪潮关注的焦点,保障产品安全是浪潮的关键战略之一。为使您
更清晰地了解服务器产品,请注意如下安全风险声明。
a. 在调整用途或淘汰服务器时,为了保护数据隐私,允许从 BIOSBMC 中恢复固件
出厂设置、删除信息、清除日志。同时,建议采用第三方安全擦除工具对硬盘数据
进行全面安全擦除。
b. 您购买的产品、服务或特性在业务运营或故障定位的过程中将可能获取或使用用户
的某些个人数据(如告警邮件接收地址、IP 地址),故您有义务根据所适用国家的
法律制定必要的用户隐私政策并采取足够的措施,以确保用户的个人数据受到充分
的保护。
c. 服务器开源软件声明的获取,请直接联系浪潮客户服务人员咨询。
d. 部分用于生产、装备、返厂检测维修的接口、命令,定位故障的高级命令,如使用
不当,将可能导致设备异常或者业务中断,故不在本资料中说明。如需要,请向浪
潮申请。
e. 浪潮建立了产品安全漏洞应急和处理机制,保证第一时间及时处理产品安全问题。
若您在浪潮产品中发现任何安全问题,或者寻求有关产品安全漏洞的必要支持,可
以直接联系浪潮客户服务人员。
浪潮将一如既往的严密关注产品与解决方案的安全性,为客户提供更满意的服务。
内容声明
您购买的产品、服务或特性等应受浪潮集团商业合同和条款的约束。本文档中描述的全
部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,
潮集团对本文档的所有内容不做任何明示或默示的声明或保证文档中的示意图与产品
实物可能有差别,请以实物为准。本文档仅作为使用指导,不对使用我们产品之前、
间或之后发生的任何损害负责,包括但不限于利益损失、信息丢失、业务中断、人身伤
害,或其他任何间接损失。本文档默认读者对服务器产品有足够的认识,获得了足够的
培训,在操作、维护过程中不会造成个人伤害或产品损坏。文档所含内容如有升级或更
新,恕不另行通知。
技术支持
技术服务电话:4008600011
址:中国济南市浪潮路 1036
浪潮电子信息产业股份有限公司
箱:serversupport@inspur.com
编:250101
前言
摘要
本手册介绍 BMC 各日志类型的功能特点,获取方法以及分析示例
目标受众
本手册主要适用于以下人员:
技术支持工程师
产品维护工程师
建议由具备服务器知识的专业工程师参考本手册进行服务器运维操作。
注意
如您未采购装机服务,请在设备开箱前自行检查外包装箱。如发现包装箱严重损坏、
水浸、封条或压敏胶带已开封,请视购机方式进行问题反馈。供应商渠道购入设备,
请直接与您的供应商联系;浪潮直营渠道购入设备,请直接拨打服务电话
4008600011,联系浪潮技术支持处理。
请不要随意拆装服务器组件、请不要随意扩配及外接其它设备。如需操作,请务必
在浪潮的官方授权和指导下进行。
在拆装服务器组件前,请务必断开服务器连接的所有电缆。
请使用浪潮认证的驱动程序进行 OS 环境搭建。您可访问浪潮官网进行驱动下载,
进入浪潮官网首页,顶部导航栏选择支持下载 > 产品支持 > 驱动下载,根据页面
提示查找产品对应的驱动程序。如使用非浪潮认证的驱动程序,可能会引起兼容性
问题并影响产品的正常使用,对此浪潮将不承担任何责任或义务。
BIOSBMC 的设置对配置您的服务器至关重要,如果没有特殊的需求,请您使用
系统出厂时的默认值,请勿随意更改参数设置。首次登录时,请及时修改 BMC
户密码。
符号约定
在本文中可能出现下列标志,它们所代表的含义如下。
图标
说明
如不当操作,可能会导致死亡或严重的人身伤害。
如不当操作,可能会导致人员损伤。
如不当操作,可能会导致设备损坏或数据丢失。
为确保设备成功安装或配置,而需要特别关注的操作或信息。
对操作内容的描述进行必要的补充和说明。
变更记录
版本
时间
变更内容
V1.0
2021-04-08
首版发布
1 概述 .............................................................................................................................. 1
1.1 文档用途 .......................................................................................................................... 1
1.2 目标读者 .......................................................................................................................... 1
1.3 适用范围 .......................................................................................................................... 1
2 系统事件日志 ............................................................................................................... 2
2.1 功能特性 .......................................................................................................................... 2
2.2 记录内容和分类 .............................................................................................................. 2
2.3 获取方法 .......................................................................................................................... 3
2.3.1 通过 BMC WEB 获取 .......................................................................................... 34
2.3.2 通过 ipmitool 获取 ............................................................................................... 5
2.4 日志含义分析示例 ........................................................................................................... 5
2.4.1 开关机系统事件日志示例 .................................................................................... 5
2.4.2 温度过高告警示例 ............................................................................................. 56
2.4.3 看门狗告警示例................................................................................................... 6
3 浪潮故障诊断日志(IDL) ................................................................................................ 7
3.1 功能特性 .......................................................................................................................... 7
3.2 获取方法 .......................................................................................................................... 7
3.3 IDL 日志处理建议 ........................................................................................................ 910
3.4 IDL 日志分析示例 .......................................................................................................... 10
3.4.1 开关机系统时 IDL 日志示例 .............................................................................. 10
3.4.2 温度过高告警示例 ............................................................................................. 10
3.4.3 看门狗告警示例.............................................................................................. 1011
4 审计日志 .................................................................................................................. 1112
4.1 功能特性 ..................................................................................................................... 1112
4.2 获取方法 ..................................................................................................................... 1112
4.3 日志含义分析示例 ...................................................................................................... 1213
4.3.1 开关机审计日志示例 ...................................................................................... 1213
4.3.2 WEB 操作和设置 ............................................................................................ 1213
5 一键收集日志 .......................................................................................................... 1314
5.1 功能特性 ..................................................................................................................... 1314
5.2 获取方法 ..................................................................................................................... 1314
6 日志分析对比示例 ...................................................................................................1415
6.1 开关机产生的日志对比示例 ....................................................................................... 1415
6.2 BMC 网络设置产生的日志对比示例........................................................................... 1415
6.3 温度过高产生的日志对比示例 ................................................................................... 1516
6.4 看门狗告警示例 ......................................................................................................... 1516
1
1 概述
1.1文档用途
本文档详细介绍了 BMC 各日志类型的功能特点获取方法以及分析示例相关技术人员能够
通过此文档了解各类型日志收集信息的查看和分析方法有效进行故障诊断
1.2目标读者
软件开发人员、系统集成人员、测试人员和用户
1.3适用范围
本文档适用于 NF3180A6NF3280A6 机型。
2
2 系统事件日志
2.1功能特性
系统事件日志提供主要设备状态变化的历史记录,用于故障诊断。BMC 能够记录基于 IPMI
感器的事件历史记录IPMI 规范定义的 IPMI 标准的事件均会被记录。系统事件日志输出以下
信息,用户可以通过 WEB IPMI CMD 获取传感器事件信息。
系统事件日志的功能特性如下
最多支持 3639 个条目。
支持循环模式,且为默认模式。当 SEL 已满时,最旧的日志将被丢弃,新产生日志被保
留。
SEL 接近满(75%)时,将满的日志将被记录在 SEL 中。
操作清除 SEL 时,1条“SEL 被清除”的日志将被记录在 SEL 中。
支持通过 WEB IPMI CMD 导出 SEL
支持通过 SNMP TrapSyslog 通知事件到远程客户端。
2.2记录内容和分类
系统事件日志记录遵循 IPMI 规范,当 IPMI 标准事件被触发后,BMC 会记录系统事件日志。
系统事件日志按照日志输出内容可分为阈值型通用型和传感器特定型
2-1 事件日志类型说明
类型
描述
阈值型
传感器会设定一定的阈
值,根据传感器当前读值
与阈值比较,触发日志告
警。例如温度、电压,
扇转速等传感器。
3
类型
描述
通用型
表示一些和部件类型无关
的通用状态型传感器日志
告警。例如:在位、拔插、
可预测性故障。
传感器
特定型
特定类型传感器的离散
量,指示离散状态信息特
定于传感器类型。例如:
CPU状态、内存状态、硬盘
状态,PCIE卡状态等传感
器。
2.3获取方法
用户可以通过 BMC WEB IPMI CMD 获取系统事件日志。
2.3.1 通过 BMC WEB 获取
登录到
WEB GUI
进入日志->系统事件日志页面,此页面显示所有基于传感器的日志,
用户可以配置事件类型、传感器类型以及事件发生时间段参数,对系统事件日志进行过滤。
4
2-1 系统事件日志-WEB
2-2 系统事件日志
事件ID
SEL
中的事件
ID
时间戳
事件生成时间
传感器名称
传感器名称,可通过ipmitool sdr elist查看该设备上所有传感器名称。
传感器类型
IPMI2.0中定义的传感器类型,例如:
1. Temperature //温度传感器
2. Voltage //电压传感器
3. Processor //CPU状态传感器
4. Power Supply //PSU状态传感
5. Memory //内存状态传感器
6. Drive Slot //硬盘状态传感器
7. Critical Interrupt //PCIE状态传感器
描述
事件详细信息
2-3 系统事件日志操作说明
参数
描述
过滤
选择事件类型、传感器和起止日期以进行过滤搜索。
5
参数
描述
动作:您可以用过滤器选项(事件类型、传感器名称、起止时间),查看
设备中记录的特定事件。
导出日志
导出事件日志到本地。
清除日志
该选项将删除所有现有传感器日志记录并新增1条“sel被清除”的日志
2.3.2 通过 ipmitool 获取
使用 ipmitool 命令 sel list 或者 sel elist可列出当前设备上所有传感器的历史事件记录。显示
的日志信息包含 ID,日期,时间,传感器名称,描述和状态。
2-2 系统事件日志_IPMI_sel list
2-3 系统事件日志_IPMI_sel elist
2.4日志含义分析示例
2.4.1 开关机系统事件日志示例
事件
系统日志
开机
|01/23/2020 05:59:21|Information|ACPI_State| System ACPI Power
State|Legacy ON State-Asserted
2.4.2 温度过高告警示
事件
系统日志
CPU温度过高
|01/23/2020 05:24:57|Warning|CPU_Temp|Temperature|Upper Non-Critical-
Going High-Asserted
6
2.4.3 看门狗告警示例
事件
系统日志
看门狗告警
|01/22/2020 02:14:53|Warning|IPMI_Watchdog|Watchdog 2|Power Cycle-
Asserted
7
3 浪潮故障诊断日志(IDL)
3.1功能特性
浪潮故障诊断日志 IDL 是浪潮 BMC 独有的日志类型,用于记录 BMC 设备上基于 IPMI 传感器
的事件历史记录IDL 日志信息与系统事件日志信息一一对应,相比于系统日志信息而言,
IDL 信息提供的信息更多,更全,每条日志都有相应的处理建议,能更有效的帮助用户进行日
志诊断和分析。IDL 日志可以按照日期,严重性进行过滤,可执行日志下载和日志清除操作,
点击每条日志后侧 按钮可获取关于本条日志的处理建议以及相应的操作步骤。
3.2获取方法
IDL 日志可以从 BMC Web 获取。登录到 WEB GUI进入日志->IDL 日志页面IDL 日志页
面显示此设备上的 BMC IDL 日志列表
3-1 IDL 日志
3-1 IDL 日志特性
事件ID
IDL
日志中的事件
ID
时间戳
IDL日志记录的时间信息
严重性
事件错误等级,包括信息,告警和严重
状态
显示日志的状态,触发或解除。
事件码
告警事件的唯一故障编码长度为8个字节。参考3-3 IDL事件码说明
类型
告警事件关联的实体部件类型如下
8
1. FAN
2. INTRUSION
3. CPU
4. PSU
5. MEMORY
6. DISK
7. SYS FW PROGRESS
8. EVENT LOG
9. PCIE
10. POWER BUTTON
11. MAINBOARD
12. BMC
13. PCH
14. SYS RESTART
15. BOOT ERROR
16. BIOS BOOT
17. OS STATUS
18. ACPI STATUS
19. IPMI WATCHDOG
20. LAN
21. BIOS OPTIONS
22. GPU
23. RAID
描述
告警事件的详细描述
处理建议
针对此告警事件的处理建议
3-2 IDL 日志操作说明
参数
描述
过滤
选择严重性和起止日期以进行过滤搜索。
动作:您可以用过滤器选项(事件严重性级别、传感器名称、时间),查
看设备中记录的特定事件。
导出日志
下载IDL日志到本地。
清除日志
点击清除日志按钮将清除该BMC上所有IDL日志信息。
9
3-3 IDL 事件码说明
字节
含义
6-7
部件类型
16进制数与部件对应关系,例如:
1. 04:FAN
2. 07:CPU
3. 08:PSU
4. 0C:MEMORY
5. 0D:DISK
6. 0F:SYS FW PROGRESS
7. 10:EVENT LOG
8. 13:PCIE
9. 14:POWER BUTTON
10. 1E:BOOT ERROR
11. 1F:BIOS BOOT
12. 20:OS STATUS
13. 22:ACPI STATUS
14. 23:IPMI WATCHDOG
15. 27:LAN
16. 28:BMC
4-5
部件的序号,指在此部件类型中的序号
2-3
事件的偏移量,表示事件类型
0-1
告警级别
16进制数与告警级别对应关系:
1. F0:INFO
2. F1:WARNING
3. F2:CRITICAL
3.3IDL 日志处理建议
通过点击相应告警事件右侧的处理建议按钮,可以查看对该告警事件的处理建议
10
3-2 IDL 告警事件处理建议
3.4IDL 日志分析示例
3.4.1 开关机系统时 IDL 日志示例
事件
IDL日志
开机
|01/21/2020 00:37:45|Information|Deasserted|22000bf0|ACPI STATUS|ACPI
In Legacy ON state
3.4.2 温度过高告警示
事件
IDL日志
温度过高
|01/23/2020 05:24:57|Warning|Deasserted|070051f1|CPU|CPU Temp reading
80.00 higher than threshold 79.00 (Upper Non-Critical - Going High)
3.4.3 看门狗告警示例
事件
IDL日志
看门狗告警
|01/22/2020 02:14:53|Warning|Deasserted|230003f1|IPMI
WATCHDOG|Power Cycle due to Ipmi Watchdog Timeout
11
4 审计日志
4.1功能特性
BMC 可以记录 BMC 系统操作日志。审计日志可按照起止日期进行过滤。可显示当前审计日
志总条数。审计日志的功能特性如下
通过 Web 命令设置操作行为会被记录。
Web/SSH/KVM 登录和注销会被记录。
审计日志支持的大小是 200K,如果超过 200K,会生成备份文件
支持通过 Web 导出日志
4.2获取方法
审计日志可通过 BMC WEB 进行查看。
登录到
WEB GUI
进入日志->BMC 系统审计日志
面,可以显示 BMC 审计日志。可以通过设计起止时间对审计日志进行筛选。
4-1 审计日志
4-1 审计日志
事件ID
序号
时间戳
事件产生时间
主机名
主机名 (host name)
描述
事件详细信息
12
4-2 审计日志操作说明
参数
描述
过滤
选择起止日期以进行过滤搜索。
动作:您可以用过滤器选项(起止时间),查看设备中记录的特定事件。
4.3日志含义分析示例
以下示例为 kvm 操作web 操作ipmi 操作记录的审计日志信息。
4.3.1 开关机审计日志示例
操作
审计日志示例
开机
Power on
|01/23/2020 05:19:18|IEIB4055D9850B8|From IP:172.16.122.42 User: admin
Operation:Power On Success
关机
Power off
|01/23/2020 05:31:58|IEIB4055D9850B8|From IP:172.16.122.42 User:admin
Operation:Forcely Power Off Success
4.3.2 WEB 操作和设置
操作
审计日志示例
Web登录
|01/22/2020 22:31:44|IEIB4055D9850B8|From IP:172.16.122.42 User:admin
HTTPS Login Success
Web注销
|01/22/2020 22:31:42|IEIB4055D9850B8|From IP:172.16.122.42 User:admin
HTTPS Logout Success
操作
审计日志示例
Web修改
BMC设置
|01/23/2020 05:37:49|IEIB4055D9850B8|From IP:172.16.122.42 User:admin
Operation:Save the BMC Network
(Ifc:eth0,State:Enable,IPv4:Enable,Static,IPv6:Enable,DHCP, VLAN:Disable)
Configuration Success
Web传感器
阈值调整
|01/23/2020 05:36:05|IEIB4055D9850B8|From IP:172.16.122.42 User:admin
Operation: Set Sensor CPU_Temp threshold Success
13
5 一键收集日志
5.1功能特性
BMC 支持一键收集日志功能,通过一键收集的方法可以把当前系统的运行状态以及各种日
志信息通过打包的形式下载下来,供用户分析使用,作为故障诊断的数据依据。
收集的日志包括部件,配置,日志和运行数据一键收集日志需要用户具有管理员权限。
5.2获取方法
登录到 WEB GUI进入日志->一键收集日志页面,此页面可进行一键收集日志操作,点击一
键收集日志按钮后,大概需要 4~5 分钟时间
5-1 一键收集日志
等日志收集结束后,下载的内容包括日志,运行数据配置和部件
5-1 一键日志收集内容列表
分类
信息项
一键日志文件中的路径
日志
SEL日志
onekeylog/sel.log
操作日志
onekeylog/audit.log, audit.log1
黑盒日志
onekeylog/blackboxpeci.log
onekeylog/blackbox.log
系统日志
onekeylog/info.log,info.log1
onekeylog/warning.log,warning.log1
onekeylog/err.log, onekeylog/err.log.1
onekeylog/crit.log
onekeylog/alert.log
Onekeylog/emerg.log
更详细内容可查看:
浪潮服务器 ISBMC4 求规格 V1.6_20200609_Edit-一键日志收集列表.xlsx
  • Page 1 1
  • Page 2 2
  • Page 3 3
  • Page 4 4
  • Page 5 5
  • Page 6 6
  • Page 7 7
  • Page 8 8
  • Page 9 9
  • Page 10 10
  • Page 11 11
  • Page 12 12
  • Page 13 13
  • Page 14 14
  • Page 15 15
  • Page 16 16
  • Page 17 17
  • Page 18 18
  • Page 19 19
  • Page 20 20
  • Page 21 21
  • Page 22 22

Inspur NF3180A6 Operation and Maintenance Manual

タイプ
Operation and Maintenance Manual
このマニュアルも適しています

その他のドキュメント