Inspur NF5888M5 ユーザーマニュアル

タイプ
ユーザーマニュアル
浪潮英信服务器用户手册
NF5888M5(AGX-5)
V1.3
尊敬的浪潮英信服务器用户:
衷心感谢您选用浪潮英信服务器!
本手册介绍了此款服务器的技术特性与系统的设置、安装,有助于您更详细地的解和便
捷的使用此款服务器。
请将我方产品的包装物交废品收购站回收利用,以利于污染预防,造福人类。
浪潮拥有本手册的版权。
未经浪潮许可,任何单位和个人不得以任何形式复制本用户手册。浪潮保留随时修改本
手册的权利。
本手册中的内容如有变动恕不另行通知。
如果您对本手册有疑问或建议,请向浪潮垂询。
浪潮
2021 8
是浪潮集团有限公司的注册商标。
本手册中提及的其他所有商标或注册商标,由各自的所有人拥有。
版本说明
文档版本:V1.3
日期:2021 8 4 日
摘 要
手册介绍本服务器的规格信息、硬件操作、软件设置、服务条款、故障诊断等与维护工
作密切相关的内容。
本指南认定读者对服务器产品有足够的认识,获得了足够的培训,在操作、维护过程中
不会造成个人伤害或产品损坏。
目标受众
本手册主要适用于以下人员:
技术支持工程师
产品维护工程师
建议由具备服务器知识的专业工程师参考本手册进行服务器运维操作。
目 录
1 安全说明 ........................................................................................................................... 1
2 产品规格介绍 .................................................................................................................... 4
2.1简介.................................................................................................................... 4
2.2 特性和规格......................................................................................................... 4
3 组件识别 ............................................................................................................................ 6
3.1前面板组件......................................................................................................... 6
3.2 前控板按键与指示灯........................................................................................... 7
3.3 硬盘托架上的指示灯........................................................................................... 7
3.4 后面板组件......................................................................................................... 8
3.5 主板组件............................................................................................................. 9
3.6GPU 组件.......................................................................................................... 10
4 操作 ................................................................................................................................. 11
4.1 接通服务器电源................................................................................................ 11
4.2 断开服务器电源................................................................................................ 11
4.3 拆卸服务器....................................................................................................... 11
4.4 取下检修面板.................................................................................................... 12
4.5 安装检修面板.................................................................................................... 13
4.6 安装服务器....................................................................................................... 13
5 设置 ................................................................................................................................. 15
5.1 最佳环境........................................................................................................... 15
5.2 机架警告........................................................................................................... 17
5.3 查看服务器包装箱中的物品.............................................................................. 17
5.4 安装硬件选件.................................................................................................... 18
5.5 将服务器装入机架............................................................................................. 18
5.6 安装操作系统.................................................................................................... 18
6 硬件选件安装 ................................................................................................................... 19
6.1 简介.................................................................................................................. 19
6.2 处理器选件....................................................................................................... 19
6.3 内存选件........................................................................................................... 22
6.4 硬盘选件........................................................................................................... 23
6.5 电源选件........................................................................................................... 25
6.6 导风罩选件....................................................................................................... 26
7 布线 ................................................................................................................................. 27
8 BIOS 设置 ........................................................................................................................ 29
8.1 常用操作........................................................................................................... 29
8.2BIOS 参数说明.................................................................................................. 46
8.3FirmwareUpdate.............................................................................................. 91
9 BMC 设置 ........................................................................................................................ 96
9.1主板 BMC 设置................................................................................................. 96
9.2Switch 板 BMC 设置....................................................................................... 123
10 常见故障及诊断排除 .................................................................................................... 148
10.1 常见硬件问题................................................................................................ 148
10.2 诊断排除说明................................................................................................ 151
11 更换电池 ...................................................................................................................... 152
12 管制标准通告 ............................................................................................................... 153
12.1 管制标准标识号............................................................................................ 153
12.2 联邦通信委员会通告..................................................................................... 153
12.3 欧盟管制通告................................................................................................ 153
12.4 欧盟家庭用户废旧设备处置......................................................................... 154
12.5 韩国通告....................................................................................................... 154
12.6 中国通告....................................................................................................... 154
12.7 电池更换通告................................................................................................ 155
13 静电放电 ...................................................................................................................... 156
13.1 防止静电放电................................................................................................ 156
13.2 防止静电释放的接地方法.............................................................................. 156
14 服务条款 ...................................................................................................................... 157
安全说明
1
1 安全说明
警告以下警告表示存在可能导致财产损失、人身伤害或死亡的潜在危险。
1本系统中的电源设备可能会产生高电压和危险电能,从而导致人身伤害。请勿自
行卸下主机盖以拆装、更换系统内部的任何组件,除非另外得到浪潮的通知,否
则只有经过浪潮培训的维修技术人员才有权拆开主机盖及拆装、更换内部组件。
2请将设备连接到适当的电源,仅可使用额定输入标签上指明的外部电源类型为设
备供电,为保护您的设备免受电压瞬间升高或降低所导致的损坏,请使用相关的
稳压设备或不间断电源设备。
3勿将两根或两根以上电源线互相连接使用,如需更长的电源线,请联系浪潮客
服。
4务必使用随机配备的供电组件如电源线、电源插座(如果随机配备)等,为了
设备及使用者的安全,不要随意更换电源电缆或插头。
5为防止系统漏电造成电击危险,务必将系统和外围设备的电源电缆插入已正确接
地的电源插座。请将三芯电源线插头插入接地良好、伸手可及的三芯交流电源插
座中,务必使用电源线的接地插脚,不要使用转接插头或拔下电缆的接地插脚,
在未安装接地导线及不确定是否已有适当接地保护的情况下,请勿操作使用本设
备,可与电工联系咨询。
6切勿将任何物体塞入系统的开孔处。如果塞入物体,可能会导致内部组件短路而
引起火灾或电击。
7请将系统置于远离散热片和有热源的地方,切勿堵塞通风孔。
8切勿让食物或液体散落在系统内部或其它组件上,不要在高潮湿、高灰尘的环境
中使用产品。
9用错误型号的电池更换会有爆炸危险,需要更换电池时,请先向制造商咨询并使
用制造商推荐型号相同或相近的电池,切勿拆开、挤压、刺戳电池或使其外部接
点短路,不要将其丢入火中或水中,也不要暴露在温度超过60摄氏度的环境中,
请勿尝试打开或维修电池,务必合理处置用完的电池,不要将用完的电池及可能
包含电池的电路板及其它组件与其它废品放在一起,有关电池回收请与当地废品
回收处理机构联系。
10在机柜中安装设备之前,请先在独立机柜上安装正面和侧面支脚;对于与其它机
柜相连的机柜,则先安装正面支脚。如果在机柜中安装设备之前未相应地安装支
2
脚,在某些情况下可能会导致机柜翻倒,从而可能造成人身伤害,因此,在机柜
中安装设备之前,请务必先安装支脚。在机柜中安装设备及其它组件后,一次仅
可将一个组件通过其滑动部件从机柜中拉出。同时拉出多个组件可能会导致机柜
翻倒而造成严重的人身伤害。
11勿独自移动机柜。考虑到机柜的高度和重量,至少应由两人来完成移动机柜任
务。
12机柜带电工作时请勿对供电铜排进行直接触操作,严禁将供电铜排进行直接短接。
注意:为了您更好地使用设备,以下注意事项将帮助您避免可能会损坏部件或导致
数据丢失等问题的出现:
1如果出现以下任何情况,请从电源插座拔下产品的电源线插头,并与浪潮的客户
服务部门联系:
1)电源线缆或电源插头已损坏。
2)产品被水淋湿。
3)产品跌落或损坏。
4)物体落入产品内部
5)按照操作说明进行操作时,产品不能正常工作。
2如果系统受潮,请按以下步骤处置:
1关闭系统和设备电源,断开它们与电源插座的连接,等待10至20秒钟,
然后打开主机盖。
2)将设备移至通风处,使系统至少干燥24小时,并确保系统完全干燥。
3)合上主机盖,将系统重新连接至电源插座,然后开机。
4)如果运行失败或异常,请与浪潮联系,获得技术帮助。
3注意系统电缆和电源电缆的位置,将其布线在不会被踩到或碰落的地方,确保不
要将其它物品放置在电缆上。
4卸下主机盖或接触内部组件之前,应先让设备冷却;为避免损坏主板,请在系统
关闭后等待5秒钟,然后再从主板上卸下组件或断开系统外围设备的连接。
5 如果设备中安装了调制解调器、电信或局域网选件,请注意以下事项
1)如果出现雷电天气,请勿连接或使用调制解调器。否则可能遭受雷击。
安全说明
3
2)切勿在潮湿环境中连接或使用调制解调器。
3)切勿将调制解调器或电话电缆插入网络接口控制器(NIC)插座。
4)打开产品包装、接触或安装内部组件或接触不绝缘的调制解调器电缆或插孔
之前,请断开调制解调器电缆。
6为防止静电释放损坏设备内部的电子组件,请注意以下事项:
1)拆装、接触设备内任何电子组件前应先导去身上的静电。您可通过触摸金属
接地物(如机箱上未上漆的金属表面)导去身上的静电,以防止身上静电对
敏感组件的静电释放。
2)对不准备安装使用的静电敏感组件,请不要将其从防静电包装材料中取出。
3)工作中请定期触摸接地导体或机箱上未上漆的金属表面,以便导去身上可能
损坏内部组件的静电。
7经浪潮同意,拆装系统内部组件时,请注意以下事项:
1)关闭系统电源并断开电,包括断开系统的任何连接。断开电缆时,请抓住
电缆的连接器将其拔出,切勿拉扯电缆。
2)卸下主机盖或接触内部组件之前,应先让产品冷却。
3)拆装、接触设备内任何电子组件前应先通过触摸金属接地物体导去身上的静电。
4)拆装过程中动作幅度不宜过大,以免损坏组件或划伤手臂。
5)小心处理组件和插卡,切勿触摸插卡上的组件或接点。拿取插卡或组件时
应抓住插卡或组件的边缘或其金属固定支架。
8机柜产品在安装使用过程中,应注意以下事项:
1)机柜完成安装后,请确保支脚已固定到机架并支撑到地面,并且机架的所有
重量均已落在地面上。
2)务必按照从下到上的顺序装入机柜,并且首先安装最重的部件。
3)从机柜中拉出组件时,应轻轻用力,确保机柜保持平衡和稳定。
4)按下组件滑轨释放闩锁并将组件滑入或滑出时,请务必小心,滑轨可能夹伤
您的手指。
5)切勿让机柜中的交流电源分支电路过载。机柜负载总和不应超过分支电路额
定值的80%。
6)确保机柜中组件保持良好的通风。
7)维修机柜中的组件时,请勿踩踏在其它任何组件上。
9服务器到货后,请参照上盖拆卸运输螺丝指示标签,将机箱两侧的的运输螺丝拆
卸后再上架安装;
4
2 产品规格介绍
2.1 简介
浪潮英信服务器 NF5888M5(AGX-5) 是面向人工智能的超级计算机平台
在 8U 机大 16 片的 NVIDIA(R)Tesla(R)V100GPU,
2-petaFLOPS 的 AI 计算性能。GPU 全局互连带宽高达 2400GB/s,确保任何 AI 训练
项目在这个架构下都能得到近乎线性的超高加速比,只需要单个系统便可将训练时间
从 1 周缩短到 12 小时。服务器采用 3000w(2+2)*2 的供电设计、整机模块化设计,
确保在 AI 云场景下整个系统的高可靠性和极佳的易维护性。
2.2 特性和规格
处理器
处理器类型 2 颗全新一代英特尔 ®至强 ®可扩展处理器,TDP205W
芯片组
芯片组类型 Intel®C620serieschipset(Lewisburg-2)
内存
内存类型 DDR4RDIMM/LRDIMM2666MHz
内存插槽数 24 个
内存总容量 最大支持 3072GB(单条 128G)
I/O 接口
USB 接口 前置 2 个 USB3.0 接口,后置 1 个 SUV 串口 ( 包含 2 个 USB2.0 接口 )
产品规格介绍
5
PCIe 接口 4 个 ExternalPCIeConnector
VGA 接口 1 个前置 VGA 接口、1 个 SUV 串口 ( 包含 1 个 VGA 接口 )
管理网口 前置 1 个,后置 1 个 RJ45IPMI 管理口
PCIE 4 个 PCIex16标卡,1 个 PCIex8
显示控制器
控制器类型 Aspeed2500 内部集成,最大分辨率支持 1900*1200
硬盘
硬盘类型
支持 SATA/NVME 硬盘,最大支持:
8 个2.5英寸 SATA 硬盘
或 4 个2.5英寸 SATA 硬盘+4 个2.5英寸 NVMe 硬盘
电源
规格 8 个 3000W80Plus 铂金 PSU,支持上下(2+2)*2 冗余模式
电源输入 请以主机铭牌标签上的电源输入值为准。
物理规格
包装箱外尺寸 W(宽)722mm;H(高)586mm;D(深)1168mm
主机尺寸 W(宽)448mm;H(高)351.6mm;D(深)850mm
产品重量 满配
净重 130kg毛重:160kg。(毛重包括:主机 + 包装箱 + 导轨 + 配件盒)
环境参数
工作环境温度 10℃ -35℃
贮存运输温度 -40℃ -60℃
工作湿度 20% -80%相对湿度
贮存运输湿度 20% -93%(40℃)相对湿度
6
3 组件识别
3.1 前面板组件
编号 模块名称
1 前控板按键与指示灯
2 UID 灯及按键
3 系统重启按键
4 系统故障指示灯
5-12 硬盘 0-7
13 USB3.0 插槽 x2
14 BMC 管理接口
15 网络接口 X2
16 VGA 接口
17 UID 灯及按键
18 BMCdebug 口
19-24 NVLINKBridge1-6
25 前控面板一
26 前控面板二
27 GPUBOX1
28 GPUBOX2
组件识别
7
3.2 前控板按键与指示灯
编号 模块名称 说明
1 前控面板 1 当设备作为 GPU 服务器时,使用前控面板 1 控制设备;
为 GPUBOX 使 时, 板 1 控 制 GPU
BOX1(上),前控面板 2 控制 GPUBOX2(下)
2 前控面板 2
3 开关按键及指示灯
开机状态下,亮绿色灯
待机状态下,亮橙色灯
长按强制关机
4 UID 灯及按键 开启 / 关闭 UID,亮蓝色灯
5 系统重启按键 短按强制系统重启
6 系统故障指示灯
正常不亮
电源发生故障,常亮红色
电源状态异常,红色闪烁
3.3 硬盘托架上的指示灯
编号 模块名称 说明
1 硬盘故障报警指示灯
常亮红色:硬盘出现故障
常亮蓝色:硬盘定位
常亮粉色:配合 RAIDRebuilding
2 硬盘活动状态指示灯 常亮绿色:正常
绿色闪烁:硬盘进行读写活动
8
3.4 后面板组件
编号 模块名称
1-4 PSU0-3
5 FAN0-11
6 I/OBoxA
7 ExternalPCIeConnectorA0-A3
8 PCIE接口 4
9 PCIE接口 0
10-11 PSU4-5
12 I/OBoxC
13 ExternalPCIeConnectorC0-C3
14-15 PCIE接口 2-3
16 BMC 串口
17 UID 按键及指示灯
18 BMC 管理口
19-20 ExternalPCIeConnectorD0-D4
21 I/OBoxD
22-23 PSU6-7
24 PCIE接口 1
25 BMC 管理口
26 SUVconnector
27-28 ExternalPCIeConnectorB0-B4
29 I/OBoxB
30 UID 灯及按键
组件识别
9
3.5 主板组件
编号 模块名称
1 内存插槽(对应 CPU1)
2 内存插槽(对应 CPU0)
3 CPU1
4 CPU0
5 主板提手 1
6 Slimline 接口 x12
7 硬盘背板电源接口
8 硬盘背板讯号接口 J91
9 硬盘背板讯号接口 J92
10 M.2riser插槽
11 右耳前面板接口
12 PCHSD 卡插槽
13 BMCSD 卡插槽
14 CLR_CMOS
15 主板提手 0
16 UID按键
17 BMCdebug 口
18 BMC 管理口 /USB3.0 插槽 x2
19 10G 板载网口 x2
20 VGA 接口
21 TPM 接口
10
编号 模块名称
22 KVM 接口
23 MINISAS 接口 0
24 MINISAS 接口 1
25 MINISAS 接口 2
26 MBPDB 接口
清除 CMOS 跳线位置见【3.5 主板组件】。
跳线编号 作用描述 跳线功能
CLR_CMOS CMOS 清除跳线 管脚 1-2 短接,正常状态;管脚 2-3 短接,清除 CMOS。
注意:
清除 CMOS 时必须关闭系统,并切断电源,短接 Pin2-3 后需要保持 5秒钟;然
后重新用跳线帽将 CLR_CMOS 跳线的 Pin1、Pin2 针脚短接(默认设置状态),恢复
到原来状态。
3.6 GPU 组件
GPU 模组的顺序上层顺序 GPU0-GPU7,下层顺序为 GPU8-GPU15,如下图所示
操作
11
4 操作
4.1 接通服务器电源
插入电源线插头,按下“电源开关按键”按钮。
4.2 断开服务器电源
警告!为减少人身伤害、电击或设备损坏的危险,请拔出电源线插头以断开服务器电
源。前面板的“电源开关按键”按钮不能彻底切断系统电源。在切断交流电源前,部
分电源和一些内部电路仍带电。
注:如果安装的是热插拔设备,则不必断开服务器电源。
1. 备份服务器数据。
2. 正常关闭操作系统。
3. 拔下电源线插头。
系统现在即处于断电状态。
4.3 拆卸服务器
1. 按照上架安装指南用螺丝刀拧开两侧耳翼内的 4 颗松不脱螺钉。
2. 将服务器从机架中缓缓拉出,安装两侧的搬抬把手,然后搬抬到防静电平台上
警告!为减少人身伤害或设备损坏的危险,将组件从机架中拉出之前应保证机架足够
稳固,服务器单体重量大于 100kg,取下时需要至少 5 人以上搬抬或使用辅助设备。
12
4.4 取下检修面板
警告!为减少设备表面过热而造成人身伤害的危险,请在驱动器和内部系统组件散热
后再触摸它们。
注意:为充分散热,请不要在未安装检修面板、导风罩、风扇的情况下运行服务器。
如果服务器支持热插拔组件,请最大限度地减少打开检修面板的时间。
卸下组件:
1. 如果执行非热插拔安装或维护步骤,则关闭服务器电源。
2. 将服务器从机架中拉出。
3. 使用螺丝刀拧松机盖锁定器上的安全保护螺钉。
4. 提起机盖锁定器手柄,然后卸下检修面板。
操作
13
4.5 安装检修面板
1. 将检修面板放在服务器上面,并打开机盖锁定器。将面板向后拉。
2. 向下按机盖锁定器。检修面板将滑到闭合位置。
3. 使用螺丝刀拧紧机盖锁定器上的安全保护螺钉。
4.6 安装服务器
1、在执行安装或维护步骤后,按照上架安装指南搬抬服务器机箱至导轨上,将
服务器向后推入机架;
2、用螺丝刀紧固两侧耳翼内的松不脱螺钉,将服务器机箱固定到机架上。
警告!服务器单体重量大于 100kg,安装时需要至少 5 人以上搬抬或使用辅助设备
14
  • Page 1 1
  • Page 2 2
  • Page 3 3
  • Page 4 4
  • Page 5 5
  • Page 6 6
  • Page 7 7
  • Page 8 8
  • Page 9 9
  • Page 10 10
  • Page 11 11
  • Page 12 12
  • Page 13 13
  • Page 14 14
  • Page 15 15
  • Page 16 16
  • Page 17 17
  • Page 18 18
  • Page 19 19
  • Page 20 20
  • Page 21 21
  • Page 22 22
  • Page 23 23
  • Page 24 24
  • Page 25 25
  • Page 26 26
  • Page 27 27
  • Page 28 28
  • Page 29 29
  • Page 30 30
  • Page 31 31
  • Page 32 32
  • Page 33 33
  • Page 34 34
  • Page 35 35
  • Page 36 36
  • Page 37 37
  • Page 38 38
  • Page 39 39
  • Page 40 40
  • Page 41 41
  • Page 42 42
  • Page 43 43
  • Page 44 44
  • Page 45 45
  • Page 46 46
  • Page 47 47
  • Page 48 48
  • Page 49 49
  • Page 50 50
  • Page 51 51
  • Page 52 52
  • Page 53 53
  • Page 54 54
  • Page 55 55
  • Page 56 56
  • Page 57 57
  • Page 58 58
  • Page 59 59
  • Page 60 60
  • Page 61 61
  • Page 62 62
  • Page 63 63
  • Page 64 64
  • Page 65 65
  • Page 66 66
  • Page 67 67
  • Page 68 68
  • Page 69 69
  • Page 70 70
  • Page 71 71
  • Page 72 72
  • Page 73 73
  • Page 74 74
  • Page 75 75
  • Page 76 76
  • Page 77 77
  • Page 78 78
  • Page 79 79
  • Page 80 80
  • Page 81 81
  • Page 82 82
  • Page 83 83
  • Page 84 84
  • Page 85 85
  • Page 86 86
  • Page 87 87
  • Page 88 88
  • Page 89 89
  • Page 90 90
  • Page 91 91
  • Page 92 92
  • Page 93 93
  • Page 94 94
  • Page 95 95
  • Page 96 96
  • Page 97 97
  • Page 98 98
  • Page 99 99
  • Page 100 100
  • Page 101 101
  • Page 102 102
  • Page 103 103
  • Page 104 104
  • Page 105 105
  • Page 106 106
  • Page 107 107
  • Page 108 108
  • Page 109 109
  • Page 110 110
  • Page 111 111
  • Page 112 112
  • Page 113 113
  • Page 114 114
  • Page 115 115
  • Page 116 116
  • Page 117 117
  • Page 118 118
  • Page 119 119
  • Page 120 120
  • Page 121 121
  • Page 122 122
  • Page 123 123
  • Page 124 124
  • Page 125 125
  • Page 126 126
  • Page 127 127
  • Page 128 128
  • Page 129 129
  • Page 130 130
  • Page 131 131
  • Page 132 132
  • Page 133 133
  • Page 134 134
  • Page 135 135
  • Page 136 136
  • Page 137 137
  • Page 138 138
  • Page 139 139
  • Page 140 140
  • Page 141 141
  • Page 142 142
  • Page 143 143
  • Page 144 144
  • Page 145 145
  • Page 146 146
  • Page 147 147
  • Page 148 148
  • Page 149 149
  • Page 150 150
  • Page 151 151
  • Page 152 152
  • Page 153 153
  • Page 154 154
  • Page 155 155
  • Page 156 156
  • Page 157 157
  • Page 158 158
  • Page 159 159
  • Page 160 160
  • Page 161 161
  • Page 162 162
  • Page 163 163

Inspur NF5888M5 ユーザーマニュアル

タイプ
ユーザーマニュアル