Inspur NF5468A5 ユーザーマニュアル

  • 浪潮NF5468A5シリーズサーバーのユーザーマニュアルの内容を理解しました。このマニュアルには、サーバーの仕様、ハードウェア操作手順、トラブルシューティング、および保守に関する情報が網羅されています。AMD EPYC Rome/Milanプラットフォーム、最大32個のDDR4メモリ、複数のPCIeスロットなど、このサーバーの機能に関するご質問にお答えできます。
  • サーバーの電源をオン/オフするにはどうすればよいですか?
    メモリモジュールを交換するにはどうすればよいですか?
    BIOSまたはBMCの設定を変更する必要がある場合、どのような点に注意すべきですか?
    サーバーの電源故障ランプの色は何を意味しますか?
浪潮英信服务器 NF5468A5
用户手册
文档版本 V1.8
发布日期 2023-03-22
版权所有© 2020-2023 浪潮电子信息产业股份有限公司。保留一切权利。
未经本公司事先书面许可,任何单位和个人不得以任何形式复制、传播本手册的部分或
全部内容。
环境保护
请将我方产品的包装物交废品收购站回收利用,以利于污染预防,共同营造绿色家园。
商标说明
Inspur 浪潮、Inspur、浪潮、英信是浪潮集团有限公司的注册商标。
本手册中提及的其他所有商标或注册商标,由各自的所有人拥有。
安全声明
服务器产品安全一直是浪潮关注的焦点,保障产品安全是浪潮的关键战略之一。为使您
更清晰地了解服务器产品,请注意如下安全风险声明。
在调整用途或淘汰服务器时,为了保护数据隐私,建议从 BIOSBMC 中恢复固件
出厂设置、删除信息、清除日志。同时,建议采用第三方安全擦除工具对硬盘数据
进行全面安全擦除。
您购买的产品、服务或特性在业务运营或故障定位的过程中将可能获取或使用用户
的某些个人数据(如告警邮件接收地址、IP 地址)故您有义务根据所适用国家的
法律制定必要的用户隐私政策并采取足够的措施,以确保用户的个人数据受到充分
的保护。
服务器开源软件声明的获取,请直接联系浪潮客户服务人员咨询。
部分用于生产、装备、返厂检测维修的接口、命令,定位故障的高级命令,如使用
不当,将可能导致设备异常或者业务中断,故不在本资料中说明。如需要,请向浪
潮申请。
浪潮服务器的外部接口未使用私有协议进行通信。
浪潮建立了产品安全漏洞应急和处理机制,保证第一时间及时处理产品安全问题。
若您在浪潮产品中发现任何安全问题,或者寻求有关产品安全漏洞的必要支持,
以直接联系浪潮客户服务人员。
浪潮将一如既往的严密关注产品与解决方案的安全性,为客户提供更满意的服务。
内容声明
您购买的产品、服务或特性等应受浪潮集团商业合同和条款的约束。本文档中描述的全
部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,
潮集团对本文档的所有内容不做任何明示或默示的声明或保证。文档中的示意图与产品
实物可能有差别,请以实物为准。本文档仅作为使用指导,不对使用我们产品之前、
间或之后发生的任何损害负责,包括但不限于利益损失、信息丢失、业务中断、身伤
害,或其他任何间接损失。本文档默认读者对服务器产品有足够的认识,获得了足够的
培训,在操作、维护过程中不会造成个人伤害或产品损坏。文档所含内容如有升级或更
新,恕不另行通知。
技术支持
技术服务电话:4008600011
址:中国济南市浪潮路 1036
浪潮电子信息产业股份有限公司
箱:lckf@inspur.com
编:250101
前言
摘要
本手册介绍本服务器的规格信息、硬件操作、服务条款、故障诊断等与维护工作密切相
关的内容。
目标受众
本手册主要适用于以下人员:
技术支持工程师
产品维护工程师
建议由具备服务器知识的专业工程师参考本手册进行服务器运维操作。
注意
如您未采购装机服务,请在设备开箱前自行检查外包装箱。如发现包装箱严重损坏、
水浸、封条或压敏胶带已开封,请视购机方式进行问题反馈。供应商渠道购入设备,
请直接与您的供应商联系;浪潮直营渠道购入设备,请直接拨打服务电话
4008600011,联系浪潮技术支持处理。
请不要随意拆装服务器组件、请不要随意扩配及外接其它设备。如需操作,请务必
在浪潮的官方授权和指导下进行。
在拆装服务器组件前,请务必断开服务器连接的所有电缆。
请使用浪潮认证的驱动程序进行 OS 环境搭建。您可访问浪潮官网
https://www.inspur.com 进行驱动下载,进入浪潮官网首页,顶部导航栏选择支
持下载>产品支持>驱动下载,根据页面提示查找产品对应的驱动程序。如使用非浪
潮认证的驱动程序,可能会引起兼容性问题并影响产品的正常使用,对此浪潮将不
承担任何责任或义务。
BIOSBMC 的设置对配置您的服务器至关重要,如果没有特殊的需求,请您使用
系统出厂时的默认值,请勿随意更改参数设置。首次登录时,请及时修改 BMC
户密码。
符号约定
在本文中可能出现下列符号,它们所代表的含义如下。
符号 说明
如不当操作,可能会导致死亡或严重的人身伤害。
如不当操作,可能会导致中度或轻微的人身伤害。
如不当操作,可能会导致设备损坏或数据丢失。
为确保设备成功安装或配置,而需要特别关注的操作或信息。
对手册内容的描述进行必要的补充和说明。
变更记录
版本 时间 变更内容
V1.0 2021-01-25 首版发布
V1.1 2021-01-28 更新“8 常见故障及诊断排除”电源故障灯颜
色内容
V1.2 2021-03-10 更新“2.3 电源效率”相关内容
V1.3 2021-07-08 添加简介中A5 CPU Refresh内容;更新文档
内容格式
V1.4 2021-10-22 更新主机尺寸为含挂耳主机尺寸
V1.5 2021-12-22 更新“2.1简介”部分内容
V1.6 2022-02-28 刷新手册格式
V1.7 2023-02-09 更新GPU板布局示意图
V1.8 2023-03-22 增加“1.1警告声明”事项
1 安全说明 ...................................................................................................... 1
1.1 警告声明 ........................................................................................................... 1
1.2 注意事项 ........................................................................................................... 2
2 产品规格介绍 ............................................................................................... 4
2.1 简介 ................................................................................................................. 4
2.2 特性和规格 ....................................................................................................... 5
2.3 电源效率 ........................................................................................................... 6
3 组件识别 ...................................................................................................... 7
3.1 前面板 .............................................................................................................. 7
3.1.1 前面板示意图 .......................................................................................... 7
3.1.2 前控板按键与指示灯 ................................................................................ 9
3.1.3 硬盘托架上的指示灯 ................................................................................ 9
3.2 后面板 ............................................................................................................ 10
3.3 主板布局 ......................................................................................................... 11
3.4 GPU 板布局 .................................................................................................... 12
3.5 清除 CMOS 跳线介绍 ....................................................................................... 13
3.6 物理结构 ......................................................................................................... 14
4 操作 .......................................................................................................... 15
4.1 接通服务器电源 ............................................................................................... 15
4.2 断开服务器电源 ............................................................................................... 15
4.3 将服务器从机架中拉出 ..................................................................................... 15
4.4 取下机箱上盖 .................................................................................................. 16
4.5 安装机箱上盖 .................................................................................................. 17
4.6 卸下 PCIe ................................................................................................... 17
4.7 安装 PCIe ................................................................................................... 18
4.8 卸下导风罩 ..................................................................................................... 19
5 硬件选件安装 ............................................................................................. 20
5.1 简介 ............................................................................................................... 20
5.2 处理器选件 ..................................................................................................... 20
5.3 内存选件 ......................................................................................................... 24
5.3.1 内存安装步骤 ........................................................................................ 25
5.4 热插拔硬盘选件 ............................................................................................... 26
5.5 冗余热插拔电源选件 ........................................................................................ 28
5.6 导风罩选件 ..................................................................................................... 29
5.7 风扇模块选件 .................................................................................................. 30
6 布线 .......................................................................................................... 33
7 固件升级和配置 .......................................................................................... 34
8 常见故障及诊断排除 ................................................................................... 35
8.1 常见硬件问题 .................................................................................................. 35
8.2 常见系统软件问题............................................................................................ 38
9 更换电池 .................................................................................................... 41
10 静电放电 .................................................................................................... 42
10.1 防止静电放电 .................................................................................................. 42
10.2 防止静电释放的接地方法 .................................................................................. 42
11 服务器入厂/运行条件环境要 ..................................................................... 43
11.1 环境温度 ......................................................................................................... 43
11.2 可靠性 ............................................................................................................ 43
11.3 海拔、气压 ..................................................................................................... 43
11.4 交变湿热、湿度 ............................................................................................... 44
11.5 扩展操作温度 .................................................................................................. 44
11.6 扩展操作温度限制............................................................................................ 44
11.7 散热限制说明 .................................................................................................. 45
11.8 设备运行环境要求............................................................................................ 45
11.9 电磁辐射环境要求............................................................................................ 47
11.10 设备供电要求 .................................................................................................. 49
11.10.1 交流供电要求 ................................................................................. 49
11.10.2 直流供电要求 ................................................................................. 49
11.10.3 交流供电的建议 .............................................................................. 50
11.10.4 高压直流供电 ................................................................................. 50
11.10.5 高压直流供电要求 ........................................................................... 51
11.10.6 高压直流供电建议 ........................................................................... 51
11.10.7 直流供电 ........................................................................................ 52
12 服务条款 .................................................................................................... 53
附录 ................................................................................................................ 54
硬盘钕含量参考表............................................................................................ 54
术语表 ............................................................................................................ 55
缩略语表 ......................................................................................................... 59
1
1 安全说明
1.1 警告声明
以下警告表示存在可能导致财产损失、人身伤害或死亡的潜在危险:
本系统中的电源设备可能会产生高电压和危险电能,从而导致人身伤害。请勿自行卸下
机箱上盖以拆装、更换系统内部的任何组件,除非另外得到浪潮的通知,否则只有经过
浪潮培训的维修技术人员才有权拆开机箱上盖及拆装、更换内部组件。
请将设备连接到适当的电源,仅可使用符合主机铭牌标签上所要求规格的外部电源为设
备供电,为保护您的设备免受电压瞬间升高或降低所导致的损坏,请使用相关的稳压设
备或不间断电源设备。
请勿将两根或两根以上电源线互相连接使用,如需更长的电源线,请联系浪潮客服。
请务必使用随机配备的供电组件如电源线、电源插座(如果随机配备)等,为了设备及
使用者的安全,不要随意更换电源电缆或插头。
为防止系统漏电造成电击危险,务必将系统和外围设备的电源电缆插入已正确接地的电
源插座。请将三芯电源线插头插入接地良好、伸手可及的三芯交流电源插座中,务必使
用电源线的接地插脚,不要使用转接插头或拔下电缆的接地插脚,在未安装接地导线及
不确定是否已有适当接地保护的情况下,请勿操作使用本设备,可与电工联系咨询。
切勿将任何物体塞入系统的开孔处。如果塞入物体,可能会导致内部组件短路而引起火
灾或电击。
请将系统置于远离散热片和有热源的地方,切勿堵塞通风孔。
切勿让食物或液体散落在系统内部或其它组件上,不要在高潮湿、高灰尘的环境中使用
产品。
用错误型号的电池更换会有爆炸危险,需要更换电池时,请先向制造商咨询并使用制造
商推荐型号相同或相近的电池,切勿拆开、挤压、刺戳电池或使其外部接点短路,不要
将其丢入火中或水中,也不要暴露在温度超过 60 摄氏度的环境中,请勿尝试打开或维
修电池,务必合理处置用完的电池,不要将用完的电池及可能包含电池的电路板及其它
组件与其它废品放在一起,有关电池回收请与当地废品回收处理机构联系。
在机柜中安装设备之前,请先在独立机柜上安装正面和侧面支脚;对于与其它机柜相连
的机柜,则先安装正面支脚。如果在机柜中安装设备之前未相应地安装支脚,在某些情
况下可能会导致机柜翻倒,从而可能造成人身伤害,因此,在机柜中安装设备之前,请
2
务必先安装支脚。在机柜中安装设备及其它组件后,一次仅可将一个组件通过其滑动部
件从机柜中拉出。同时拉出多个组件可能会导致机柜翻倒而造成严重的人身伤害。
请勿独自移动机柜。考虑到机柜的高度和重量,至少应由两人来完成移动机柜任务。
机柜带电工作时请勿对供电铜排进行直接触操作,严禁将供电铜排进行直接短接。
本设备不适合在儿童可能会出现的场所使用。
1.2 注意事项
为了您更好地使用设备,以下注意事项将帮助您避免可能会损坏部件或导致数据丢失等问题
的出现:
如果出现以下任何情况,请从电源插座拔下产品的电源线插头,并与浪潮的客户服务部
门联系:
- 电源线缆或电源插头已损坏。
- 产品被水淋湿。
- 产品跌落或损坏。
- 物体落入产品内部。
- 按照操作说明进行操作时,产品不能正常工作。
如果系统受潮,请按以下步骤处置:
- 关闭系统和设备电源,断开它们与电源插座的连接,等待 10 20 秒钟,然后打开
机箱上盖。
- 将设备移至通风处,使系统至少干燥 24 小时,并确保系统完全干燥。
- 合上机箱上盖,将系统重新连接至电源插座,然后开机。
- 如果运行失败或异常,请与浪潮联系,获得技术帮助。
注意系统电缆和电源电缆的位置,将其布线在不会被踩到或碰落的地方,确保不要将其
它物品放置在电缆上。
卸下机箱上盖或接触内部组件之前,应先让设备冷却;为避免损坏主板,请在系统关闭
后等待 5秒钟,然后再从主板上卸下组件或断开系统外围设备的连接。
如果设备中安装了调制解调器、电信或局域网选件,请注意以下事项:
- 如果出现雷电天气,请勿连接或使用调制解调器,否则可能遭受雷击。
- 切勿在潮湿环境中连接或使用调制解调器。
3
- 切勿将调制解调器或电话电缆插入网络接口控制器(NIC)插座。
- 打开产品包装、接触或安装内部组件或接触不绝缘的调制解调器电缆或插孔之前,
请断开调制解调器电缆。
为防止静电释放损坏设备内部的电子组件,请注意以下事项:
- 拆装、接触设备内任何电子组件前应先导去身上的静电。您可通过触摸金属接地物
(如机箱上未上漆的金属表面)导去身上的静电,以防止身上静电对敏感组件的静
电释放。
- 对不准备安装使用的静电敏感组件,请不要将其从防静电包装材料中取出。
- 工作中请定期触摸接地导体或机箱上未上漆的金属表面,以便导去身上可能损坏内
部组件的静电。
经浪潮同意,拆装系统内部组件时,请注意以下事项:
- 关闭系统电源并断开电缆,包括断开系统的任何连接。断开电缆时,请抓住电缆的
连接器将其拔出,切勿拉扯电缆。
- 卸下机箱上盖或接触内部组件之前,应先让产品冷却。
- 拆装、接触设备内任何电子组件前应先通过触摸金属接地物体导去身上的静电。
- 拆装过程中动作幅度不宜过大,以免损坏组件或划伤手臂。
- 小心处理组件和插卡,切勿触摸插卡上的组件或点。拿取插卡或组件时,应抓
住插卡或组件的边缘或其金属固定支架。
机柜产品在安装使用过程中,应注意以下事项:
- 机柜完成安装后,请确保支脚已固定到机架并支撑到地面,并且机架的所有重量均
已落在地面上。
- 务必按照从下到上的顺序装入机柜,并且首先安装最重的部件。
- 从机柜中拉出组件时,应轻轻用力,确保机柜保持平衡和稳定。
- 按下组件导轨释放闩锁并将组件滑入或滑出时,请务必小心,导轨可能夹伤您的手
指。
- 切勿让机柜中的交流电源分支电路过载。机柜负载总和不应超过分支电路额定值的
80%
- 确保机柜中组件保持良好的通风。
- 维修机柜中的组件时,请勿踩踏在其它任何组件上。
4
2 产品规格介绍
2.1 简介
浪潮 NF5468A5 系列是为了满足高端 AI 学习/推理应用,基于 AMD 平台(NF5468A5 基于
EPYCRome 平台,NF5468A5 CPU Refresh 基于 EPYCMilan 平台)设计的一款两路机
架式服务器。该产品保持了浪潮服务器一贯的高品质、高可靠的表现,在计算性能、可扩展
性、配置弹性、智能管理等方面,实现创新与突破,特别适合对服务器有苛刻要求的电信、
融、互联网、大型企业等用户。
支持 2AMD Rome/Milan 平台处理器,最大支持 TDP280W
支持 3 channels xGMI,16GT/s
最大支持 32 DDR4 DIMM 内存,支持 ECC RDIMM/LRDIMM 类型内存
主板集成 AST2500 BMC 芯片,标配 KVM 功能
前部最大支持 42.5 英寸 NVMe硬盘
内部最大支持 2M.2 SATA SSD 作为系统盘
最大支持 8PCIe 4.0 x16 GPU 扩展
1PCIe 4.0 x16 扩展卡或是 1OCP 3.0 扩展卡或是 2PCIe 4.0 x8 扩展卡
采用 CRPS 规格、80+白金等级以上电源,支持 PMBus,支持热插拔和冗余特性
风扇/风扇架热拔插设计;风扇支持 N+1冗余
硬盘模组、PCIe扩展卡、电源、风扇等部件模块化设计,免工具维护
5
2-1 整机示意图
2.2 特性和规格
2-1 特性和规格列表
组件 描述
制造时间 2020.12
处理器类型 AMD Rome/Milan可扩展处理器(最高支持280W
内存类型 DDR4 RDIMMLRDIMM
内存插槽数 32(具体安装原则请参考5.3内存选件章节)
内存总容量 最大支持8.0TB(单条256GB
USB 接口 2个前置USB 3.0接口;
显示接口 1个前置VGA接口
串行接口 1个前置串口
UID 指示灯接口 2UID指示灯(前、后各1个)
1UID按键和1个开关机按键(前面)
控制器类型 AST2500芯片内集成,最大分辨率支持1920 × 1200
网卡控制器 支持OCP 3.0标卡或PCIe标卡
管理芯片 集成1个独立的1000Mbps网络接口,专门用于IPMI的远程管
理。
PCIe扩展插槽
1OCP 3.0 ×16或是1PCIe 4.0 ×16标卡
8FHFL ×16 GPU
1PCIe 4.0 ×16外插卡或是1PCIe 3.0 ×8外插卡+1PCIe
4.0 ×8外插卡
硬盘类型 最大242.5英寸SATA/SAS硬盘(包含最多42.5英寸NVMe
硬盘)
6
组件 描述
最大123.5英寸SATA/SAS硬盘(包含最多42.5英寸NVMe
硬盘)
光驱 支持外插USB光驱
规格
1600W/2000W/2200W/3000W输出功率
2+2冗余
4个电源模块
支持PMBus电源
包装箱外尺寸 1200mm、宽800mm、高480mm
主机尺寸(含挂耳)
配置:12 × 3.5英寸SATA/SAS盘位
机箱:483 × 175.5 × 871.75深(单位:mm
配置:24 × 2.5英寸SATA/SAS盘位
机箱:483 × 175.5 × 846.75深(单位:mm
产品重量
配置:12 × 3.5英寸盘位
主机重量:54kg
毛重:86kg(毛重包括:主机+包装箱+导轨+配件盒)
配置:24 × 2.5英寸盘位
主机重量:51kg
毛重:83kg(毛重包括:主机+包装箱+导轨+配件盒)
2.3 电源效率
2-2 电源效率
额定功率 @20% Load @50% Load @100% Load PF@50% Load
1600W 90% 94% 91% 0.98
2000W 90% 94% 91% 0.98
2200W 90% 94% 91% 0.98
3000W 90% 94% 91% 0.98
7
3 组件识别
3.1 前面板
3.1.1 前面板示意图
3-1 前面板示意图
24 × 2.5 英寸盘位
12 × 3.5 英寸盘位
编号 模块名称 编号 模块名称
1 VGA接口 5 服务器与机柜固定卡扣
2
USB 3.0接口
6
系统按键与指示灯
8
编号 模块名称 编号 模块名称
3 USB 3.0接口 7 硬盘模组
4 系统串口
3-2 硬盘顺序示意图
24 × 2.5 英寸盘位
12 × 3.5 英寸盘位
9
3.1.2 前控板按键与指示灯
3-3 前控板按键与指示灯
编号 模块名称 说明
1 电源开关按键
开机状态下,亮绿色灯
待机状态下,亮橙色灯
长按4s强制关机
2 UID按键
正常工作状态下,亮蓝色灯
长按Reset BMC
3 系统重置按键 按下后系统重置
4 系统状况显示灯
系统正常时不亮灯
系统错误时亮红灯
3.1.3 硬盘托架上的指示灯
3-4 硬盘托架上的指示灯
10
编号 模块名称 说明
1 硬盘活动状态指示灯 常亮绿色:正常
绿色闪烁:硬盘进行读写活动
2 硬盘故障报警指示灯
常亮红色:硬盘出现故障
常亮蓝色:硬盘定位
常亮粉色:配合RAID Rebuilding
3.2 后面板
3-5 后面板示意图
编号 模块名称 编号 模块名称
1 服务器与机柜固定卡扣 7 VGA接口
2 电源模组 × 4 8 串行通讯端口
3 USB 3.0接口 × 2 9 UID按键
4 RJ45接口 10 GPU卡插槽
5 Hot swap按键&指示灯 11 外接卡插槽
6 OCP 3.0网卡
11
3.3 主板布局
3-6 主板布局示意图
编号 模块名称 编号 模块名称
1 Slimline接口(CPU1) 25 Slimline接口(CPU0)
2 CPU1电源模块散热器 26 电源0接口
3 内存电源模块散热器 27 CPU0电源模块散热器
4 内存电源模块散热器 28 电源1接口
5 Slimline接口(CPU1) 29 内存电源模块散热器
6 前面板接口 30 前面板接口
7 上盖检具接口 31 CPU硬体除错治具接口
8 智能网卡电源接口 32 网卡NCSI接口
9 机箱温度侦测器接口 33 电池槽
10 磁盘阵列卡电源接口 34 OCP接口
11 TPM接口 35 UID按键
12 背板I2C接口 36 串行通讯端口
13 背板电源接口 37 VGA接口
14 背板I2C接口 38 Hot swap按键
CLR_CMOS
12
编号 模块名称 编号 模块名称
15 背板电源接口 39 Hot swap示警灯
16 背板I2C接口 40 BMC管理网口
17 背板电源接口 41 USB 3.0接口
18 背板I2C接口 42 BMC外置内存卡接口
19 I2C接口 43 Radsok连接器接口
20 VPP接口 44 M.2接口
21 Slimline接口(CPU0) 45 CPU外置内存卡接口
22 I2C接口 46 电源2接口
23 内存电源模块散热器 47 电源3接口
24 Slimline接口(CPU0)
3.4 GPU 板布局
3-7 GPU 板布局示意图
编号 模块名称 编号 模块名称
1 GPU卡电源接口1 5 GPU卡电源接口4
2 GPU卡电源接口2 6 PCIe卡槽
3 Radsok连接器接口 7 Slimline接口
4 GPU卡电源接口3
/