LSI RAID卡
目前LSI RAID卡使用的配置工具主要有:
- 图形环境:Megaraid Storage Manager(MSM)
- 字符界面:MegaCLI、StorCLI。其中StorCLI整合了LSI和原来3ware的产品支持,相对MegaCLI命令更加简洁,并且兼容MegaCLI的命令,估计两者已经整合了(有待确认)。
storcli更换硬盘
storcli已经基本代替了megacli,
- 检查一下当前物理盘的状态,命令
storcli64.exe /c0 show all
Microsoft Windows [版本 10.0.14393]
(c) 2016 Microsoft Corporation。保留所有权利。
C:\Users\Administrator>cd C:\ //storcli工具放置在C盘根目录
C:\>storcli64.exe /c0 show all //查看RAID控制器0的所有信息
Generating detailed summary of the adapter, it may take a while to complete.
Controller = 0
Status = Success
Description = None
Basics :
======
Controller = 0
Model = ServeRAID M5015 SAS/SATA Controller //RAID控制器型号
Serial Number = SV21011556 //RAID控制器SN号
Current Controller Date/Time = 07/28/2020, 14:19:45
Current System Date/time = 07/28/2020, 14:21:05
SAS Address = 500605b004849a50
PCI Address = 00:01:00:00
Mfg Date = 03/07/12
Rework Date = 00/00/00
Revision No = 79B
Version : //RAID控制器版本信息
=======
Firmware Package Build = 12.12.0-0085
Firmware Version = 2.120.223-1467
Bios Version = 3.24.00_4.12.05.00_0x05100000
Preboot CLI Version = 04.04-019:#%00008
WebBIOS Version = 6.0-46-e_42-Rel
NVDATA Version = 2.09.03-0027
Boot Block Version = 2.02.00.00-0000
Bootloader Version = 09.250.01.219
Driver Name = megasas2.sys
Driver Version = 6.706.06.00
//其他部分这里不介绍,省略。。。
//--------------------虚拟/逻辑盘------------------------
Virtual Drives = 2
VD LIST :
=======
-----------------------------------------------------------
DG/VD TYPE State Access Consist Cache sCC Size Name
-----------------------------------------------------------
0/0 RAID1 Optl RW Yes NRWTD - 278.464 GB
1/1 RAID5 Dgrd RW Yes NRWTD - 1.359 TB
-----------------------------------------------------------
Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|HD=Hidden|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency
//--------------------物理盘-----------------------------
//这部分是重点,更换硬盘主要需要在这部分确定硬盘是否彻底坏掉,若硬盘状态为Failed则可以直接更换硬盘。
Physical Drives = 8
PD LIST :
=======
--------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
--------------------------------------------------------------------------
252:0 12 Onln 0 278.464 GB SAS HDD N N 512B ST9300605SS U
252:1 11 Onln 0 278.464 GB SAS HDD N N 512B ST9300605SS U
252:2 10 Onln 1 278.464 GB SAS HDD N N 512B ST9300605SS U
252:3 9 Failed 1 278.464 GB SAS HDD N N 512B ST9300605SS U //磁盘状态为Failed
252:4 13 Onln 1 278.464 GB SAS HDD N N 512B ST9300605SS U
252:5 14 Onln 1 278.464 GB SAS HDD N N 512B ST9300605SS U
252:6 15 Onln 1 278.464 GB SAS HDD N N 512B ST9300605SS U
252:7 16 Onln 1 278.464 GB SAS HDD N N 512B ST9300605SS U
--------------------------------------------------------------------------
EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded
- 如果上述步骤检测到硬盘状态为Failed状态,则跳过2、3步骤;如果由于坏道等原因导致硬盘亮故障灯但状态显示为online,则要改变故障盘的状态,处于offline状态
storcli64.exe /c0/e62/s0 set offline
查看一下,现在该盘的状态
- 让该盘处于missing状态,我们便可将该盘拔下。.
storcli64.exe /c0/e62/s0 set missing
状态
- 当我们换上新的硬盘以后,该raid组会自动进行数据重建,该硬盘组指示灯会频繁闪烁,黄灯闪烁。正在重建中
- 查看重建过程进度
storcli64.exe /c0/e62/s0 show rebuild
- 注: 如果,系统不能自动进行重建过程,我们要手动进行。
storcli64 .exe/c0/e62/s0 set start rebuild
- 注: 如果,系统不能自动进行重建过程,我们要手动进行。
MSM更换硬盘
- 安装好MSM,打开软件,进入到 Configure Host 页面,添加服务器的ip
- 通过扫描,我们可以发现两个我们已经配置好server raid的服务器
- 通过输入登录用户名,及密码。我们会登录到相应服务器上,下图是仪表板界面(仪表盘,顾名思义就是一个信息的概述显示)
- 通过输入登录用户名,及密码。我们会登录到相应服务器上,下图是仪表板界面(仪表盘,顾名思义就是一个信息的概述显示)
- 物理盘的管理页面,在这个页面我们可以看到磁盘的信息
- 下面是逻辑盘的管理页面,在这里我们可以看到我们raid配置情况,逻辑磁盘的健康情况
- 如果某一块硬盘出现了问题,我们要先停止这一块盘,让其处于offline状态,然后可以拔去坏盘插入新盘
- 新盘插上以后,会开始同步数据,
切记不要直接online ,直接online磁盘的状态显示正常但是数据并没有同步过去。硬盘更换完毕告警消失。
FAQ's
Q1:
- 问题描述:
IBM x3850 X6g更换硬盘后,RAID卡配置界面显示状态正常,系统中使用storcli工具检测状态正常,硬盘状态灯正常,但是前面板故障灯还是常亮,同时IMM管理口显示RAID降级 - 问题处理:
- IMM口查看RAID信息
- 再次更换硬盘,问题还是没有解决,排除硬盘问题
- storcli和RAID配置界面中显示正常,IMM有报错,怀疑IMM固件问题,先升级IMM固件到最新,重启IMM,之后重启系统,服务器告警灯消除,IMM口RAID显示正常,问题解决。
注意事项:升级完成imm微码,重启imm过程在3~5分钟,我遇到了重启imm 3分钟后可以登录web控制台,但登录后又自动跳转到登录账号的界面,持续三小时测试后下班了,第二天登录正常。
- IMM口查看RAID信息
《LSI RAID卡更换硬盘实践操作》文章由 执笔写快乐 发布在行动派博客,未经授权禁止转载。