LSI RAID卡更换硬盘实践操作

LSI RAID

目前LSI RAID卡使用的配置工具主要有:

  • 图形环境:Megaraid Storage Manager(MSM)
  • 字符界面:MegaCLI、StorCLI。其中StorCLI整合了LSI和原来3ware的产品支持,相对MegaCLI命令更加简洁,并且兼容MegaCLI的命令,估计两者已经整合了(有待确认)。

storcli更换硬盘

storcli已经基本代替了megacli,

  1. 检查一下当前物理盘的状态,命令storcli64.exe /c0 show all
Microsoft Windows [版本 10.0.14393]
(c) 2016 Microsoft Corporation。保留所有权利。

C:\Users\Administrator>cd C:\                  //storcli工具放置在C盘根目录

C:\>storcli64.exe /c0 show all                  //查看RAID控制器0的所有信息
Generating detailed summary of the adapter, it may take a while to complete.

Controller = 0
Status = Success
Description = None

Basics :
======
Controller = 0
Model = ServeRAID M5015 SAS/SATA Controller           //RAID控制器型号
Serial Number = SV21011556                                         //RAID控制器SN号
Current Controller Date/Time = 07/28/2020, 14:19:45
Current System Date/time = 07/28/2020, 14:21:05
SAS Address = 500605b004849a50
PCI Address = 00:01:00:00
Mfg Date = 03/07/12
Rework Date = 00/00/00
Revision No = 79B

Version :                                                        //RAID控制器版本信息
=======
Firmware Package Build = 12.12.0-0085
Firmware Version = 2.120.223-1467
Bios Version = 3.24.00_4.12.05.00_0x05100000
Preboot CLI Version = 04.04-019:#%00008
WebBIOS Version = 6.0-46-e_42-Rel
NVDATA Version = 2.09.03-0027
Boot Block Version = 2.02.00.00-0000
Bootloader Version = 09.250.01.219
Driver Name = megasas2.sys
Driver Version = 6.706.06.00

//其他部分这里不介绍,省略。。。
//--------------------虚拟/逻辑盘------------------------
Virtual Drives = 2

VD LIST :
=======

-----------------------------------------------------------
DG/VD TYPE  State Access Consist Cache sCC       Size Name
-----------------------------------------------------------
0/0   RAID1 Optl  RW     Yes     NRWTD -   278.464 GB
1/1   RAID5 Dgrd  RW     Yes     NRWTD -     1.359 TB
-----------------------------------------------------------

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|HD=Hidden|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency

//--------------------物理盘-----------------------------
//这部分是重点,更换硬盘主要需要在这部分确定硬盘是否彻底坏掉,若硬盘状态为Failed则可以直接更换硬盘。
Physical Drives = 8

PD LIST :
=======

--------------------------------------------------------------------------
EID:Slt DID State  DG       Size Intf Med SED PI SeSz Model            Sp
--------------------------------------------------------------------------
252:0    12 Onln    0 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:1    11 Onln    0 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:2    10 Onln    1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:3     9 Failed  1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U             //磁盘状态为Failed
252:4    13 Onln    1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:5    14 Onln    1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:6    15 Onln    1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
252:7    16 Onln    1 278.464 GB SAS  HDD N   N  512B ST9300605SS      U
--------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded
  1. 如果上述步骤检测到硬盘状态为Failed状态,则跳过2、3步骤;如果由于坏道等原因导致硬盘亮故障灯但状态显示为online,则要改变故障盘的状态,处于offline状态
    storcli64.exe /c0/e62/s0 set offline
    enter description here
    查看一下,现在该盘的状态
    enter description here
  2. 让该盘处于missing状态,我们便可将该盘拔下。.
    storcli64.exe /c0/e62/s0 set missing
    enter description here
    状态
    enter description here
  3. 当我们换上新的硬盘以后,该raid组会自动进行数据重建,该硬盘组指示灯会频繁闪烁,黄灯闪烁。正在重建中
  4. 查看重建过程进度
    storcli64.exe /c0/e62/s0 show rebuild
    enter description here

    • 注: 如果,系统不能自动进行重建过程,我们要手动进行。
      storcli64 .exe/c0/e62/s0 set start rebuild

MSM更换硬盘

  1. 安装好MSM,打开软件,进入到 Configure Host 页面,添加服务器的ip
    enter description here
  2. 通过扫描,我们可以发现两个我们已经配置好server raid的服务器
    enter description here

    1. 通过输入登录用户名,及密码。我们会登录到相应服务器上,下图是仪表板界面(仪表盘,顾名思义就是一个信息的概述显示)
      enter description here
  3. 物理盘的管理页面,在这个页面我们可以看到磁盘的信息
    enter description here
  4. 下面是逻辑盘的管理页面,在这里我们可以看到我们raid配置情况,逻辑磁盘的健康情况
    enter description here
  5. 如果某一块硬盘出现了问题,我们要先停止这一块盘,让其处于offline状态,然后可以拔去坏盘插入新盘
    enter description here
  6. 新盘插上以后,会开始同步数据,
    enter description here
    切记不要直接online ,直接online磁盘的状态显示正常但是数据并没有同步过去。硬盘更换完毕告警消失。
    enter description here

FAQ's

Q1:

  • 问题描述:
    IBM x3850 X6g更换硬盘后,RAID卡配置界面显示状态正常,系统中使用storcli工具检测状态正常,硬盘状态灯正常,但是前面板故障灯还是常亮,同时IMM管理口显示RAID降级
  • 问题处理:
    1. IMM口查看RAID信息
      X3850x6_storcli_01
    2. 再次更换硬盘,问题还是没有解决,排除硬盘问题
    3. storcli和RAID配置界面中显示正常,IMM有报错,怀疑IMM固件问题,先升级IMM固件到最新,重启IMM,之后重启系统,服务器告警灯消除,IMM口RAID显示正常,问题解决。
      注意事项:升级完成imm微码,重启imm过程在3~5分钟,我遇到了重启imm 3分钟后可以登录web控制台,但登录后又自动跳转到登录账号的界面,持续三小时测试后下班了,第二天登录正常。
      X3850x6_storcli_02
      X3850x6_storcli_03
别把想做的事情,留给遥不可及的未来!
上一篇

Linux下的逻辑卷管理 — LVM

下一篇

使用思科商务系统完成配置清单及估价

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
返回顶部