存储结点异常问题及故障处理

当前数据中心已经成为热门,在数据中心中数据的存储是个重要部分,而存储设备是用来存储数据的。相信大家在玩存储设备的时候都会遇到各种问题,没错我自己在玩存储时也是同样的,今后我会把我在测试过程中遇到的各种存储问题和解决方法共享出来,如果大家觉得有什么不对的地方可以指出来,相互学习。
今天共享的问题如下:
1. 异常现象
通过console登录异常的机头,提示如下信息:
2011年11月15日 16:51:58Waiting for giveback...(Press Ctrl-C to abort wait)
2011年11月15日 16:52:04Waiting for giveback...(Press Ctrl-C to abort wait)
2011年11月15日 16:52:04This node was previously declared dead.
2011年11月15日 16:52:04Pausing to check HA partner status ...
2011年11月15日 16:52:14partner is operational and in takeover mode.
2011年11月15日 16:52:14
2011年11月15日 16:52:14You must initiate a giveback or shutdown on the HA
2011年11月15日 16:52:14partner in order to bring this node online.
2011年11月15日 16:52:14
2011年11月15日 16:52:14
2011年11月15日 16:52:14The HA partner is currently operational and in takeover mode.This node cannot continue unless you initiate a giveback on the partner.
2011年11月15日 16:52:14Once this is done this node will reboot automatically.
2011年11月15日 16:52:14
2011年11月15日 16:52:14waiting for giveback...
2011年11月15日 16:52:14
2011年11月15日 16:52:33Do you wish to halt this node rather than wait [y/n]? yesH
2011年11月15日 16:52:33alting...
2011年11月15日 16:52:33Uptime: 39m10s
2011年11月15日 16:52:33System halting...
2011年11月15日 16:52:53
2011年11月15日 16:52:53Phoenix TrustedCore(tm) Server
2011年11月15日 16:52:53Copyright 1985-2006 Phoenix Technologies Ltd.
2011年11月15日 16:52:53All Rights Reserved
2011年11月15日 16:52:53BIOS version: 5.1.0
2011年11月15日 16:52:53Portions Copyright (c) 2007-2009 NetApp, Inc. All Rights Reserved
2011年11月15日 16:52:53
2011年11月15日 16:52:53CPU = 1 Processors Detected, Cores per Processor = 2
2011年11月15日 16:52:53Intel(R) Xeon(R) CPU           E5220  @ 2.33GHz
2011年11月15日 16:52:58Testing RAM
2011年11月15日 16:52:58512MB RAM tested
2011年11月15日 16:52:585120MB RAM installed
2011年11月15日 16:52:586144 KB L2 Cache
2011年11月15日 16:52:59System BIOS shadowed
2011年11月15日 16:52:59USB 2.0: MICRON eUSB DISK
2011年11月15日 16:53:09BIOS is scanning PCI Option ROMs, this will take few seconds...
2011年11月15日 16:53:09 +++++++++++++++++++
2011年11月15日 16:53:09
2011年11月15日 16:53:10
2011年11月15日 16:53:10Boot Loader version 3.0
2011年11月15日 16:53:10Copyright (C) 2000-2003 Broadcom Corporation.
2011年11月15日 16:53:10Portions Copyright (C) 2002-2008 NetApp
2011年11月15日 16:53:10
2011年11月15日 16:53:12CPU Type: Intel(R) Xeon(R) CPU           E5220  @ 2.33GHz
2011年11月15日 16:54:28LOADER-A> help
2. 故障原因
netapp存储192.168.31.197机头异常断电或重启,导致机头的主控制切换至192.168.31.198的机头,当192.168.31.197的机头起来后,由于系统异常无法自动切为主机头,便一直停滞重试,不能正常启动
3. 解决方法
telnet 192.168.31.198查看状态如下:
2011年11月16日 14:21:13Data ONTAP (Fas3210B.ruijie.com.cn)
2011年11月16日 14:21:15login: root
2011年11月16日 14:21:17Password:
2011年11月16日 14:21:17Fas3210B(takeover)> Wed Nov 16 14:19:41 CST [Fas3210B (takeover): console_login_mgr:info]: root logged in from console
2011年11月16日 14:21:18
2011年11月16日 14:21:18Fas3210B(takeover)>
2011年11月16日 14:21:18Fas3210B(takeover)>
2011年11月16日 14:21:19Fas3210B(takeover)>
2011年11月16日 14:21:19Fas3210B(takeover)>
登入后可以看到在198的机头上有一个takeover标识,说明198是处于接管模式。执行cf giveback 命令将服务切换回原节点197机头。这样就正常了。

weinxin
DC Farm小程序二维码
扫一扫添加博客小程序
Jim

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: