安装环境:
两台服务器(以下分别称为“server1”和“server2”,一套磁盘整列柜,Oracle数据库软件,ROSE HA软件。)
安装过程:
1、 安装WINDOWS NT 4.0
(1)在安装NT4.0的过程中,必须安装SNMP。
(2)将所有的驱动程序安装好,配置好网络。
(3)安装Services Pack 5
(4)在两台NT服务器的磁盘管理器中查看磁盘柜中将要安装数据库的卷的盘符是否相同,该盘符必须相同。
或者安装WINDOWS 2000
(1) 安装Win 2000 Server or Advance Server,(打Services Pack 2)
(2) 配置网络,每台Server需要两个网卡(一个用作private net heartbeat线;另一个用作与公网连接)
(3) 在两台Server上的磁盘管理中查看磁盘柜中将要安装数据库的卷的盘符是否相同,该盘符必须相同。
2、 安装Oracle数据库
(1)将ORACLE 软件安装在server1 、server2本地磁盘 ;不创建数据库。
(2)关闭server2,在server1上创建ORACAL数据库,创建完毕,在控制面板的服务中把ORACLE的服务停止并设置成手工启动方式。
(3)关闭server1,将盘柜上的ORACLE数据库文件夹重命名,在server2上创建相同的ORACLE数据库。(也可不在server2上创建数据库,利用命令生成服务)。
(4)安装完毕后分别测试数据库在两台主机上是否能正常使用。
(5)编辑server1 、server2上的listener.ora,sqlnet.ora文件,把Server名为本机主机名的都要改为虚拟的IP地址。保存退出。
(6)一切准备好后打开两台服务器。进行以下步骤。
3、 安装配置ROSE HA软件
(一) 硬件安装
用ROSE软件所带的RS232串口线将服务器1和服务器2的COM1口连接起来
注:建议使用两根心跳线,如果要通过网卡建立第二根心跳线,可用以下方法连接。
1.用一根网线直接连接两台服务器上的网卡。
2.通过HUB/swich连接两台服务器上的网卡。
如果服务器上只有一个网卡,那就需要在网卡上多绑定一个IP地址用于心跳线的连接。
(二) 软件安装
进入光盘上软件所在的目录,运行SETUP程序,按照默认方式安装,当出现提示输入LOCAL和REMOTE的主机名时,将本地服务器的主机名输入LOCAL栏里,将另一台服务器的主机名输入REMOTE栏里,并按提示输入登陆用户的密码。其他都按照默认方式安装。
(三) 建立Cluster资源
(1) 启动Cluster Administration Tool,在Tools菜单中,添加License后选择启动按钮 (按钮为绿色)。
(2) 在Private Net 菜单中,添加RS –232线,选择COM1口进行连接,传输率为缺省值-9600。再添加TCP/IP Socket做心跳线,选择相应的IP地址连接。连接成功后会在Private Net Administration界面下看到两台主机间的两根心跳线都变为绿色。(注:心跳线的设置必须在两台服务器上都进行设置,其它的资源则只需在一台服务器上设置即可。)
(3) 点击Resource Objects按钮 进入Resource Administration界面。在Resource菜单中的Create子菜单中选择Volume,在Share Volume栏中,选择磁盘柜中Oracle 数据库文件所在的盘符,选择Create按钮,建立成功后点击Close退出。在Resource Administration 界面中,选中Volume,使其高亮,然后点击Bring In 按钮。Bring In成功后主机方的资源显示为亮色(如: ),而备机方的资源显示为绿色(如: )。
(4) 用同上的方法选择建立IP资源,在Active IP Address栏中输入虚拟的IP地址。如有多个网卡,在NIC栏中选择准备在双机上使用的网卡,在Original IP Address栏中选择本机所需绑定的IP地址,然后点击Add按钮。再在Server栏里选中远端服务器,同样选中网卡和IP地址,点击Add按钮。添加完毕后点击Create按钮,建立成功后点击Close退出。在Resource Administration 界面中,选择IP,使其高亮,然后按照(3)的方法将其Bring In。
(5) 建立Alias Name资源,在Computer Alias Name栏中输入虚拟的共享主机名。点击create按钮,退出。在Resource Administration 界面中,选择Alias,使其高亮,然后按照(3)的方法将其Bring In。
(6) 建立File Share资源,在File Share栏中选中数据库文件所在的共享磁盘柜卷,将Available Objects栏中的Volume, IP,Alias项都添加到Pre-requisite Objects栏中,然后选择Create按钮,退出。在Resource Administration 界面中,选择File Share,使其高亮,然后按照(3)的方法将其Bring In。
(注:以下服务配置以Oracle 8.0.5为例)
(7) 建立NT Services资源,在列表中选择OracleServiceORCL到NT Service栏中,再把Object Name栏中的内容改为OracleServiceORCL。将Available Objects栏中的File Share项添加到Pre-requisite Objects栏中,选择Create按钮,退出。在Resource Administration 界面中,选择OracleServiceORCL使其高亮,然后按照(3)的方法将其Bring In。
(8) 建立NT Services资源,在列表中选择OracleTNSListener80到NT Service栏中,再把Object Name栏中的内容改为OracleTNSListener80。将Available Objects栏中的File Share项添加到Pre-requisite Objects栏中,选择Create按钮,退出。在Resource Administration 界面中,选择OracleTNSListener80使其高亮,然后按照(3)的方法将其Bring In。
(9) 可以在Options菜单中,选中/取消Automatic Start Cluster选项,该选项决定在WINDOWS NT启动时是否启动ROSE HA。
四、 功能简单介绍
:用于服务器之间的手工切换。
: 将点中的资源Bring Out。
: 停止Cluster服务。(按钮为红色)
: 切换到Private Net Administration界面。
:切换单项资源。
: 删除点中的资源
: 查看点中的资源的内容
五、 测试步骤
1. 正常手工切换。
2. 主机正常关机,服务切换到备机上。
3. 拔掉主机端的网线,服务切换到备机上。(注:所用网卡必须为支持拔网线功能,如:3COM,INTEL的网卡。
4. 拔掉心跳线。(正常现象:心跳线变红并且两边都不能再进行切换。)
5. 进行非正常关机。(正常现象:所有服务都切换到备机上。)
六、 常见问题及解决方法
ROSE HA常见问题及解决办法
1. 两台Host上的双机软件均已启动,而双机两边的资源都处于虚状态怎么办?
在安排为主机的Host上将资源一一点中,使资源处于高亮状态,点击工具栏上的bring in按钮。
2. 安装ROSE HA软件时,Windows NT 的Service Pack应为什么?
用Service Pack4,Service Pack5或以上。
3. 在安装ROSE HA 3108试用版时,启动时提示“The license is invalid”,无法启动双机服务,该情况如何解决。
进入主菜单的Tool子菜单的License项,点击“确定”即可。
4. 当工具栏的“takeover”,“failover”, “bring in”, “bring out”等快捷按钮均为不可用。主备机的状态保持不变,提示“the public net is functioning, but all instances of private net are down or unavailable.”。
如果在“private net”界面下心跳线变为红色,检查心跳线或更换心跳线。
5. 停止双机服务后,先启动停机之前处于备机状态的Host,后启动停机之前处于主机状态的Host,先启动的Host成为主机,但后启动的Host一边显示心跳线不通,且资源无法bring in。
检查心跳线的IP,如果不在同一网段,改为同一网段问题即可解决。
6. 停止双机服务后,先启动停机之前处于备机状态的Host,当服务切换到一半时,启动停机之前处于主机状态的Host会出现什么状况?
双机将自动变回停机以前主备Host的状态,不会出现双机混乱的现象。
7. 当心跳线出错,又出现备机端的IP出错,这时主机显示备机的所有资源出错,备机显示主机Volume出错,Volume失锁,两台Host显示的状态不一致。心跳线和IP恢复正常后,Volume仍然失锁,出现以上情况如何恢复?
在备机状态的Host上执行Takeover, 切换成功后双机恢复正常。
8. 在切换过程中,心跳线出现问题,会发生什么情况?
当发现心跳线出错时,切换会继续正常进行。
9. 在心跳线出现问题时,进行了切换,会发生什么情况?
切换会自动终止,并恢复到切换前的状态。
10. 在切换的过程中,将切换前为备机状态的Host关掉,会发生什么情况?
切换前为主机状态的Host的双机程序无响应,重启被关掉的Host上的双机软件,这时两台Host显示的状态不一致。该Host显示为正常的备机状态,并可以正常接管主机。而此时切换前为主机状态的Host上的所有资源均为bring out。
将切换前为主机状态的Host 重新启动,切换正常进行。
11. 备机状态的Host的IP出现报错,但仍能正常切换,并不影响双机的工作,切换后备机端的IP也会出现报错。以上情况是什么原因?
Active IP与Local IP, Remote IP不在同一网段。
Local IP, Remote IP可以不在同一网段,当Active IP与Local IP, Remote IP中的一个处在同一网段,就不会出现以上情况。
或者当心跳线的IP与Active IP与Local IP, Remote IP在同一网段时。也会出现该
问题。将其中的一对IP的网段改变即可
12. 没有选择Auto-Switch Back开关时,关机后先启关机前为备机状态的Host,后启关机前为主机状态的Host。会出现什么情况?
先启的Host成为主机,后启的Host成为备机。
13. 两台Host均是在本地机上启动ROSE HA双机,启动双机时无法启动,并出现报错“Fail to get remote Server’s IP address from the registry”。以上情况如何处理?
以上情况是由于两台服务器上的Administrator的密码不相同而造成的,将两台服务器的Administrator密码改为一样,重新登录即可。
14. 双机手工切换时无法切换,软件报错信息如下:
“999. [System Error] 拒绝访问 (0x5)
423. Lock Volume < E: >: Fail ”(注: E: 为公共磁盘卷)
该现象是什么原因造成的?(设数据库文件安装在公共磁盘E盘上)
以上现象发生后,检查是否打开了察看E盘的窗口,或者正在使用磁盘管理器。关掉窗口或磁盘管理器后即可正常切换。
15. 安装完毕后,进入控制界面,点击开始,显示“Cluster doesn’t start”,服务无法启动,以上情况如何解决。
进入“服务”,启动cluster service,得到提示登录时错误,然后双击该服务,点击“确定”,即可。
16. 3108出现以下情况,备机端显示主机端的Volume出现报错,将Volume切换至备机端,其余资源仍为原来的状态,而主机端的情况一切正常,没有变化,这时Volume失锁,两台Host皆可访问该Volume.
这时应该先将备机端的cluster停掉(即down机),然后将主机端的cluster也停掉,当数据库程序停掉以后,检查数据库没有问题,再重新启动双机,即可。(注意:应先将数据库的所有文件拷贝一份,作为备份恢复用。)
其它重要的注意事项:
1. 在安装双机软件以后,Oracle数据库的服务的启/停都应该通过双机软件的Bring In(启动服务)和Bring Out(停止服务)功能来实现,不要使用Oracle 自带的工具软件来进行。
2. 心跳线的IP和公网IP最好设置在不同的网段。