请教下,在AIX6.1平台上,网络心跳用交叉线直连和交换机连接有什么区别
如果rac心跳网络采用直连方式,那么当一台服务器上面的心跳网卡掉线或者断电,就很可能会导致另一个节点宕机。而且如果增加集群节点,那么直连会十分麻烦。如果使用交换机连接,则不会有这种风险,同时交换机还可以实现端口冗余绑定,提高了可用性。建议心跳网络连接交换机的端口划分到一个独立的VALN。
评论
有用 0建议使用交换机进行连接。因为直连在一定的条件下,可能会造成私网不同,造成集群无法正常启动或者产生脑裂。
曾经遇到过一个案例:客户就是通过直连的方式,将两台服务器的心跳网卡连接在一起。同时,为了防止由于单网卡引起的单点故障,故对网卡进行了绑定,但是两张网卡绑定的模式是主备模式。
后来其中一台服务器重启(或者说原网卡异常),原本的心跳网卡切换到了另外一张网卡上,而另一台服务器心跳网卡并没有切换,导致直连的两张私网网卡之间从物理上没了通信(逻辑上可以看到两个服务的私网IP都在,但是两个IP就是无法ping通)。最后导致数据库其中一个节点的集群无法正常启动。
这就是最大的风险。当然,如果直连不用网卡bond,则可以避免此问题
评论
有用 0关于oracle RAC心跳线的连接方式,各个论坛,包括网上文章的说法是:官方说是不建议直连,建议采用交换机连接的方式!
首先说说心跳线的作用:
oracle RAC不得不提的概念:健忘 和 脑裂
健忘=》OCR
脑裂=》VOTE
下面谈谈直连的方式:
在oracle9i rac的时侯采用直连的要比走交换机的要多。
走交换机的优点是如果其中rac其中的一台掉电
此时好的那台的网卡还是有信号的
这样oracle会很容易的取舍,不会影响到好的节点
其实直连也只是在掉电这样的情况下才会让oracle有些迷惑
这种情况下是否会影响好的结点我没测过,条件允许你可以测一下。
一般情况不会有问题,如有硬件这样计划停机的情况,可以手动的把相应结点的crs等服务停掉,这样也不会有什么影响
总之,条件充许最好走交换机,最好配置etherchannel 或是apa这样的网卡绑定
直连的方式在实际使用中也只是有一点小问题,用也没事。
如果心跳网络断掉了,oracle的集群就会分裂成若干个小的自己群,我们叫cohort(你可以在ocssd.log)里面找到。
oracle会根据每个cohort包含的节点数量决定哪个子集群离开,基本的原则是:
- 节点数多的子集群留下,节点数少的被驱逐。
- 如果每个子集群的节点数相同,那么包含了最小节点编号的节点会被保留。
这就是为什么你看到两个节点的集群,如果心跳网络出现问题,一定是节点2被重启的原因。
另外:
节点的驱逐和VF(就是很多人说的voting disk)没关系。
主要的原因是很多人把数据库层面的实例驱逐和集群层面的界定啊驱逐概念搞混了。
所以才有了这种错误的认识。
如果是数据库实例层面的驱逐,的确是和控制文件相关的,因为在数据库层面控制文件起到了VF的作用
评论
有用 0
墨值悬赏

